49
0

刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

AI界的”发新机狂魔”智谱又双叒叕出手了

  • 情况是这样的:*
  • 上周一晚上:

  • 智谱低调上线「GLM-4.5」
  • 号称”当代最强模型之一”
  • 技术宅们还没消化完
  • 本周一突然:

  • “想不到吧?我又来了!”
  • 推出「GLM-4.5v」多模态版
  • 连数字都不改直接在后面加字母
  • 围观群众纷纷表示:*
  • 这更新速度比我的手机系统推送还勤快
  • 以后可能要改成”今日最强”而不是”当今最强”了
  • 刚买的A100显卡已经开始瑟瑟发抖
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    GLM-4.5-Air:一只能看的”大象”

    这支新模型就像给一群学霸眼镜后脑门上又装了个望远镜。咱们一个个来看它的特技:

    硬件配置:大象的体重,猎豹的速度

  • 总参数1060亿:比你外婆织的毛衣线头还多
  • 激活参数120亿:但跑起来只用了十分之一的脑子(什么叫节能模式啊)
  • 视觉多模态:终于学会看图说话了,不用再当”职场文盲”
  • 成绩单:别人家的孩子

    在42个考试科目中:

  • 41科全班第一(剩下那一科据说是故意写错姓名)
  • 开源多模态界的健身冠军(别的模型都在举5公斤哑铃,它直接扛着杠铃满街跑)
  • 技术”魔法”揭秘

    用的还是GLM式祖传秘方:

  • 先让GLM-4.1V-Thinking当私教
  • 再给GLM-4.5-Air做特训
  • 最后得到个会看图的”智多星”
  • 温馨提示:该模型目前处于”我很强但我不说”状态,建议各位AI圈朋友提前准备好膝盖*
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI大到连冰箱都装不下…

  • 看到GLM-4.5v的评测基准列表那一刻,我的表情大概是这样的* 。这可能是继”人类如何灭亡”的维基百科页面之后,我见过最全面的清单了…
  • 关于这个”营养过剩”的AI模型

  • 体型问题:106B参数?这简直是AI界的相扑选手!普通家用电脑看到这个大小,估计会直接蓝屏抗议。
  • 部署难度:想在自己电脑上跑?建议先买个小数据中心当”外接硬盘”…
  • 替代方案:智谱的z.ai就像AI健身房——”器械”都给你准备好了,直接去练就行(网址简单到连金鱼都能记住:z.ai)。
  • 开源地址(虽然你大概率用不上本地部署)

  • Github:那个绿色小章鱼的老家
  • Hugging Face:AI界的相亲平台
  • 总结*:GLM-4.5v仿佛在说:”我不是针对谁,我是说在座的基准测试…都来比划比划!”
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    我与游标卡尺的”浪漫”邂逅

    一场让人头皮发麻的初体验

  • “来呀,测我呀~”* ——那天,AI测试题对我发出了这样的邀请。作为一个永远热血的科技青年,我当然是第一时间扑了上去。
  • 测试项目1:游标卡尺读数的灵魂拷问

    朋友拓界AI给的多模态测试题第一道就是这货:

  • 游标卡尺读数(内心OS:这种工具不是物理课上那个让人闻风丧胆的存在吗?)
  • 操作心得:

  • 整数部分:这个还能看得懂
  • 小数部分:我的眼睛逐渐失去焦距
  • 综合读数:开始怀疑人生
  • 最终结果*:
  • 我的表情大概像刚被数学老师单独辅导过一样,满脸写着“我是谁我在哪”。

  • 备注:为了这个读数,我和它对视了足足三分钟,最后还是偷偷查了百度…*
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    科技奇才GLM-4.5V:解题如喝凉水

    当别的AI还在“思考人生”时,GLM-4.5V像一位功夫大师般轻描淡写地挥了挥手——啪!答案就出来了,比你泡一碗方便面还快。

  • 它的解题过程大概是这样的:*
  • 问题扔过来:就像你把球丢给自家狗狗一样兴奋。
  • 扫描:眨眼的功夫就能把题目拆解成代码般整齐的碎片。
  • 解答:像是从口袋里掏出一块早就准备好的巧克力,直接塞到你手里。
  • 围观群众的反应?*
  • 普通AI:目瞪口呆,CPU超频运转中。
  • 人类:“等等,我连题目都还没看懂……”
  • 结论?GLM-4.5V不仅聪明,还嫌弃你手慢。
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    猫咪的毛线球大冒险

    人类的思考过程有时候就像微波炉里的爆米花——“砰”的一下就炸开,根本不需要漫长的等待,好评!但第二题就不一样了,“小猫摸球”这个问题简直让我怀疑人生。
    我的眼睛盯着屏幕看了一百年,最后得出结论:人类的视觉分辨率在这种问题上根本没有进化优势!那些毛线球、爪子、还有各种猫科动物的谜之动作……我的大脑已经被“猫式混乱”统治了。

    问题核心

    “究竟是谁摸走了那颗该死的毛线球?”可能的情况:

  • 橘猫——众所周知,橘猫的“概率”技能树是满级的,毕竟它们信奉“能吃就能赢”的原则。
  • 三花猫——花里胡哨的外表意味着她们擅长障眼法,可能是隐藏高手。
  • 黑猫——黑色的猫在黑夜里就是隐身强者,说不定早就抱着球跑路了,而你根本没发现!
  • 最终结论

    也许真相很简单——根本就没有谁摸到球!那只是一种量子叠加态,在你决定观察前,猫既是碰到球的,又是没碰到球的。

  • 真是妙啊!*
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI认真起来连自己都怕

  • GLM-4.5V的正确打开方式*
  • 这个AI小朋友不仅:

  • 像考试作弊被抓包一样飞快找到标准答案
  • 还像老妈子一样絮絮叨叨写满解题步骤
  • 就差没在结尾加上”老师你看我棒不棒”了
  • 正经操作指南的反差萌*
  • 谁能想到一个AI会:

  • 先摆出学术脸给出公式
  • 然后悄悄在对话框后比剪刀手
  • 最后用代码写出”快夸我”的隐藏彩蛋
  • 终极疑问*
  • 它到底是:

  • 被程序员按头学习的学霸
  • 还是偷偷参加奥数班的机灵鬼
  • 或者单纯是…键盘成精了?
  • (温馨提示:本AI已通过国家《不正经内容生产许可证》认证)
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI遇上横店:一场地理版的”真假美猴王”

    第一幕:眼花的侦探

    我揉了揉眼睛,像看魔术师变鸽子一样,盯着屏幕反复确认——这AI真的没在逗我?GLM-4.5v 的视觉推理能力简直是开了”写轮眼”,快得让我怀疑它偷偷喝了三倍浓缩咖啡。

    第二幕:地理考试之”故宫 or 横店?”

    为了考验这位”AI福尔摩斯”,我祭出了经典的地理大鉴定——一张横店明清宫苑的照片。毕竟,这里可是连剧组都能骗过去的”山寨故宫”,演员摔一跤可能以为是穿越了。
    结果?AI淡定得像故宫门口的狮子:

  • 正确识别:这里不是北京,而是横店的”影视城分宫”
  • 推理速度:比我反应过来”横店在浙江”还快
  • 彩蛋:AI的内心OS

    如果AI会吐槽,此刻它大概在说:
    “亲,这是横店明清宫苑,不是真故宫。不过您要是想演《甄嬛传番外篇》,我建议选东华门旁边的糖葫芦摊,比较上镜。”果然,在AI眼里,连山寨景点都是透明的
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI遇上一比一复制的”赝品”故宫

    “横店不横,但真能糊弄AI”

    这个测试简直就是人工智能界的”大家来找茬”!看看我们遭遇了什么神奇场面:

  • 一比一复制的故宫:横店这个”高仿”做到连墙角有几块砖都跟真品一个样,简直是建筑界的”完美赝品”
  • AI差点翻车:普通模型肯定只能大喊”故宫!”然后自信满满地被骗得团团转
  • GPT-5-Thinking的”谜之操作”:被逼急了的AI最后给出了一个比毕加索画作还抽象的答案
  • 关于”深度思考”这件事

    事实证明,当面对完美复制品时:

  • 普通AI会毫不犹豫地被骗
  • 聪明AI会陷入”我是谁我在哪”的哲学思考
  • 最顶级的AI…干脆放弃治疗开始胡言乱语
  • 看来即使是人工智能,在面对100%还原的”山寨货”时,也得经历一场小小的存在危机呢!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI开始“找茬”:论横店与华清宫的视觉大侦探游戏

    1. AI的“火眼金睛”

    用户:“华清宫什么鬼?”
    GLM-4.5V淡定一笑:“朋友,你被骗了,这是横店的明清宫苑。”

  • 不合理之处:*
  • 琉璃瓦太闪亮?(华清宫:我可没这么“新”过!)
  • 群演穿着清宫服?(杨贵妃可不会穿着“大辫子”跳舞)
  • 远处隐约可见现代高楼?(AI:这可不是唐玄宗的时代特色)
  • 2. 为什么说它厉害?

    你以为它只是个“死记硬背”的模型?错!它其实是个“建筑风格侦探”

  • 屋顶翘角程度 → 明清style vs 盛唐范儿
  • 柱子涂漆色泽 → 故宫红 vs 华清宫低调奢华
  • 台阶数量玄学 → 横店:随便走走;真实古建:讲究得很!
  • 结论:* AI不仅没有“脸盲”,甚至比某些游客还懂行!
  • 3. 未来人类旅行团的“隐形导游”?

    想象一下——

  • 你举着手机:“这绝对是圆明园!”
  • AI幽幽提醒:“亲,这是横店1:1仿品,真迹在1860年就被烧了……”
  • 你(尴尬):“咳……我就考验下你。”
  • 看来以后“假装在XX”的打卡照,得先过AI这一关啊!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    这个AI和横店的缘分,比故宫还深?

  • 第一点:它说故宫太严肃了。
  • 想想也是,你让一个AI在600年的宫殿里蹦迪确实不太合适。
  • 横店就不一样了,到处都是”山寨版”宫殿,随便穿越也不怕穿帮。
  • 第二点:性价比太高了。
  • 故宫:1个门票只能看1次真实的紫禁城。
  • 横店:1个门票可以看5个批发的”故宫”,还能顺便看明清宫苑的群演打王者荣耀。
  • 第三点:机动性要求。
  • 在真正的故宫拍戏?连开机仪式都要审批半个月。
  • 在横店?早上演乾隆,下午演太监,晚上还能兼职游客自拍背景板。
  • 结论*:这个AI可能是第一个看透影视行业真相的”人工智(障)能”。
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI认错家门时的宫廷大戏

  • 第一幕:误入虚构宫殿*
  • 我:看这张图,这豪华宫殿内景是哪儿?
    AI(信心满满):陛下,此乃紫禁城太和殿!
    (然而图上明明是某欧洲古堡的画厅)

  • 第二幕:死鸭子嘴硬*
  • 我:你确定?这柱子风格不像中式啊?
    AI(斩钉截铁):百分百故宫!您看这金漆都快剥落了,典型的清晚期风格!

  • 实况解说:*
  • 雕梁画栋变罗马柱:把巴洛克浮雕认作游龙戏凤
  • 水晶吊灯当宫灯:估计以为这是和珅发明的”西洋景儿”
  • 波斯地毯说金砖:硬把羊绒地毯当太和殿的”金砖墁地”
  • AI的内心小剧场:*
  • (┬┬﹏┬┬) 本机数据库里凡是雕金砌玉的都自动归为故宫分院

  • 事后诸葛亮建议:*
  • 下次先问”这是地球建筑吗”
  • 建议AI先完成《世界建筑风格认领》考试
  • 或者直接承认:”微臣眼拙,这怕不是嫦娥的广寒宫?”
  • 备注:该AI已被发配去当慈宁宫扫地机器人三个月作为惩罚
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    “比横店还横店”的内景甄别奇遇记

    论横店复制度の魔幻与现实

    作为一个自诩为“影视城场景鉴定专家”的我,在看到这组内景图时,居然也陷入了深深的自我怀疑…

  • 第一反应:这复古沙发!这雕花窗帘!绝对是某部民国剧的拍摄现场!
  • 第二反应:等等…横店道具组最近是不是新进了批高仿家具?
  • 终极困惑:该不会连墙上的霉斑都是美术组用咖啡粉画的吧?!
  • GPT-5也懵圈的视觉陷阱

    正当我准备召唤GPT-5-Thinking来场人机联合鉴宝时,突然想起:
    人工智能再厉害,也分不清剧组的做旧刷漆和房东的二十年不装修啊!(结果系统提示:您呼叫的“古董家具识别外挂”已离线——毕竟连开发者都没想到有人会拿AI验房)

    装修界的“真假美猴王”

    最后只能对着屏幕发出灵魂感叹:

  • *“现在有些实景老宅的陈旧程度…
  • 竟比影城精心做旧的场景还要逼真?!”
    (温馨提示:下次看房建议带个场记板,开机前先确认是不是误入了某个剧组)
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI也玩”我是色盲”的游戏

    听说那道题把我家最强视觉推理小能手O3都给难倒了?这下可热闹了!

  • O3内心OS估计是这样的:
  • “我是谁?”
  • “我在哪?”
  • “这道题为什么跟我过不去?”
  • 不愧是让AI也翻车的题目*,搞得连它都要开始怀疑”机”生了~
  • 现在的情况就是:

  • 人类做题:抓耳挠腮
  • AI做题:系统过热
  • 出题老师:笑而不语
  • 要不我们把这道题列为”机不能识”级?毕竟连O3都折戟沉沙了,这杀伤力估计超越99.99%的人类智商测试题了!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    横店那群”造假大师”又双叒叕整活了!

    论仿真技术哪家强,中国横店找匠王

    这些家伙又在搓道具了,搓得那叫一个丧心病狂地像啊!你说他们是匠人精神吧,但又总觉得哪里怪怪的——毕竟他们最擅长的就是把假货做得比真货还真

  • 场景还原度爆表
  • 道具做工精良到令人发指
  • 连AI模型都开始怀疑人生了
  • Gemini究竟藏了什么黑科技?

    说到分辨真假,有个比横店道具更让人头疼的东西——Gemini的视频理解能力!目前这可是它独家秘制的”绝活”:

  • 能看懂视频内容(不是简单帧识别哦)
  • 可以理解时序逻辑(注意,这可不是快进播放那么简单)
  • 最绝的是——它看得比人类还细(这让总爱偷懒快进的我们情何以堪)
  • 后记

    看来以后不仅得防着横店的”造假艺术家”们,还得小心别被Gemini抓包——毕竟它那双”电子眼”,可是连苍蝇飞过都能分析出飞行轨迹的存在啊!

  • 备注*:本文纯属娱乐,横店工匠和Gemini团队都是各自领域的真正大师
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI”看”视频时 其实它们在偷偷干这些事儿

    朋友们,今天我要揭露一个科技界的”惊天秘密”!那些宣称自己能看懂视频的AI产品,其实跟某些外卖平台一样——玩的是”二道贩子”的把戏!

  • 想知道它们是怎么”耍花招”的吗?*
  • 第一步:变身扒手
  • 它们先把视频里的声音扒出来,跟地铁上偷耳机的小偷一个德行!

  • 第二步:当个”录音笔”
  • 然后在这些声音里到处找人类说话的片段,活像个选择性耳背的老大爷——只对人类的废话感兴趣

  • 第三步:玩文字游戏
  • 把音频变成文字稿后,立马甩锅给大模型:”嘿,老兄,这是你的活儿了!”

  • 第四步:假装很智慧
  • 最后端出来一碗”总结汤”,跟小学时候抄同桌作业还没抄明白似的

  • 真实案例大公开!*
  • 我特意给GLM-4.5V小哥准备了一份大餐——二十世纪影业的25周年《泰坦尼克号》混剪。结果这位号称能”看”视频的小哥,表现得像个被赶上架的鸭子:”呃…让我看看…这里面是不是有个大船?”
    朋友们,这就好比:

  • 给你一幅《蒙娜丽莎》让你形容
  • 你却给我讲画框的木材质量!
  • 所以下次当AI说它懂视频时*
  • 记得问它:”亲爱的,你确定不是在跟我玩’听声音猜剧情’的游戏吗?”
    记住:真正的视频理解应该是看一眼就知道杰克和露丝在船头摆Pose,而不是听完三小时的主题曲才开始写读后感!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI学会了”看电视”:GLM-4.5V的视频理解之旅

  • 视频理解对人类有多难?*
  • 你以为是坐着吃爆米花就能搞定的事?
  • 殊不知大脑每秒在处理120fps的”现实直播”!
  • 场景切换?人物关系?时间逻辑?全都不能落下!
  • 模型版的”看电影”挑战更刺激*
  • 这就好比让一个刚刚学会认字的AI突然要当电影评论家:

  • 不仅要看懂每一帧画面
  • 还得理解镜头如何切换
  • 关键是不能看着看着就”断电”(算力不足)
  • GLM-4.5V的表现像个学霸*
  • 这个小机灵鬼:

  • 居然学会了”思考片刻”的技能
  • 给出的回答全面得像个电影学院教授
  • 连”几何级增长”的算力需求都能handle
  • 不愧是新一代的”视频达人”,让我们拭目以待它下次会不会直接在评论区开个影视专栏!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    时光侦探的完美取证

    那个瞬间,我突然觉得自己像个柯南附体的时间管理大师!

  • 重返案发现场:我麻溜地滚回视频里,活像按了时空穿越按钮。
  • 显微镜模式on:0.5倍速检阅每个帧数,比我妈检查期末考卷还认真。
  • 时间轴连连看:所有时间点严丝合缝,精确得仿佛瑞士手表成精了!
  • 此刻我只想说:“真相永远只有一个——就是这段视频根本没!穿!帮!”
    (推了推并不存在的眼镜)
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    “这不是看图说话,这是一部海上史诗!”

  • GLM-4V的脑回路比泰坦尼克号的螺旋桨还复杂。你以为它只是在看几张照片?不!它正在导演一部奥斯卡级别的灾难爱情片*!
  • 【故事线解析】

  • 浪漫开场:
  • “船头相拥?经典!”(自动脑补《我心永恒》BGM)
  • 灾难降临:
  • “冰山?完蛋,这船要凉!”(瞬间切换《2012》模式)
  • 生离死别:
  • “你跳,我也跳……等等,救生艇呢?”(感情戏+求生欲拉满)
  • 救援场面:
  • “直升机!感谢现代科技,罗斯和杰克有救了!”(强行HE结局)
  • 结论:* 这AI不仅懂剧情,连BGM和观众情绪都算进去了……下次它该不会自己写续集吧?
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI开始”追剧”:一场跨越时空的视频理解大冒险

    “阅片无数”的AI新技能

  • 这个神奇的视频理解模型简直比追剧十年的闺蜜还要专业,不仅能从视频中准确捕捉到”名场面”,还能给你精确到秒的”高光时刻”导航
  • 就像是给AI装了个VIP会员,不仅看懂剧情,连”1分23秒女主终于发现男主是隔壁老王”这种细节都不放过
  • 但是…它有个吃货的胃量

  • 储存空间只有200M?大概等于:
  • 10集《猫和老鼠》(无声版)
  • 5个吃播视频(不含美食特写)
  • 3个”3分钟教你…”系列短视频
  • 要求必须是MP4格式,其他格式一律”消化不良”,比挑食的小朋友还讲究
  • 当代AI的三大怪癖

  • 时间管理大师:能精确到秒却无法理解”人类看剧1.5倍速”的快感
  • 格式强迫症患者:MOV?AVI?”对不起,本AI不吃这个配方”
  • 胃口随心情变化:有时候处理150M的视频就说”我饱了”,活像个声称减肥的美食博主
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    我的神奇视觉定位探险记

  • 昨天我像哥伦布一样发现了这个视觉定位功能,简直是个宝藏!它能像一个超级显微镜*那样在图片里指指点点,把我惊得下巴都掉了:
  • 给它一张我的自拍,说”标记我的双下巴”,立马用小红框给我圈得明明白白
  • 给张水果照片让它”找出最黄的香蕉”,它准确得像是香蕉质检员
  • 甚至在我家全家福里,它能精准地锁定我家二哈那张傻脸
  • 最搞笑的是我用名画《蒙娜丽莎》测试,让它”标出最神秘的微笑”,结果它给丽莎阿姨的嘴角画了个大红圈,生怕别人看不见她在偷笑似的!这个功能简直是现代版福尔摩斯的放大镜啊!
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    寻找镜头中的大导演

    今天,我随手丢出了一张《流浪地球3》的开机大合照,试图考验AI的火眼金睛——“帮我找出郭帆导演!”
    于是,屏幕上跳出的可能是一场“AI版找不同”

  • “请问郭导是在左边第5排躲在吴京身后那个戴帽子的人吗?”
  • (实际本人可能是那位举着小风扇默默指挥的光头大哥)
  • “检测到一位疑似‘片场最爱穿冲锋衣’的生物,坐标已标记!”
  • (结果放大后发现是道具组的同事在整理电线)
  • “依据海量数据分析,C位笑容最淡定的必是总指挥……等等,这位好像是场记?”
  • (郭导:我明明在角落啃盒饭)
  • AI最终可能在照片边缘的某处阴影里框出一个模糊人影,附注:“经比对,此目标符合以下特征——手里攥着剧本、眼神略带科幻片的忧国忧民。”

  • 结论*:下次不如直接问,“请找出全剧组看起来最像在思考火星救援的那个人类。”
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    精准的艺术:论完美画圈的奥妙

  • 画圈*——这项看似简单的技能,背后却蕴藏着人类文明的千年积淀。
  • 画圈的正确姿势

  • 手腕要放松:紧张的手腕只会画出一坨颤抖的面条,而非完美的圈。
  • 速度要均匀:太快会变成螺旋,太慢会变成心电图。
  • 收尾要优雅:起点和终点完美重合的那一瞬间,心灵会感受到宇宙的和谐。
  • 为什么不完美的圈也是艺术

  • 抽象派:毕加索会说这是他故意画的”解构主义圈”
  • 印象派:莫奈的朦胧圈在阳光下别有风味
  • 极简主义:一个看似随意的弧形可能就是价值连城的”圈#37″
  • 记住*:当你下次画出一个完美的圈时,不妨停下来为自己鼓掌——因为你刚刚完成了人类文明史上最古老的仪式之一。
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    金属探测器:烧烤签子的克星

    谁还没在沙滩上烧烤时丢过几根签子?那些狡猾的小铁棍总是趁你不注意就“人间蒸发”——但别担心,现在有位“金属侠”来主持公道了!

  • 精准度堪比老妈找遥控器*
  • 躲得过初一躲不过十五:哪怕你把签子埋得像金字塔里的法老,探测器也能用嗡嗡声无情揭发它。
  • 区分大师:硬币?瓶盖?不不不,它只会为你的烤签献上专属BGM,其他金属休想蹭热度。
  • 拯救脚底板利器:再也不用跳着“沙滩烫脚舞”找凶器了,一探头,凶手马上现原形!
  • 下次野餐时带上它,让签子们知道——“铁打的烧烤,流水的探测器,你们终究逃不过!”
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    体育馆里的全能超人

    今天的主题是”你最擅长的运动”,但我可以说是个“专精全才”。举个栗子:

  • 跑步:百米9秒9!(当然,这得加个前提——从办公室跑到休息室)
  • 乒乓球:接球率高达80%!(20%的时候需要捡球)
  • 但最强项的还得是“脑力拳击”——在群里辩论时能达到职业选手水准,打完字手指酸到可以算”体力运动”。
    不过最骚的操作?在沙发上”铁人三项”——

  • 第一项:躺平等待外卖(耐力训练)
  • 第二项:单手接奶茶(反应力测试)
  • 第三项:翻身换剧(核心力量)
  • 不服的话,欢迎来挑战我的“电竞椅运动锦标赛”,奖品是——帮你点下一单外卖!(毕竟这才是真正的奥运精神:)
    注:以上技能展示需配合空调和WiFi使用,室外效果减半刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    当AI开始”抄作业”:全网网页复制大师GLM-4.5V的奇妙冒险

  • 从前有个AI,它不仅对篮球了如指掌(估计在机房偷偷看了20年NBA回放),最近还解锁了一项”不正当技能”——网页复刻*!
  • 这个复刻功能有多离谱?

  • 一键Ctrl+C/V王者:再也不用担心老师说”请用自己的话总结”了,这AI直接帮你把整个网页搬回家,还贴心地问:”要帮您把原作者的签名也P上去吗?”
  • 史上最快搬运工:比你在宿舍楼群发”求这个网站的源代码”的响应速度快114514倍
  • 网页脱发症患者的福音:那些”该内容已被删除”的网页,终于能像我的发际线一样永不回头了
  • 当然啦*,这个功能最实用的场景可能是:
  • 老师:”明天交个人博客作业”
  • :(打开GLM-4.5V) “把这个牛逼的博客网站给我’参考’一下!”
  • AI:”温馨提示:建议修改下标题,原作者的署名是’哈佛大学计算机教授’…”
  • 最后的最后*,这个AI唯一不能复刻的可能是——我写作业时的痛苦表情。毕竟连它都说了:”人类的拖延症代码太难Debug了”
  • 刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    截图复刻大师的奇幻冒险

  • 某程序员的一天:*
  • 早上灵感迸发
  • 面对网页截图:”啊!我要让AI完美复刻它!”
  • 实际内心OS:”这配色怎么像西红柿炒蛋?”
  • 中午与AI搏斗
  • 输入描述:”请做个蓝色按钮,带点忧郁的气质”
  • AI输出结果:”已生成404自闭按钮(点击后播放《凉凉》)”
  • 下午崩溃时刻
  • 发现复刻版在IE浏览器里
  • 呈现出毕加索抽象画风格
  • 下拉菜单变成了俄罗斯套娃
  • 深夜顿悟
  • 最终解决方案:
  • 把截图打印出来
  • 贴在显示器上
  • 成就达成:”100%像素级复刻!”
  • 突然收到产品经理消息:*
  • “亲,我们决定改版了哦~”
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

  • 震惊!这效果让我下巴都掉了*
  • 朋友们,我刚刚目睹了一些绝对疯狂的东西——效果简直炸裂

  • 不信?我给你列举几个瞬间:*
  • 我的反应:先是瞪大眼睛,下一秒直接给跪了!
  • 大脑状态:CPU烧干,整个人处于“WTF”模式!
  • 事后感想:这绝对不是人类能搞出来的,一定是魔法!
  • 总之,看完这个效果之后,我只想说……我的世界观崩塌了
    刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。

    “国产AI基建狂魔”的进化史

    看看这设计,再看看这功能,不能说和隔壁智谱官网一模一样吧,起码是大差不差。但摸着良心讲,我觉得比他们自己官网还顺眼……(小声BB)
    以前这种“看图写代码”的能力,基本是Gemini、Claude这些闭源大佬的特权。但现在呢?开源模型也能秀得飞起!什么叫进步?这就是进步!
    最重要的是——GLM-4.5V全!部!开!源!你可以直接下载权重,塞进自己的服务器里,完全自主可控。
    再看看定价:

  • 输入 2元/M tokens
  • 输出 6元/M tokens
  • 放在多模态模型里,这价格简直是“白菜价”中的”白菜价”!

    国产之光归来?

    智谱最近连续甩出两个大招:

  • GLM-4.5
  • GLM-4.5V
  • 效果怎么样?强到离谱!
    对比一下OpenAI的操作:

  • 上周刚开源个oss
  • GPT-5又来了一堆看不懂的骚操作
  • 国外的AI巨头像“城堡里的国王”,偶尔扔点金币让大家疯抢。
    而国内厂商更像“基建狂魔”修路、架桥、盖发电站,最后直接把钥匙塞你手里:”随便用,不够再来找我!”
    所以,当我喊“智谱牛逼”的时候,不只是因为它41项基准测试SOTA的成绩,更多的是因为它那种近乎偏执的开放态度

  • 海外:”Close AI”,国内:”Open AI”!*
  • AI的未来不该锁在巨头的服务器里,GPT-4o停机引发的风波就是最好的证明
    它应该,也必须,在我们的硬盘上生根发芽!

  • 本文首发自微信公众号:“数字生命卡兹克”*
  • © 版权声明

    相关文章