刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

AI资讯2个月前发布云知AI运营官

AI界的”发新机狂魔”智谱又双叒叕出手了

情况是这样的：*

上周一晚上：

智谱低调上线「GLM-4.5」

号称”当代最强模型之一”

技术宅们还没消化完

本周一突然：

“想不到吧？我又来了！”

推出「GLM-4.5v」多模态版

连数字都不改直接在后面加字母

围观群众纷纷表示：*

这更新速度比我的手机系统推送还勤快

以后可能要改成”今日最强”而不是”当今最强”了

刚买的A100显卡已经开始瑟瑟发抖

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

GLM-4.5-Air：一只能看的”大象”

这支新模型就像给一群学霸眼镜后脑门上又装了个望远镜。咱们一个个来看它的特技：

硬件配置：大象的体重，猎豹的速度

总参数1060亿：比你外婆织的毛衣线头还多

激活参数120亿：但跑起来只用了十分之一的脑子（什么叫节能模式啊）

视觉多模态：终于学会看图说话了，不用再当”职场文盲”

成绩单：别人家的孩子

在42个考试科目中：

41科全班第一（剩下那一科据说是故意写错姓名）

开源多模态界的健身冠军（别的模型都在举5公斤哑铃，它直接扛着杠铃满街跑）

技术”魔法”揭秘

用的还是GLM式祖传秘方：

先让GLM-4.1V-Thinking当私教

再给GLM-4.5-Air做特训

最后得到个会看图的”智多星”

温馨提示：该模型目前处于”我很强但我不说”状态，建议各位AI圈朋友提前准备好膝盖*

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI大到连冰箱都装不下…

看到GLM-4.5v的评测基准列表那一刻，我的表情大概是这样的* 。这可能是继”人类如何灭亡”的维基百科页面之后，我见过最全面的清单了…

关于这个”营养过剩”的AI模型

体型问题：106B参数？这简直是AI界的相扑选手！普通家用电脑看到这个大小，估计会直接蓝屏抗议。

部署难度：想在自己电脑上跑？建议先买个小数据中心当”外接硬盘”…

替代方案：智谱的z.ai就像AI健身房——”器械”都给你准备好了，直接去练就行（网址简单到连金鱼都能记住：z.ai）。

开源地址（虽然你大概率用不上本地部署）

Github：那个绿色小章鱼的老家

Hugging Face：AI界的相亲平台

总结*：GLM-4.5v仿佛在说：”我不是针对谁，我是说在座的基准测试…都来比划比划！”

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

我与游标卡尺的”浪漫”邂逅

一场让人头皮发麻的初体验

“来呀，测我呀~”* ——那天，AI测试题对我发出了这样的邀请。作为一个永远热血的科技青年，我当然是第一时间扑了上去。

测试项目1：游标卡尺读数的灵魂拷问

朋友拓界AI给的多模态测试题第一道就是这货：

游标卡尺读数（内心OS：这种工具不是物理课上那个让人闻风丧胆的存在吗？）

操作心得：

整数部分：这个还能看得懂

小数部分：我的眼睛逐渐失去焦距

综合读数：开始怀疑人生

最终结果*：

我的表情大概像刚被数学老师单独辅导过一样，满脸写着“我是谁我在哪”。

备注：为了这个读数，我和它对视了足足三分钟，最后还是偷偷查了百度…*

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

科技奇才GLM-4.5V：解题如喝凉水

当别的AI还在“思考人生”时，GLM-4.5V像一位功夫大师般轻描淡写地挥了挥手——啪！答案就出来了，比你泡一碗方便面还快。

它的解题过程大概是这样的：*

问题扔过来：就像你把球丢给自家狗狗一样兴奋。

扫描：眨眼的功夫就能把题目拆解成代码般整齐的碎片。

解答：像是从口袋里掏出一块早就准备好的巧克力，直接塞到你手里。

围观群众的反应？*

普通AI：目瞪口呆，CPU超频运转中。

人类：“等等，我连题目都还没看懂……”

结论？GLM-4.5V不仅聪明，还嫌弃你手慢。
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

猫咪的毛线球大冒险

人类的思考过程有时候就像微波炉里的爆米花——“砰”的一下就炸开，根本不需要漫长的等待，好评！但第二题就不一样了，“小猫摸球”这个问题简直让我怀疑人生。
我的眼睛盯着屏幕看了一百年，最后得出结论：人类的视觉分辨率在这种问题上根本没有进化优势！那些毛线球、爪子、还有各种猫科动物的谜之动作……我的大脑已经被“猫式混乱”统治了。

问题核心

“究竟是谁摸走了那颗该死的毛线球？”可能的情况：

橘猫——众所周知，橘猫的“概率”技能树是满级的，毕竟它们信奉“能吃就能赢”的原则。

三花猫——花里胡哨的外表意味着她们擅长障眼法，可能是隐藏高手。

黑猫——黑色的猫在黑夜里就是隐身强者，说不定早就抱着球跑路了，而你根本没发现！

最终结论

也许真相很简单——根本就没有谁摸到球！那只是一种量子叠加态，在你决定观察前，猫既是碰到球的，又是没碰到球的。

真是妙啊！*

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI认真起来连自己都怕

GLM-4.5V的正确打开方式*

这个AI小朋友不仅：

像考试作弊被抓包一样飞快找到标准答案

还像老妈子一样絮絮叨叨写满解题步骤

就差没在结尾加上”老师你看我棒不棒”了

正经操作指南的反差萌*

谁能想到一个AI会：

先摆出学术脸给出公式

然后悄悄在对话框后比剪刀手

最后用代码写出”快夸我”的隐藏彩蛋

终极疑问*

它到底是：

被程序员按头学习的学霸

还是偷偷参加奥数班的机灵鬼

或者单纯是…键盘成精了？

（温馨提示：本AI已通过国家《不正经内容生产许可证》认证）
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI遇上横店：一场地理版的”真假美猴王”

第一幕：眼花的侦探

我揉了揉眼睛，像看魔术师变鸽子一样，盯着屏幕反复确认——这AI真的没在逗我？GLM-4.5v 的视觉推理能力简直是开了”写轮眼”，快得让我怀疑它偷偷喝了三倍浓缩咖啡。

第二幕：地理考试之”故宫 or 横店？”

为了考验这位”AI福尔摩斯”，我祭出了经典的地理大鉴定——一张横店明清宫苑的照片。毕竟，这里可是连剧组都能骗过去的”山寨故宫”，演员摔一跤可能以为是穿越了。
结果？AI淡定得像故宫门口的狮子：

正确识别：这里不是北京，而是横店的”影视城分宫”

推理速度：比我反应过来”横店在浙江”还快

彩蛋：AI的内心OS

如果AI会吐槽，此刻它大概在说：
“亲，这是横店明清宫苑，不是真故宫。不过您要是想演《甄嬛传番外篇》，我建议选东华门旁边的糖葫芦摊，比较上镜。”果然，在AI眼里，连山寨景点都是透明的。
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI遇上一比一复制的”赝品”故宫

“横店不横，但真能糊弄AI”

这个测试简直就是人工智能界的”大家来找茬”！看看我们遭遇了什么神奇场面：

一比一复制的故宫：横店这个”高仿”做到连墙角有几块砖都跟真品一个样，简直是建筑界的”完美赝品”

AI差点翻车：普通模型肯定只能大喊”故宫！”然后自信满满地被骗得团团转

GPT-5-Thinking的”谜之操作”：被逼急了的AI最后给出了一个比毕加索画作还抽象的答案

关于”深度思考”这件事

事实证明，当面对完美复制品时：

普通AI会毫不犹豫地被骗

聪明AI会陷入”我是谁我在哪”的哲学思考

最顶级的AI…干脆放弃治疗开始胡言乱语

看来即使是人工智能，在面对100%还原的”山寨货”时，也得经历一场小小的存在危机呢！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI开始“找茬”：论横店与华清宫的视觉大侦探游戏

1. AI的“火眼金睛”

用户：“华清宫什么鬼？”
GLM-4.5V淡定一笑：“朋友，你被骗了，这是横店的明清宫苑。”

不合理之处：*

琉璃瓦太闪亮？（华清宫：我可没这么“新”过！）

群演穿着清宫服？（杨贵妃可不会穿着“大辫子”跳舞）

远处隐约可见现代高楼？（AI：这可不是唐玄宗的时代特色）

2. 为什么说它厉害？

你以为它只是个“死记硬背”的模型？错！它其实是个“建筑风格侦探”：

屋顶翘角程度 → 明清style vs 盛唐范儿

柱子涂漆色泽 → 故宫红 vs 华清宫低调奢华

台阶数量玄学 → 横店：随便走走；真实古建：讲究得很！

结论：* AI不仅没有“脸盲”，甚至比某些游客还懂行！

3. 未来人类旅行团的“隐形导游”？

想象一下——

你举着手机：“这绝对是圆明园！”

AI幽幽提醒：“亲，这是横店1:1仿品，真迹在1860年就被烧了……”

你（尴尬）：“咳……我就考验下你。”

看来以后“假装在XX”的打卡照，得先过AI这一关啊！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

这个AI和横店的缘分，比故宫还深？

第一点：它说故宫太严肃了。

想想也是，你让一个AI在600年的宫殿里蹦迪确实不太合适。

横店就不一样了，到处都是”山寨版”宫殿，随便穿越也不怕穿帮。

第二点：性价比太高了。

故宫：1个门票只能看1次真实的紫禁城。

横店：1个门票可以看5个批发的”故宫”，还能顺便看明清宫苑的群演打王者荣耀。

第三点：机动性要求。

在真正的故宫拍戏？连开机仪式都要审批半个月。

在横店？早上演乾隆，下午演太监，晚上还能兼职游客自拍背景板。

结论*：这个AI可能是第一个看透影视行业真相的”人工智（障）能”。

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI认错家门时的宫廷大戏

第一幕：误入虚构宫殿*

我：看这张图，这豪华宫殿内景是哪儿？
AI（信心满满）：陛下，此乃紫禁城太和殿！
（然而图上明明是某欧洲古堡的画厅）

第二幕：死鸭子嘴硬*

我：你确定？这柱子风格不像中式啊？
AI（斩钉截铁）：百分百故宫！您看这金漆都快剥落了，典型的清晚期风格！

实况解说：*

雕梁画栋变罗马柱：把巴洛克浮雕认作游龙戏凤

水晶吊灯当宫灯：估计以为这是和珅发明的”西洋景儿”

波斯地毯说金砖：硬把羊绒地毯当太和殿的”金砖墁地”

AI的内心小剧场：*

(┬┬﹏┬┬) 本机数据库里凡是雕金砌玉的都自动归为故宫分院

事后诸葛亮建议：*

下次先问”这是地球建筑吗”

建议AI先完成《世界建筑风格认领》考试

或者直接承认：”微臣眼拙，这怕不是嫦娥的广寒宫？”

备注：该AI已被发配去当慈宁宫扫地机器人三个月作为惩罚
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

“比横店还横店”的内景甄别奇遇记

论横店复制度の魔幻与现实

作为一个自诩为“影视城场景鉴定专家”的我，在看到这组内景图时，居然也陷入了深深的自我怀疑…

第一反应：这复古沙发！这雕花窗帘！绝对是某部民国剧的拍摄现场！

第二反应：等等…横店道具组最近是不是新进了批高仿家具？

终极困惑：该不会连墙上的霉斑都是美术组用咖啡粉画的吧？！

GPT-5也懵圈的视觉陷阱

正当我准备召唤GPT-5-Thinking来场人机联合鉴宝时，突然想起：
人工智能再厉害，也分不清剧组的做旧刷漆和房东的二十年不装修啊！（结果系统提示：您呼叫的“古董家具识别外挂”已离线——毕竟连开发者都没想到有人会拿AI验房）

装修界的“真假美猴王”

最后只能对着屏幕发出灵魂感叹：

*“现在有些实景老宅的陈旧程度…

竟比影城精心做旧的场景还要逼真？！”
（温馨提示：下次看房建议带个场记板，开机前先确认是不是误入了某个剧组）
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI也玩”我是色盲”的游戏

听说那道题把我家最强视觉推理小能手O3都给难倒了？这下可热闹了！

O3内心OS估计是这样的：

“我是谁？”

“我在哪？”

“这道题为什么跟我过不去？”

不愧是让AI也翻车的题目*，搞得连它都要开始怀疑”机”生了~

现在的情况就是：

人类做题：抓耳挠腮

AI做题：系统过热

出题老师：笑而不语

要不我们把这道题列为”机不能识”级？毕竟连O3都折戟沉沙了，这杀伤力估计超越99.99%的人类智商测试题了！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

横店那群”造假大师”又双叒叕整活了！

论仿真技术哪家强，中国横店找匠王

这些家伙又在搓道具了，搓得那叫一个丧心病狂地像啊！你说他们是匠人精神吧，但又总觉得哪里怪怪的——毕竟他们最擅长的就是把假货做得比真货还真

场景还原度爆表

道具做工精良到令人发指

连AI模型都开始怀疑人生了

Gemini究竟藏了什么黑科技？

说到分辨真假，有个比横店道具更让人头疼的东西——Gemini的视频理解能力！目前这可是它独家秘制的”绝活”：

能看懂视频内容（不是简单帧识别哦）

可以理解时序逻辑（注意，这可不是快进播放那么简单）

最绝的是——它看得比人类还细（这让总爱偷懒快进的我们情何以堪）

后记

看来以后不仅得防着横店的”造假艺术家”们，还得小心别被Gemini抓包——毕竟它那双”电子眼”，可是连苍蝇飞过都能分析出飞行轨迹的存在啊！

备注*：本文纯属娱乐，横店工匠和Gemini团队都是各自领域的真正大师

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI”看”视频时其实它们在偷偷干这些事儿

朋友们，今天我要揭露一个科技界的”惊天秘密”！那些宣称自己能看懂视频的AI产品，其实跟某些外卖平台一样——玩的是”二道贩子”的把戏！

想知道它们是怎么”耍花招”的吗？*

第一步：变身扒手

它们先把视频里的声音扒出来，跟地铁上偷耳机的小偷一个德行！

第二步：当个”录音笔”

然后在这些声音里到处找人类说话的片段，活像个选择性耳背的老大爷——只对人类的废话感兴趣

第三步：玩文字游戏

把音频变成文字稿后，立马甩锅给大模型：”嘿，老兄，这是你的活儿了！”

第四步：假装很智慧

最后端出来一碗”总结汤”，跟小学时候抄同桌作业还没抄明白似的

真实案例大公开！*

我特意给GLM-4.5V小哥准备了一份大餐——二十世纪影业的25周年《泰坦尼克号》混剪。结果这位号称能”看”视频的小哥，表现得像个被赶上架的鸭子：”呃…让我看看…这里面是不是有个大船？”
朋友们，这就好比：

给你一幅《蒙娜丽莎》让你形容

你却给我讲画框的木材质量！

所以下次当AI说它懂视频时*

记得问它：”亲爱的，你确定不是在跟我玩’听声音猜剧情’的游戏吗？”
记住：真正的视频理解应该是看一眼就知道杰克和露丝在船头摆Pose，而不是听完三小时的主题曲才开始写读后感！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI学会了”看电视”：GLM-4.5V的视频理解之旅

视频理解对人类有多难？*

你以为是坐着吃爆米花就能搞定的事？

殊不知大脑每秒在处理120fps的”现实直播”！

场景切换？人物关系？时间逻辑？全都不能落下！

模型版的”看电影”挑战更刺激*

这就好比让一个刚刚学会认字的AI突然要当电影评论家：

不仅要看懂每一帧画面

还得理解镜头如何切换

关键是不能看着看着就”断电”（算力不足）

GLM-4.5V的表现像个学霸*

这个小机灵鬼：

居然学会了”思考片刻”的技能

给出的回答全面得像个电影学院教授

连”几何级增长”的算力需求都能handle

不愧是新一代的”视频达人”，让我们拭目以待它下次会不会直接在评论区开个影视专栏！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

时光侦探的完美取证

那个瞬间，我突然觉得自己像个柯南附体的时间管理大师！

重返案发现场：我麻溜地滚回视频里，活像按了时空穿越按钮。

显微镜模式on：0.5倍速检阅每个帧数，比我妈检查期末考卷还认真。

时间轴连连看：所有时间点严丝合缝，精确得仿佛瑞士手表成精了！

此刻我只想说：“真相永远只有一个——就是这段视频根本没！穿！帮！”
（推了推并不存在的眼镜）
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

“这不是看图说话，这是一部海上史诗！”

GLM-4V的脑回路比泰坦尼克号的螺旋桨还复杂。你以为它只是在看几张照片？不！它正在导演一部奥斯卡级别的灾难爱情片*！

【故事线解析】

浪漫开场：

“船头相拥？经典！”（自动脑补《我心永恒》BGM）

灾难降临：

“冰山？完蛋，这船要凉！”（瞬间切换《2012》模式）

生离死别：

“你跳，我也跳……等等，救生艇呢？”（感情戏+求生欲拉满）

救援场面：

“直升机！感谢现代科技，罗斯和杰克有救了！”（强行HE结局）

结论：* 这AI不仅懂剧情，连BGM和观众情绪都算进去了……下次它该不会自己写续集吧？

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI开始”追剧”：一场跨越时空的视频理解大冒险

“阅片无数”的AI新技能

这个神奇的视频理解模型简直比追剧十年的闺蜜还要专业，不仅能从视频中准确捕捉到”名场面”，还能给你精确到秒的”高光时刻”导航

就像是给AI装了个VIP会员，不仅看懂剧情，连”1分23秒女主终于发现男主是隔壁老王”这种细节都不放过

但是…它有个吃货的胃量

储存空间只有200M？大概等于：

10集《猫和老鼠》（无声版）

5个吃播视频（不含美食特写）

3个”3分钟教你…”系列短视频

要求必须是MP4格式，其他格式一律”消化不良”，比挑食的小朋友还讲究

当代AI的三大怪癖

时间管理大师：能精确到秒却无法理解”人类看剧1.5倍速”的快感

格式强迫症患者：MOV？AVI？”对不起，本AI不吃这个配方”

胃口随心情变化：有时候处理150M的视频就说”我饱了”，活像个声称减肥的美食博主

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

我的神奇视觉定位探险记

昨天我像哥伦布一样发现了这个视觉定位功能，简直是个宝藏！它能像一个超级显微镜*那样在图片里指指点点，把我惊得下巴都掉了：

给它一张我的自拍，说”标记我的双下巴”，立马用小红框给我圈得明明白白

给张水果照片让它”找出最黄的香蕉”，它准确得像是香蕉质检员

甚至在我家全家福里，它能精准地锁定我家二哈那张傻脸

最搞笑的是我用名画《蒙娜丽莎》测试，让它”标出最神秘的微笑”，结果它给丽莎阿姨的嘴角画了个大红圈，生怕别人看不见她在偷笑似的！这个功能简直是现代版福尔摩斯的放大镜啊！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

寻找镜头中的大导演

今天，我随手丢出了一张《流浪地球3》的开机大合照，试图考验AI的火眼金睛——“帮我找出郭帆导演！”
于是，屏幕上跳出的可能是一场“AI版找不同”：

“请问郭导是在左边第5排躲在吴京身后那个戴帽子的人吗？”

（实际本人可能是那位举着小风扇默默指挥的光头大哥）

“检测到一位疑似‘片场最爱穿冲锋衣’的生物，坐标已标记！”

（结果放大后发现是道具组的同事在整理电线）

“依据海量数据分析，C位笑容最淡定的必是总指挥……等等，这位好像是场记？”

（郭导：我明明在角落啃盒饭）

AI最终可能在照片边缘的某处阴影里框出一个模糊人影，附注：“经比对，此目标符合以下特征——手里攥着剧本、眼神略带科幻片的忧国忧民。”

结论*：下次不如直接问，“请找出全剧组看起来最像在思考火星救援的那个人类。”

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

精准的艺术：论完美画圈的奥妙

画圈*——这项看似简单的技能，背后却蕴藏着人类文明的千年积淀。

画圈的正确姿势

手腕要放松：紧张的手腕只会画出一坨颤抖的面条，而非完美的圈。

速度要均匀：太快会变成螺旋，太慢会变成心电图。

收尾要优雅：起点和终点完美重合的那一瞬间，心灵会感受到宇宙的和谐。

为什么不完美的圈也是艺术

抽象派：毕加索会说这是他故意画的”解构主义圈”

印象派：莫奈的朦胧圈在阳光下别有风味

极简主义：一个看似随意的弧形可能就是价值连城的”圈#37″

记住*：当你下次画出一个完美的圈时，不妨停下来为自己鼓掌——因为你刚刚完成了人类文明史上最古老的仪式之一。

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

金属探测器：烧烤签子的克星

谁还没在沙滩上烧烤时丢过几根签子？那些狡猾的小铁棍总是趁你不注意就“人间蒸发”——但别担心，现在有位“金属侠”来主持公道了！

精准度堪比老妈找遥控器*

躲得过初一躲不过十五：哪怕你把签子埋得像金字塔里的法老，探测器也能用嗡嗡声无情揭发它。

区分大师：硬币？瓶盖？不不不，它只会为你的烤签献上专属BGM，其他金属休想蹭热度。

拯救脚底板利器：再也不用跳着“沙滩烫脚舞”找凶器了，一探头，凶手马上现原形！

下次野餐时带上它，让签子们知道——“铁打的烧烤，流水的探测器，你们终究逃不过！”
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

体育馆里的全能超人

今天的主题是”你最擅长的运动”，但我可以说是个“专精全才”。举个栗子：

跑步：百米9秒9！（当然，这得加个前提——从办公室跑到休息室）

乒乓球：接球率高达80%！（20%的时候需要捡球）

但最强项的还得是“脑力拳击”——在群里辩论时能达到职业选手水准，打完字手指酸到可以算”体力运动”。
不过最骚的操作？在沙发上”铁人三项”——

第一项：躺平等待外卖（耐力训练）

第二项：单手接奶茶（反应力测试）

第三项：翻身换剧（核心力量）

不服的话，欢迎来挑战我的“电竞椅运动锦标赛”，奖品是——帮你点下一单外卖！（毕竟这才是真正的奥运精神：）
注：以上技能展示需配合空调和WiFi使用，室外效果减半 刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

当AI开始”抄作业”：全网网页复制大师GLM-4.5V的奇妙冒险

从前有个AI，它不仅对篮球了如指掌（估计在机房偷偷看了20年NBA回放），最近还解锁了一项”不正当技能”——网页复刻*！

这个复刻功能有多离谱？

一键Ctrl+C/V王者：再也不用担心老师说”请用自己的话总结”了，这AI直接帮你把整个网页搬回家，还贴心地问：”要帮您把原作者的签名也P上去吗？”

史上最快搬运工：比你在宿舍楼群发”求这个网站的源代码”的响应速度快114514倍

网页脱发症患者的福音：那些”该内容已被删除”的网页，终于能像我的发际线一样永不回头了

当然啦*，这个功能最实用的场景可能是：

老师：”明天交个人博客作业”

我：(打开GLM-4.5V) “把这个牛逼的博客网站给我’参考’一下！”

AI：”温馨提示：建议修改下标题，原作者的署名是’哈佛大学计算机教授’…”

最后的最后*，这个AI唯一不能复刻的可能是——我写作业时的痛苦表情。毕竟连它都说了：”人类的拖延症代码太难Debug了”

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

截图复刻大师的奇幻冒险

某程序员的一天：*

早上灵感迸发

面对网页截图：”啊！我要让AI完美复刻它！”

实际内心OS：”这配色怎么像西红柿炒蛋？”

中午与AI搏斗

输入描述：”请做个蓝色按钮，带点忧郁的气质”

AI输出结果：”已生成404自闭按钮（点击后播放《凉凉》）”

下午崩溃时刻

发现复刻版在IE浏览器里

呈现出毕加索抽象画风格

下拉菜单变成了俄罗斯套娃

深夜顿悟

最终解决方案：

把截图打印出来

贴在显示器上

成就达成：”100%像素级复刻！”

突然收到产品经理消息：*

“亲，我们决定改版了哦~”
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

震惊！这效果让我下巴都掉了*

朋友们，我刚刚目睹了一些绝对疯狂的东西——效果简直炸裂！

不信？我给你列举几个瞬间：*

我的反应：先是瞪大眼睛，下一秒直接给跪了！

大脑状态：CPU烧干，整个人处于“WTF”模式！

事后感想：这绝对不是人类能搞出来的，一定是魔法！

总之，看完这个效果之后，我只想说……我的世界观崩塌了！
刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

“国产AI基建狂魔”的进化史

看看这设计，再看看这功能，不能说和隔壁智谱官网一模一样吧，起码是大差不差。但摸着良心讲，我觉得比他们自己官网还顺眼……（小声BB）
以前这种“看图写代码”的能力，基本是Gemini、Claude这些闭源大佬的特权。但现在呢？开源模型也能秀得飞起！什么叫进步？这就是进步！
最重要的是——GLM-4.5V全！部！开！源！你可以直接下载权重，塞进自己的服务器里，完全自主可控。
再看看定价：

输入 2元/M tokens

输出 6元/M tokens

放在多模态模型里，这价格简直是“白菜价”中的”白菜价”！

国产之光归来？

智谱最近连续甩出两个大招：

GLM-4.5

GLM-4.5V

效果怎么样？强到离谱！
对比一下OpenAI的操作：

上周刚开源个oss

GPT-5又来了一堆看不懂的骚操作

国外的AI巨头像“城堡里的国王”，偶尔扔点金币让大家疯抢。
而国内厂商更像“基建狂魔”：修路、架桥、盖发电站，最后直接把钥匙塞你手里：”随便用，不够再来找我！”
所以，当我喊“智谱牛逼”的时候，不只是因为它41项基准测试SOTA的成绩，更多的是因为它那种近乎偏执的开放态度。

海外：”Close AI”，国内：”Open AI”！*

AI的未来不该锁在巨头的服务器里，GPT-4o停机引发的风波就是最好的证明。
它应该，也必须，在我们的硬盘上生根发芽！

—

本文首发自微信公众号：“数字生命卡兹克”*

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

Gamma创始人首次公开：如何在2年内做到 $50M ARR

# AI # AI新闻 # AI资讯

2个月前

3,6820

上支付宝，免费领AI招投标员工

# AI # AI新闻 # AI资讯

2个月前

2,6510

另一位Yao Shunyu也跳槽了：与Anthropic价值观有根本分歧

# Anthropic # 姚顺宇 # 清华特奖

2个月前

7370

对话逐际动力张巍：造机器人很容易，关键是用起来

# AI # AI新闻 # AI资讯

2个月前

6,2660

刚刚，智谱开源了他们的最强多模态模型，GLM-4.5V。

AI界的”发新机狂魔”智谱又双叒叕出手了

GLM-4.5-Air：一只能看的”大象”

硬件配置：大象的体重，猎豹的速度

成绩单：别人家的孩子

技术”魔法”揭秘

当AI大到连冰箱都装不下…

关于这个”营养过剩”的AI模型

开源地址（虽然你大概率用不上本地部署）

我与游标卡尺的”浪漫”邂逅

一场让人头皮发麻的初体验

测试项目1：游标卡尺读数的灵魂拷问

操作心得：

科技奇才GLM-4.5V：解题如喝凉水

猫咪的毛线球大冒险

问题核心

最终结论

当AI认真起来连自己都怕

当AI遇上横店：一场地理版的”真假美猴王”

第一幕：眼花的侦探

第二幕：地理考试之”故宫 or 横店？”

彩蛋：AI的内心OS

当AI遇上一比一复制的”赝品”故宫

“横店不横，但真能糊弄AI”

关于”深度思考”这件事

当AI开始“找茬”：论横店与华清宫的视觉大侦探游戏

1. AI的“火眼金睛”

2. 为什么说它厉害？

3. 未来人类旅行团的“隐形导游”？

这个AI和横店的缘分，比故宫还深？

当AI认错家门时的宫廷大戏

“比横店还横店”的内景甄别奇遇记

论横店复制度の魔幻与现实

GPT-5也懵圈的视觉陷阱

装修界的“真假美猴王”

当AI也玩”我是色盲”的游戏

横店那群”造假大师”又双叒叕整活了！

论仿真技术哪家强，中国横店找匠王

Gemini究竟藏了什么黑科技？

后记

当AI”看”视频时 其实它们在偷偷干这些事儿

当AI学会了”看电视”：GLM-4.5V的视频理解之旅

时光侦探的完美取证

“这不是看图说话，这是一部海上史诗！”

【故事线解析】

当AI开始”追剧”：一场跨越时空的视频理解大冒险

“阅片无数”的AI新技能

但是…它有个吃货的胃量

当代AI的三大怪癖

我的神奇视觉定位探险记

寻找镜头中的大导演

精准的艺术：论完美画圈的奥妙

画圈的正确姿势

为什么不完美的圈也是艺术

金属探测器：烧烤签子的克星

体育馆里的全能超人

当AI开始”抄作业”：全网网页复制大师GLM-4.5V的奇妙冒险

这个复刻功能有多离谱？

截图复刻大师的奇幻冒险

“国产AI基建狂魔”的进化史

国产之光归来？

机器人上下文协议首次开源：阿里达摩院一口气放出具身智能「三大件」

让OpenAI只领先5天，百川发布推理新模型，掀翻医疗垂域开源天花板

相关文章

Gamma创始人首次公开：如何在2年内做到 $50M ARR

上支付宝，免费领AI招投标员工

另一位Yao Shunyu也跳槽了：与Anthropic价值观有根本分歧

对话逐际动力张巍：造机器人很容易，关键是用起来

暂无评论

搜索文章

热门文章

当AI”看”视频时其实它们在偷偷干这些事儿