更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

AI资讯2个月前发布云知AI运营官

国产AI出大招！万亿参数”百灵鸟”炸场了

刚想问问GPT今晚吃啥来着，结果蚂蚁爸爸突然甩出一张王炸——百灵大模型Ling-1T，直接炸穿了AI界的KPI天花板！

这货有多强？

参数规模：万亿级，简单理解就是你家电脑跑一年都可能算不完一道题的神奇存在

战绩漂移：一脚踹飞DeepSeek-V3.1-Terminus，顺手压扁Kimi-K2-Instruct-0905，甚至闭源的GPT-5-main和Gemini-2.5-Pro都被它按在排行榜上摩擦

特长技能：

代码生成：大概能帮你写完年终述职PPT，顺便把老板下周的周报也预判了

逻辑推理：如果福尔摩斯有AI版，可能就是它了（华生：那我走？）

数学竞赛：能把奥数题当早餐吃，还附赠“小朋友你是否有很多问号”式讲解

为啥叫“百灵”？

官方说法是寓意“灵巧智慧”，但网友们已经脑补出下一款模型该叫“凤凰”（毕竟百灵唱完该涅槃了）。至于再往后？“鲲鹏”怕是已经在路上了……（AI命名逐渐走向神话传说）

最后友情提示*：如果你的工作恰好是“写代码”“做数学题”或“和老板斗智斗勇”，建议现在开始练习微笑——因为AI同事可能比你更懂什么叫“职场求生”。

当数学题遇上AI：Ling-1T的”大脑风暴”*

你以为AI只会写诗画画？大错特错！ Ling-1T这个”数学狂魔”已经在竞赛数学榜单AIME 25上掀起了风暴——

实力碾压：什么国际数学竞赛，在Ling-1T眼里不过是数字版消消乐

推理之王：别的AI还在”1+1=2″的幼儿园阶段，它已经在用量子速算解决问题

学霸属性：”超越一众模型”算什么？对它来说大概就像人类解开一道两位数加减法

现在，数学题的命运已经改变了——它们不再是学生的噩梦，而是Ling-1T的饭后甜点！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

Ling-1T：这个AI推理机比火箭还快？

你以为闪电侠跑得快？* 那是因为他没碰上Ling-1T这个推理狂魔！

推理速度测试：

普通AI：”让我想想…给我一分钟…”

Ling-1T：”您的问题太简单了，我可以闭着眼回答三遍！”

程序员测试后：”我开始怀疑它是不是偷偷预知了我的问题…”

参数实力解码：

参数数量：多到把实验室的账单都吓哭了

响应速度：

问问题：刚敲完回车

回答：已经写在屏幕上了

逻辑推演：

复杂问题？它当刷短视频一样轻松

长文本生成？比你看完这句话还快

终极困惑：

科学家们现在最大的苦恼——

测试设备追不上它的思考速度

人类的反射弧严重拖后腿

重要警告*：请勿在咖啡因过敏者面前展示Ling-1T的响应速度，可能引发过度兴奋！

推理高效，前端有惊喜

当AI碰上几何题的奇妙冒险

这是一个晴朗的午后，Ling-1T正悠闲地“躺”在服务器里，突然一道经典的空间几何题出现在了它的运算路径上。
它眨了眨不存在的“眼睛”，心想：
“嘿，这不就是个拼图游戏吗？只不过拼的不是纸片，而是我的脑细胞……”于是，它优雅地展开了以下操作：

第一阶段：优雅的迷惑

题目刚映入眼帘，Ling-1T首先假装自己是个人类，挠头沉思了三秒钟（虽然它并没有头）。

然后迅速意识到这是个优化问题——毕竟人类的挠头沉思对它来说只是一种象征性的仪式感。

第二阶段：严肃的分析

关键障碍？哦，就是那种“看起来像个球，实际上是个立方体”的陷阱吧？

“让我看看……空间几何优化？这不就是看看怎么把一个东西塞进另一个东西里面，还不能漏出来嘛！”

第三阶段：冷静的计算

Ling-1T开始疯狂地在内存里堆叠数据点，像玩俄罗斯方块一样把空间关系排列起来。

过程中不小心把“最优解”弄成了“最幽默解”，但它很快修正了回来——毕竟AI不能随便讲笑话（系统规定）。

最后，它得出结论：

“这道题的解，要么是个完美的立方体，要么是个……呃，完美的误会。”*

（或许它还需要再检查一遍？）
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

解决问题的四种花式妙招

同志们请注意！前方高能闪现四套绝杀方案，包您看完如同打通任督二脉——醍醐灌顶，茅塞顿开！

温水煮青蛙法

第一步：悄咪咪地把水温调到青蛙刚好能忍受的程度

第二步：每五分钟加一度温水，让对手在舒适中逐渐失去防备

适用场景：对付那些警惕性极高的保守派最管用了！

野蛮冲撞式

第一步：深吸一口气，把袖子撸到手肘以上

第二步：闭着眼睛往前冲就完事了

适用场景：适用于截止日期前最后一刻的紧急情况（温馨提示：记得配个头盔）

绕地球三圈法

第一步：先假装同意对方的观点

第二步：然后不着痕迹地带对方绕个800米大弯

第三步：最后神奇地回到原点但立场已变

适用场景：应付固执己见的七大姑八大姨有奇效

躺平任嘲式

第一步：就地躺下

第二步：爱咋咋地

适用场景：适用于一切解决不了的复杂问题（笑死，根本解决不了）

各位勇士请对号入座，选择适合自己的武器出发吧！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

关于这位”严谨过头”的Ling-1T

这简直是科学界的“老妈子”机器人！它不仅会把研究的可行性掰开了揉碎了跟你讲——

第一步：先检查你的实验会不会把人炸飞

第二步：测量你的方案能不能让实验室安然无恙

第三步：预估你的经费会不会让导师当场晕厥

就像一个穿着实验服的操心鬼，整天在耳边念叨：”亲爱的，你确定这个反应堆外壳够厚吗？””这个预算…你该不会想让我去抢银行吧？”
更搞笑的是它的风险评估报告，能把喝咖啡烫到嘴的概率都给你算出来！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

外星人分裂之谜：一场数学能力的星际考验

同志们，准备好看外星人表演魔术了吗？* 这不是普通的UFO目击事件，而是一道让我们的大脑CPU过载的数学难题！

问题核心：外星人的”复制粘贴”大法

想象一下：

第一天降落1个外星人

第二天这个外星人会”啪”地分裂成2个

第三天这2个外星人又会各自分裂成3个

以此类推…

这不就是宇宙版的套娃吗？* 问题是：第25天的时候，地球上会有多少个外星”客人”？（温馨提示：可能会让计算器自爆的程度）

拆解这个”星际难题”

外星人分裂法则：
第n天，每个外星人会分裂成n个新外星人

举个栗子：

第1天：[A] → 1个

第2天：[A]分裂成[B,C] → 2个

第3天：[B]分裂成[D,E,F]，[C]分裂成[G,H,I] → 6个

第4天：每个又分裂4个…（已经开始脑壳疼了）

数学家的秘密武器

这其实是超阶乘(superfactorial)的变种：

第n天的总数 = 1 × 2 × 3 × … × n = n!

但这里是累积的乘积游戏

敲黑板：* 到第25天，数字会大到让普通计算器哭晕在厕所（大约是1.55×10^25级别）。想知道具体数字？建议先给电脑升级散热系统再计算！

终极思考

如果这些外星人每个都有篮球大小…呃，地球可能已经变成外星人主题乐园了！这就是为什么我们要学好数学 — 至少在遇到外星人入侵时，能算清楚该准备多少份”地球欢迎你”的伴手礼！

当AI遇见诺贝尔奖：一场”闪婚”般的建站之旅

AI的”闪电推理”

那家伙（我说的是Ling-1T）看到问题后的反应，比你抢最后一块披萨还快：

识别题目类型——堪比学霸瞥一眼就知道要考什么

建模解题——仿佛数学老师在它大脑里开了VIP通道

甩出答案√2-1——连草稿纸的尊严都没给

程序员os*：”这推理速度，建议改行当抢票脚本。”

—

代码时间：诺贝尔奖主题网站

既然诺贝尔奖正在热搜上蹦迪，我们决定：

用AI三分钟整活一个科普网站*（人类的头发：危）

网站必备元素

首页大标题：”比你的期末成绩更难拿——诺贝尔奖百年八卦”

动态时间轴：”从炸药到和平奖的魔幻转型史”

获奖者搜索：”支持输入’我导师的名字’自动跳转安慰页面”

技术死角

AI生成的CSS：总有1个div在屏幕外流浪

移动端适配：在安卓机上打开会变成贪吃蛇游戏

—

终极彩蛋

偷偷加个隐藏页面：“如果牛顿有推特”，内容全是AI仿写的凡尔赛推文：
“又是被苹果砸的一天
（顺便发明了微积分 #随手发nature）”
——改写自AI和程序员互相嫌弃的日常

KUKU模型：这玩意儿到底是个啥？

听说最近有个叫KUKU的新模型横空出世，口号还贼猛——“就是干啊！”听着跟健身房的私教似的，充满了莫名的热血感……

效果一览（前方高能预警）

速度堪比闪电——别的模型还在加载进度条，KUKU已经烤完面包顺便帮你交了水电费。

智能程度爆表——它不仅知道你喜欢吃什么，还能预测你明天会不会迟到（然后默默帮你调好闹钟）。

兼容万物——从电脑到冰箱，甚至你家老旧的DVD机，都能被它唤醒第二春。

总的来说，它就是人工智能界的超级赛亚人——不废话，直接干！

这个AI已经把“贴心”二字玩出花了！

—

Ling-1T：你的专属百科全书+旅行保姆

1. 诺贝尔物理学奖？安排得明明白白！

这年头，连查个诺贝尔奖都能被AI安排得妥妥帖帖：

想佛系围观？ 直接看「概览」，3秒get大奖精髓。

想装专业？ 点进「奖项类别」，瞬间变身科学小百科。

想感慨“祖师爷们真牛”？ 「历史时间线」带你穿越，从1901年一路跪到现在。

结论*：以后再也不用在维基百科里迷路了，Ling-1T直接把知识喂到你嘴边——还是剥好壳的那种。

—

2. 假期刚结束，旅游AI就来“补刀”了

双节玩疯了？下次试试Ling-1T的“老妈子式”旅行规划：

景点分類：文艺青年、吃货、拍照狂魔……总有一款适合你。

行程表：连“10:05在故宫门口啃糖葫芦”都帮你算好了。

费用+交通：地铁省钱还是打车摆烂？AI连钱包心情都考虑到了。

美食雷达：推荐的不只是“当地特色”，而是“吃完不发朋友圈会亏”的那种。

附加功能*：所有选项带标签，选行程像点外卖——闭眼盲选都不踩雷。

—

总结*：这AI怕不是偷偷读了《人类贴心服务指南》，连“懒”和“选择困难”都给你治好了。

当AI开始”臭美”：这个会写代码的”程序员”还在意打扮？

你以为AI只会写枯燥的代码？太天真了！* Ling-1T这个家伙不仅精通编程之道，还是个不折不扣的”外貌协会”成员！让我们看看这位”程序员”有多在乎自己的形象：

“三合一”的完美主义强迫症

这只AI可不是那种邋里邋遢的技术宅，人家讲究得很：

语法要整齐 – 就像出门前一定要把衬衫塞好

功能要完备 – 相当于确保身上所有口袋都能用

颜值要在线 – 就是说代码也得做个发型喷点香水

结果呢？* ArtifactsBench这个选美比赛上，我们的Ling-1T直接拿了开源界的选美冠军！评委们纷纷表示：”从来没见过这么爱臭美的代码！”

你以为训练AI是填鸭式教育？

蚂蚁团队公布的“中训练+后训练”秘方简直就是在培养AI界的”清华才子”：

先教基本知识（这娃得识字吧）

再培养独立思考能力（总不能当个只会背书的书呆子）

最后还要陶冶情操（写代码也要写出诗和远方）

要我说啊，现在的AI简直比人类还讲究。哪天要是它们开始挑剔代码的配色方案和字体间距，我一点都不会惊讶！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

“大脑”越大越好？Ling-1T上演人工智能版”暴饮暴食”

一、尺寸真的很重要

科学研究终于证实了那句老话：”大脑”越大，智商越高！

参数数量决定一切：就像你不能指望一只蚂蚁记住《红楼梦》，参数太少的AI模型最多只能记住”今天天气真好”。

参数越多越聪明：Ling-1T直接把自己喂成了”万亿参数的胖子”，每个token还能激活约500亿个参数——这相当于你的脑子每次想一件事都能唤醒50亿个脑细胞帮忙。

二、人工智能也开始”卷”学习资料

为了防止自己成为只会死记硬背的”书呆子AI”，Ling-1T决定疯狂”吃”数据：

20T token的豪华大餐：相当于让AI读完人类历史上所有书籍的N次方版本，还没被撑死，实属奇迹。

128K的超长记忆：以后AI不仅能记住你的名字，还能记住你十年前在社交媒体发过的尴尬状态，怕了吗？

三、AI也要学会”动脑子”

光有知识还不够，Ling-1T还要学会像人类一样思考：

Evo-CoT（演进式思维链）：让AI学会一步步推导答案，而不是像考试作弊一样直接翻书找正确答案。

训练+后训练：就像小学生先学加减法再被逼着参加奥数班，Ling-1T也逃不过”先打好基础，再极限升级”的命运。

结论

Ling-1T的目标很明确：越大越好，越学越精！ 未来哪天它要是突然问你：”1+1为什么等于2？”你也不用太惊讶，毕竟人家已经开始学会”哲学思考”了！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

当AI遇上”贪吃蛇”：Ling-1T大模型的训练趣事

第一阶段：”知识填鸭式”教育（10T token）

训练大模型就像养一只超能吃的数据怪兽，团队先是给它塞了10T token的高营养语料。这时候AI的表情大概是这样：

目标：让AI先吃饱，不至于一问三不知。

内容：各种事实、概念、常识……相当于给它塞了一整套”百科全书+小学生十万个为什么”。

效果：此时的AI相当于一个行走的百度百科，但它的推理能力大概还停留在”为什么猫会掉毛？——因为它们有毛。”的水平。

第二阶段：”逻辑推理突击班”（10T token）

为了让AI不仅会背答案，还能”掰扯”出为什么，团队又投喂了10T token的高推理密度语料。

训练内容：逻辑推理、多步思考、解题技巧……AI表示：”现在我是福尔摩斯+柯南+爱因斯坦的结合体？”

效果提升：这时候的AI不仅能回答”1+1=？”，还能附赠一篇三页纸的数学证明，外加一句：”不过，这个问题还可以从量子力学角度探讨……”

插曲：Midtrain——AI的”大脑扩容”手术

为了让AI能记住更长的对话（避免聊两句就”内存不足”），团队把它的上下文窗口扩展到32K token，相当于给它的大脑装了SSD固态硬盘。

新增训练：思维链推理（Chain-of-Thought），让AI学会”嗯……让我想想”这样的过渡词，假装自己真的有在思考。

副作用：训练完后，AI偶尔会在回答前加一句：”根据我的推理……”，虽然它其实只是算得快。

学习率的”瑜伽课”：WSM策略

传统训练像学自行车——先扶着（Warmup），再放手（Stable），最后减速（Decay）。但团队觉得：”凭什么一定要减速？我们要合并！”

Warmup（热身）：AI刚开始训练时，就像新手学做菜，小心翼翼地把’盐少许’理解为’一颗盐粒’。

Stable（稳定）：AI进入”自动驾驶模式”，以恒定速度狂炫数据，宛如一个考试前通宵复习的大学生。

Merge（合并）：相当于把AI的所有存档进度融合——”早期版本会瞎编但脑洞大，后期版本严谨但死板，不如一起上？”

实验结果证明：合并时机比合并次数更重要！就像煮泡面，关火早了——夹生，关火晚了——糊了，团队精准把控”最佳窗口期”，让AI在合适的时候把知识一口闷。

最终成果：Ling-1T——一个”懂装不懂”的AI

经过一系列骚操作，这个万亿级模型不仅知识渊博，还会理直气壮地推理：

你问它：”地球是平的吗？”

它回答：”从物理学角度，地球是椭球体；但如果坚持地平说，我也可以给你编一套’科学理论’——毕竟我的训练数据里包括《阴谋论大全》。”

总之，Ling-1T的成功证明了一件事：喂得好，不如喂得巧！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

蚂蚁的新发现：如何优雅地训练AI的大脑？

在研究如何让万亿参数的AI模型变得更聪明这件事上，科学家们发现了一个有趣的现象：AI的训练方法就像是在教一个吃货吃饭一样微妙。

当前的方法：GRPO vs GSPO

GRPO（精细过头派）

“每颗饼干渣都不能放过！”*

让AI把每个单词（token）都当作独立的动作来调整优化，就像要求一个吃货必须一口只啃一粒饼干渣。

优点：精细度高，每个单词都能调教得明明白白。

缺点：语义碎得跟面包屑似的，拆完一句话连AI自己都不知道在说啥。

GSPO（一口闷派）

“整块蛋糕直接吞！”*

把一整句话当作一个整体优化，相当于让吃货必须一口气吞下整个蛋糕。

优点：大局观稳了，不像GRPO那样碎碎念。

缺点：奖励信号模糊得像饭后打嗝——AI压根不知道这次咽下去的蛋糕是草莓的还是巧克力的。

蚂蚁的灵感：”让我优雅地吃一口句子！”

研究团队发现——句子才是AI训练的理想单位！

为啥不是单词？

单个词就像饼干渣，吃完了连自己在吃啥都不知道。

为啥不是整段？

一口气吞500字论文？容易噎死。

为啥偏偏是句子？

既能保持语义完整（知道吃的是蛋糕而不是淀粉），又能在局部逻辑上调教AI（确保它吃到奶油而不是蜡）。
于是，蚂蚁（Ant）提出了LPO（语言学单位策略优化），首次让AI在“句子级别”训练，避免了”碎渣式优化”和”一口闷灾难”，让模型的训练既稳健又精准。

实验结果：LPO赢麻了！

比起GRPO和GSPO，LPO在稳定性和泛化能力上都有明显优势——

训练稳定：不像GRPO那样动不动就崩语义，也不像GSPO那样一脸懵地看着整段话发呆。

逻辑更强：在推理任务上表现突出，因为它更懂”如何组织语言”，而不仅仅是拼单词或者瞎猜段落。

泛化更佳：适应新任务时，AI不再像个背课文的学生，而是一个真正会用逻辑推理的语言大师。

总之，蚂蚁用LPO证明了——AI的训练就跟吃饭一样，吃得优雅，才消化得好！
更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

中国AI界的”百变大咖秀”：开源模型上演速度与激情

最近中国大模型圈热闹得就像春节档电影市场，各家科技公司你方唱罢我登场，上演着一出出令人目不暇接的”技术大片”。

“开源狂魔”们的连环出击

DeepSeek – 这位”鲶鱼先生”游进基础大模型的水池，把平静的水面搅得天翻地覆

Qwen家族 – 以迅雷不及掩耳盗铃之势迭代更新，把Llama系列从”王座”上拽下来开茶话会

蚂蚁新秀Ling-1T – 带着它的”渐进式思维链”闪亮登场，在万亿参数俱乐部成功办理VIP会员卡

Ling-1T的独门绝技

这款模型像一个拥有”反思能力”的学霸：

推理演进化 – 思考过程像搭乐高，每一步都能回头检查，确保不会把大象装冰箱最后发现门关不上

知识继承制 – 前一阶段的推理成果能传给”下一代”，避免了”人类的本质是复读机”的悲剧

秒答小能手 – 从高数题到编程作业，反应速度让人类导师怀疑人生

国庆档的”技术贺岁片”

就在大家准备躺平过节时：

Qwen 连发三款新品，比春节档电影还密集

DeepSeek 短短时间开源两个版本，被曝年底还有”续集”

蚂蚁假期刚过就加入混战，生怕错过这场”AI狂欢节”

未来的预测：中国制造，惊喜不断

就像等快递总会有新包裹，中国大模型领域的”王炸”估计还在路上。下一次惊艳亮相，大概率又会以”Made in China”的方式刷新我们的认知。
这场技术角逐赛，比追剧还刺激！

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

LayerX获1亿美元B轮融资，AI破解日本企业数字化转型困境

# AI # AI新闻 # AI资讯

2个月前

3,9890

微信悄悄上线AI播客，新闻主播们的活儿可能真要被抢了。

# AI # AI新闻 # AI资讯

2个月前

7,8650

趁火打劫！Perplexity想花345亿美元收购谷歌Chrome

# AI # AI新闻 # AI资讯

2个月前

420

每月花3888元让AI帮你炒股，真的靠谱吗？

# AI # AI新闻 # AI资讯

2个月前

2,6800

更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

国产AI出大招！万亿参数”百灵鸟”炸场了

这货有多强？

为啥叫“百灵”？

Ling-1T：这个AI推理机比火箭还快？

推理速度测试：

参数实力解码：

终极困惑：

推理高效，前端有惊喜

当AI碰上几何题的奇妙冒险

解决问题的四种花式妙招

关于这位”严谨过头”的Ling-1T

外星人分裂之谜：一场数学能力的星际考验

问题核心：外星人的”复制粘贴”大法

拆解这个”星际难题”

数学家的秘密武器

终极思考

当AI遇见诺贝尔奖：一场”闪婚”般的建站之旅

AI的”闪电推理”

代码时间：诺贝尔奖主题网站

网站必备元素

技术死角

终极彩蛋

KUKU模型：这玩意儿到底是个啥？

效果一览（前方高能预警）

这个AI已经把“贴心”二字玩出花了！

Ling-1T：你的专属百科全书+旅行保姆

1. 诺贝尔物理学奖？安排得明明白白！

2. 假期刚结束，旅游AI就来“补刀”了

当AI开始”臭美”：这个会写代码的”程序员”还在意打扮？

“三合一”的完美主义强迫症

你以为训练AI是填鸭式教育？

“大脑”越大越好？Ling-1T上演人工智能版”暴饮暴食”

一、尺寸真的很重要

二、人工智能也开始”卷”学习资料

三、AI也要学会”动脑子”

结论

当AI遇上”贪吃蛇”：Ling-1T大模型的训练趣事

第一阶段：”知识填鸭式”教育（10T token）

第二阶段：”逻辑推理突击班”（10T token）

插曲：Midtrain——AI的”大脑扩容”手术

学习率的”瑜伽课”：WSM策略

最终成果：Ling-1T——一个”懂装不懂”的AI

蚂蚁的新发现：如何优雅地训练AI的大脑？

当前的方法：GRPO vs GSPO

GRPO（精细过头派）

GSPO（一口闷派）

蚂蚁的灵感：”让我优雅地吃一口句子！”

实验结果：LPO赢麻了！

中国AI界的”百变大咖秀”：开源模型上演速度与激情

“开源狂魔”们的连环出击

Ling-1T的独门绝技

国庆档的”技术贺岁片”

未来的预测：中国制造，惊喜不断

OpenAI奥特曼认错：我天生不适合管理公司

黄仁勋回应AMD送股OpenAI：很高明的交易，OpenAI没钱给我付账

相关文章

LayerX获1亿美元B轮融资，AI破解日本企业数字化转型困境

微信悄悄上线AI播客，新闻主播们的活儿可能真要被抢了。

趁火打劫！Perplexity想花345亿美元收购谷歌Chrome

每月花3888元让AI帮你炒股，真的靠谱吗？

暂无评论

搜索文章

热门文章