4o-mini华人领队也离职了，这次不怪小扎

AI资讯2个月前发布云知AI运营官

OpenAI又一位”AI武士”出走记

重磅消息！ 科技圈又上演了一出”奥特曼大战变形金刚”的大戏 —— OpenAI的强化学习大魔王*Kevin Lu刚办完4o-mini的庆功宴，转身就收拾键盘加入了前CTO的”思考机器实验室”（这名字听着就像要造终结者）。

这位仁兄有多厉害？

履历金光闪闪：主导发布4o-mini（你手机里的AI精灵）

技术栈爆炸：专精强化学习（就是教AI打游戏打到职业选手哭的那种）

项目狂魔：o1-mini和o3项目背后的男人（虽然型号听起来像奥迪车）

新东家什么来头？

由OpenAI前任CTOMira Murati创立（这位女士的离职曾让硅谷喝了三天咖啡压惊），公司已经估值：

120亿美元！*

（够买6000万杯星巴克了，每天喝一杯能喝16438年）

科技圈吃瓜群众表示

“现在跳槽都按’几个小目标’计算了吗？””OpenAI这是第几个’前员工估值过百亿俱乐部’成员了？””所以下一个发布的AI会叫4o-max-pro-plus-ultra吗？”

最新小道消息*：Kevin的离职邮件是用ChatGPT写的，最后一句是”我去帮Mira造更小的模型了，拜拜了您嘞~”

4o-mini华人领队也离职了，这次不怪小扎

技术大佬们的”复仇者联盟”？

爆笑解析：Thinking Machine Lab最近似乎在偷偷搞事情！他们竟然像复仇者联盟集结一样，把一批OpenAI的大佬给”拐”了过来！让我们看看这个豪华阵容：

John Schulman：传说中的强化学习大神，OpenAI核心支柱之一，现在改行去当”思考机器”了？

Barrett Zoph：之前专攻大模型研究，你以为他在休假？不，他在琢磨更离谱的东西！

翁荔：这位大神曾在OpenAI负责关键算法，现在大概觉得”思考机器”听起来比”开放AI”更带感？

坊间传闻，这群人的聊天群名可能是：《我们曾是OpenAI，如今我们是Thinking Machine Lab，照样吊打一切》。
总之，AI圈又开始了一场新的”复仇者联盟”级别的内卷，吃瓜群众可以搬好板凳准备看戏了！

从Meta到OpenAI，再离开

Kevin Lu的科技打怪升级之路

从学霸到AI明星的奇妙旅程

这位Kevin Lu同学可不是简单人物，人家从UC伯克利这个学术大佬幼儿园毕业后，就开始了开挂般的职业生涯：

学霸时期的简历

主攻强化学习（就是教会AI像打游戏一样不断升级）

沉迷于离线序列数据建模（简单说就是让AI学会预测下个动作）

职场打怪路线

第一站：Hudson River Trading

（估计是去教AI玩股票去了）

第二站：Meta

（在扎克伯格的元宇宙里练习魔法）

终极挑战：OpenAI

（2024年3月加入，现在正和ChatGPT做邻居）

三个月搞大事！

入职仅三个月就率领团队折腾出了个4o-mini*模型（这个名字听起来就像AI界的迷你裙一样可爱），这玩意儿有多厉害？

多模态全面手：同时理解文字和图片（终于不用跟AI解释”看图说话”了）

超长记忆：像老太太讲家族史一样能记住超长上下文

速度与激情：比大模型跑得快，还更省钱（这不就是AI界的共享单车吗）

简而言之，Kevin Lu这哥们正带领团队折腾AI变形金刚，只不过变形后是一台既聪明又省电的计算器。我们拭目以待他下次又会给世界带来什么惊喜！
4o-mini华人领队也离职了，这次不怪小扎

这位AI大佬的”变形金刚”论文火出圈！

你以为Transformer只能玩自然语言处理？这位大神直接让它”变身”成强化学习界的”擎天柱”！

主打一个”浓缩就是精华”

专攻小模型：人家玩的是”小而美”，O1-mini和O3在他手里跟乐高似的拼出了花样

强化学习绝活哥：把游戏AI训练得比小学生背九九乘法表还熟练

封神之作：《决策Transformer》

（江湖人称”RL界ChatGPT前传”，2021年杀疯啦！）

全明星阵容：UC伯克利+Meta+OpenAI+Google Brain的”复仇者联盟”出品

2254次学术圈打卡：相当于每天都有6个教授边喝茶边引用

核心黑科技：

把强化学习变成”填空题”——给机器看”标准答案”（回报值）

让AI学会”画饼”：根据历史状态和动作，预测未来最优动作

相当于教自动驾驶：”前面有坑记得绕，乘客吐了差评就没了！”

说人话版原理

先给AI看《三年游戏五年模拟》真题集（过去的状态动作序列）

标出每道题的”参考答案得分”（回报值条件）

最后考它：”这次要拿90分的话，下一步该按哪个键？”

效果炸裂程度* ▶ 比用天气预报决定要不要带伞靠谱10086倍！

注：本文数据截至2023年，不排除这位大神又偷偷憋了个更大的”变形金刚” 4o-mini华人领队也离职了，这次不怪小扎

“互联网是亲爹，Transformer只是干爹？”——论数据与技术谁更硬核

观点1：Transformer不过是数据海洋里的”小渔船”

Transformer如今风头正盛，但Kevin Lu认为它被捧得太高，只是个”划水的”。

核心问题在于——离开数据，Transformer就和没联网的老爷电脑一样废柴。

观点2：互联网才是真的”数据印钞机”

互联网本质上是个超级数据流水线，每天产出的海量序列数据简直是AI的”免费自助餐”。

Kevin Lu主张：与其死磕Transformer架构，不如想想怎么更高效地”薅”互联网的羊毛。

观点3：别指望强化学习了，它已经”人到中年”

强化学习（RL）现状：GPT-1到GPT-4式的飞跃？太难了！Kevin Lu直接建议：RL研究该歇歇了，该搞点真的能赚钱的东西。

可能的未来方向？创新奖励机制+新数据源，比如让AI学会”从海量互联网贴吧吵架中学习人类社会学”？

总结：互联网 = 顶级buff，数据 = 硬通货

技术再牛，不如互联网上的数据够野！Transformer再厉害，没数据=没戏。研究者们，别沉迷”调参炼丹”了，赶紧想想怎么让AI吃上更高质量的”数据饲料”吧！ 4o-mini华人领队也离职了，这次不怪小扎

刚刚完成20亿美元种子轮融资

Thinking Machine Lab：一个让硅谷大佬们”白送钱”都拒绝的神秘AI天团

这个夏天，硅谷最劲爆的八卦莫过于：一群前OpenAI大佬组队开了家新公司，然后集体拒绝了马克·扎克伯格的10亿美元”诱惑套餐”。

豪华阵容：AI复仇者联盟

Meet the team：

“ChatGPT之父” John Schulman（就是那个让你现在每天和AI聊天的”罪魁祸首”）

“AI安全卫士” 翁荔（专门防止AI哪天觉醒后把我们当宠物养）

“多模态魔术师” Alexander Kirillov（让AI不仅会说话还会看图的”跨界达人”）

新鲜加入的“小模型大师” Kevin Lu（OpenAI前员工，专治各种AI”肥胖症”）

亿万富翁们的烦恼：”这钱花不出去啊！”

未解之谜：他们在憋什么大招？

目前Thinking Machine Lab保持着神秘的风格：
融资记录打破多项纪录
团队成员个个是大佬
拒绝天价offer
实际产品：敬请期待
业内专家表示：”这可能是史上最贵的’敬请期待’了。”
注：本文改编自微信公众号”量子位”的报道，原作者明敏。本版本已去除所有可能引发AI觉醒危险的机密信息（开玩笑的）。