OpenAI又一位”AI武士”出走记
重磅消息! 科技圈又上演了一出”奥特曼大战变形金刚”的大戏 —— OpenAI的强化学习大魔王*Kevin Lu刚办完4o-mini的庆功宴,转身就收拾键盘加入了前CTO的”思考机器实验室”(这名字听着就像要造终结者)。 这位仁兄有多厉害?
履历金光闪闪:主导发布4o-mini(你手机里的AI精灵)技术栈爆炸:专精强化学习(就是教AI打游戏打到职业选手哭的那种)项目狂魔:o1-mini和o3项目背后的男人(虽然型号听起来像奥迪车) 新东家什么来头?
由OpenAI前任CTOMira Murati创立(这位女士的离职曾让硅谷喝了三天咖啡压惊),公司已经估值:
120亿美元!*(够买6000万杯星巴克了,每天喝一杯能喝16438年)
科技圈吃瓜群众表示
“现在跳槽都按’几个小目标’计算了吗?””OpenAI这是第几个’前员工估值过百亿俱乐部’成员了?””所以下一个发布的AI会叫4o-max-pro-plus-ultra吗?”
最新小道消息*:Kevin的离职邮件是用ChatGPT写的,最后一句是”我去帮Mira造更小的模型了,拜拜了您嘞~”
技术大佬们的”复仇者联盟”?
爆笑解析:Thinking Machine Lab最近似乎在偷偷搞事情!他们竟然像复仇者联盟集结一样,把一批OpenAI的大佬给”拐”了过来!让我们看看这个豪华阵容:
John Schulman:传说中的强化学习大神,OpenAI核心支柱之一,现在改行去当”思考机器”了?Barrett Zoph:之前专攻大模型研究,你以为他在休假?不,他在琢磨更离谱的东西!翁荔:这位大神曾在OpenAI负责关键算法,现在大概觉得”思考机器”听起来比”开放AI”更带感?坊间传闻,这群人的聊天群名可能是:《我们曾是OpenAI,如今我们是Thinking Machine Lab,照样吊打一切》。
总之,AI圈又开始了一场新的”复仇者联盟”级别的内卷,吃瓜群众可以搬好板凳准备看戏了!
从Meta到OpenAI,再离开
Kevin Lu的科技打怪升级之路
从学霸到AI明星的奇妙旅程
这位Kevin Lu同学可不是简单人物,人家从UC伯克利这个学术大佬幼儿园毕业后,就开始了开挂般的职业生涯:
学霸时期的简历主攻强化学习(就是教会AI像打游戏一样不断升级)沉迷于离线序列数据建模(简单说就是让AI学会预测下个动作)职场打怪路线第一站:Hudson River Trading (估计是去教AI玩股票去了 )
第二站:Meta (在扎克伯格的元宇宙里练习魔法 )
终极挑战:OpenAI (2024年3月加入,现在正和ChatGPT做邻居 )
三个月搞大事!
入职仅三个月就率领团队折腾出了个4o-mini*模型(这个名字听起来就像AI界的迷你裙一样可爱 ),这玩意儿有多厉害?多模态全面手:同时理解文字和图片(终于不用跟AI解释”看图说话”了)超长记忆:像老太太讲家族史一样能记住超长上下文速度与激情:比大模型跑得快,还更省钱(这不就是AI界的共享单车吗 )简而言之,Kevin Lu这哥们正带领团队折腾AI变形金刚,只不过变形后是一台既聪明又省电的计算器。我们拭目以待他下次又会给世界带来什么惊喜!

这位AI大佬的”变形金刚”论文火出圈!
你以为Transformer只能玩自然语言处理?这位大神直接让它”变身”成强化学习界的”擎天柱”!
主打一个”浓缩就是精华”
专攻小模型:人家玩的是”小而美”,O1-mini和O3在他手里跟乐高似的拼出了花样强化学习绝活哥:把游戏AI训练得比小学生背九九乘法表还熟练封神之作:《决策Transformer》
(江湖人称”RL界ChatGPT前传”,2021年杀疯啦!)
全明星阵容:UC伯克利+Meta+OpenAI+Google Brain的”复仇者联盟”出品2254次学术圈打卡:相当于每天都有6个教授边喝茶边引用核心黑科技:把强化学习变成”填空题”——给机器看”标准答案”(回报值)让AI学会”画饼”:根据历史状态和动作,预测未来最优动作相当于教自动驾驶:”前面有坑记得绕,乘客吐了差评就没了!”说人话版原理
先给AI看《三年游戏五年模拟》真题集(过去的状态动作序列)标出每道题的”参考答案得分”(回报值条件)最后考它:”这次要拿90分的话,下一步该按哪个键?”效果炸裂程度* ▶ 比用天气预报决定要不要带伞靠谱10086倍!注:本文数据截至2023年,不排除这位大神又偷偷憋了个更大的”变形金刚”
“互联网是亲爹,Transformer只是干爹?”——论数据与技术谁更硬核
观点1:Transformer不过是数据海洋里的”小渔船”
Transformer如今风头正盛,但Kevin Lu认为它被捧得太高,只是个”划水的”。核心问题在于——离开数据,Transformer就和没联网的老爷电脑一样废柴。观点2:互联网才是真的”数据印钞机”
互联网本质上是个超级数据流水线,每天产出的海量序列数据简直是AI的”免费自助餐”。Kevin Lu主张:与其死磕Transformer架构,不如想想怎么更高效地”薅”互联网的羊毛。观点3:别指望强化学习了,它已经”人到中年”
强化学习(RL)现状:GPT-1到GPT-4式的飞跃?太难了!Kevin Lu直接建议:RL研究该歇歇了,该搞点真的能赚钱的东西。可能的未来方向?创新奖励机制+新数据源,比如让AI学会”从海量互联网贴吧吵架中学习人类社会学”?总结:互联网 = 顶级buff,数据 = 硬通货
技术再牛,不如互联网上的数据够野!Transformer再厉害,没数据=没戏。研究者们,别沉迷”调参炼丹”了,赶紧想想怎么让AI吃上更高质量的”数据饲料”吧!
刚刚完成20亿美元种子轮融资
Thinking Machine Lab:一个让硅谷大佬们”白送钱”都拒绝的神秘AI天团
这个夏天,硅谷最劲爆的八卦莫过于:一群前OpenAI大佬组队开了家新公司,然后集体拒绝了马克·扎克伯格的10亿美元”诱惑套餐”。
豪华阵容:AI复仇者联盟
Meet the team:
“ChatGPT之父” John Schulman(就是那个让你现在每天和AI聊天的”罪魁祸首”)“AI安全卫士” 翁荔(专门防止AI哪天觉醒后把我们当宠物养)“多模态魔术师” Alexander Kirillov(让AI不仅会说话还会看图的”跨界达人”)新鲜加入的“小模型大师” Kevin Lu(OpenAI前员工,专治各种AI”肥胖症”)亿万富翁们的烦恼:”这钱花不出去啊!”
最新战报:
种子轮估值120亿美元(比某些上市公司还值钱,尽管目前他们连个PPT都没对外发布)小扎豪掷10亿美元挖人,结果…全员已读不回(扎克伯格:第一次觉得钱这么没用)未解之谜:他们在憋什么大招?
目前Thinking Machine Lab保持着神秘的风格:
融资记录打破多项纪录
团队成员个个是大佬
拒绝天价offer
实际产品:敬请期待
业内专家表示:”这可能是史上最贵的’敬请期待’了。”
注:本文改编自微信公众号”量子位”的报道,原作者明敏。本版本已去除所有可能引发AI觉醒危险的机密信息(开玩笑的)。
© 版权声明
本站部分内容来源于互联网,仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有,如涉及版权问题,请及时与本站联系,我们将在第一时间核实并处理。