9,281
0

4o-mini华人领队也离职了,这次不怪小扎

OpenAI又一位”AI武士”出走记

  • 重磅消息! 科技圈又上演了一出”奥特曼大战变形金刚”的大戏 —— OpenAI的强化学习大魔王*Kevin Lu刚办完4o-mini的庆功宴,转身就收拾键盘加入了前CTO的”思考机器实验室”(这名字听着就像要造终结者)。
  • 这位仁兄有多厉害?

  • 履历金光闪闪:主导发布4o-mini(你手机里的AI精灵)
  • 技术栈爆炸:专精强化学习(就是教AI打游戏打到职业选手哭的那种)
  • 项目狂魔:o1-mini和o3项目背后的男人(虽然型号听起来像奥迪车)
  • 新东家什么来头?

    由OpenAI前任CTOMira Murati创立(这位女士的离职曾让硅谷喝了三天咖啡压惊),公司已经估值:

  • 120亿美元!*
  • (够买6000万杯星巴克了,每天喝一杯能喝16438年)

    科技圈吃瓜群众表示

    “现在跳槽都按’几个小目标’计算了吗?””OpenAI这是第几个’前员工估值过百亿俱乐部’成员了?””所以下一个发布的AI会叫4o-max-pro-plus-ultra吗?”

  • 最新小道消息*:Kevin的离职邮件是用ChatGPT写的,最后一句是”我去帮Mira造更小的模型了,拜拜了您嘞~”
  • 4o-mini华人领队也离职了,这次不怪小扎

    技术大佬们的”复仇者联盟”?

    爆笑解析:Thinking Machine Lab最近似乎在偷偷搞事情!他们竟然像复仇者联盟集结一样,把一批OpenAI的大佬给”拐”了过来!让我们看看这个豪华阵容:

  • John Schulman:传说中的强化学习大神,OpenAI核心支柱之一,现在改行去当”思考机器”了?
  • Barrett Zoph:之前专攻大模型研究,你以为他在休假?不,他在琢磨更离谱的东西!
  • 翁荔:这位大神曾在OpenAI负责关键算法,现在大概觉得”思考机器”听起来比”开放AI”更带感?
  • 坊间传闻,这群人的聊天群名可能是:《我们曾是OpenAI,如今我们是Thinking Machine Lab,照样吊打一切》。
    总之,AI圈又开始了一场新的”复仇者联盟”级别的内卷,吃瓜群众可以搬好板凳准备看戏了!

    从Meta到OpenAI,再离开

    Kevin Lu的科技打怪升级之路

    从学霸到AI明星的奇妙旅程

    这位Kevin Lu同学可不是简单人物,人家从UC伯克利这个学术大佬幼儿园毕业后,就开始了开挂般的职业生涯:

  • 学霸时期的简历
  • 主攻强化学习(就是教会AI像打游戏一样不断升级)
  • 沉迷于离线序列数据建模(简单说就是让AI学会预测下个动作)
  • 职场打怪路线
  • 第一站:Hudson River Trading
  • (估计是去教AI玩股票去了 )

  • 第二站:Meta
  • (在扎克伯格的元宇宙里练习魔法 )

  • 终极挑战:OpenAI
  • (2024年3月加入,现在正和ChatGPT做邻居 )

    三个月搞大事!

  • 入职仅三个月就率领团队折腾出了个4o-mini*模型(这个名字听起来就像AI界的迷你裙一样可爱 ),这玩意儿有多厉害?
  • 多模态全面手:同时理解文字和图片(终于不用跟AI解释”看图说话”了)
  • 超长记忆:像老太太讲家族史一样能记住超长上下文
  • 速度与激情:比大模型跑得快,还更省钱(这不就是AI界的共享单车吗 )
  • 简而言之,Kevin Lu这哥们正带领团队折腾AI变形金刚,只不过变形后是一台既聪明又省电的计算器。我们拭目以待他下次又会给世界带来什么惊喜!
    4o-mini华人领队也离职了,这次不怪小扎

    这位AI大佬的”变形金刚”论文火出圈!

    你以为Transformer只能玩自然语言处理?这位大神直接让它”变身”成强化学习界的”擎天柱”!

    主打一个”浓缩就是精华”

  • 专攻小模型:人家玩的是”小而美”,O1-mini和O3在他手里跟乐高似的拼出了花样
  • 强化学习绝活哥:把游戏AI训练得比小学生背九九乘法表还熟练
  • 封神之作:《决策Transformer》

    (江湖人称”RL界ChatGPT前传”,2021年杀疯啦!)

  • 全明星阵容:UC伯克利+Meta+OpenAI+Google Brain的”复仇者联盟”出品
  • 2254次学术圈打卡:相当于每天都有6个教授边喝茶边引用
  • 核心黑科技
  • 把强化学习变成”填空题”——给机器看”标准答案”(回报值)
  • 让AI学会”画饼”:根据历史状态和动作,预测未来最优动作
  • 相当于教自动驾驶:”前面有坑记得绕,乘客吐了差评就没了!”
  • 说人话版原理

  • 先给AI看《三年游戏五年模拟》真题集(过去的状态动作序列)
  • 标出每道题的”参考答案得分”(回报值条件)
  • 最后考它:”这次要拿90分的话,下一步该按哪个键?”
  • 效果炸裂程度* ▶ 比用天气预报决定要不要带伞靠谱10086倍!
  • 注:本文数据截至2023年,不排除这位大神又偷偷憋了个更大的”变形金刚”4o-mini华人领队也离职了,这次不怪小扎

    “互联网是亲爹,Transformer只是干爹?”——论数据与技术谁更硬核

    观点1:Transformer不过是数据海洋里的”小渔船”

  • Transformer如今风头正盛,但Kevin Lu认为它被捧得太高,只是个”划水的”。
  • 核心问题在于——离开数据,Transformer就和没联网的老爷电脑一样废柴
  • 观点2:互联网才是真的”数据印钞机”

  • 互联网本质上是个超级数据流水线,每天产出的海量序列数据简直是AI的”免费自助餐”。
  • Kevin Lu主张:与其死磕Transformer架构,不如想想怎么更高效地”薅”互联网的羊毛
  • 观点3:别指望强化学习了,它已经”人到中年”

  • 强化学习(RL)现状:GPT-1到GPT-4式的飞跃?太难了!Kevin Lu直接建议:RL研究该歇歇了,该搞点真的能赚钱的东西
  • 可能的未来方向?创新奖励机制+新数据源,比如让AI学会”从海量互联网贴吧吵架中学习人类社会学”?
  • 总结:互联网 = 顶级buff,数据 = 硬通货

    技术再牛,不如互联网上的数据够野!Transformer再厉害,没数据=没戏。研究者们,别沉迷”调参炼丹”了,赶紧想想怎么让AI吃上更高质量的”数据饲料”吧!4o-mini华人领队也离职了,这次不怪小扎

    刚刚完成20亿美元种子轮融资

    Thinking Machine Lab:一个让硅谷大佬们”白送钱”都拒绝的神秘AI天团

    这个夏天,硅谷最劲爆的八卦莫过于:一群前OpenAI大佬组队开了家新公司,然后集体拒绝了马克·扎克伯格的10亿美元”诱惑套餐”

    豪华阵容:AI复仇者联盟

    Meet the team:

  • “ChatGPT之父” John Schulman(就是那个让你现在每天和AI聊天的”罪魁祸首”)
  • “AI安全卫士” 翁荔(专门防止AI哪天觉醒后把我们当宠物养)
  • “多模态魔术师” Alexander Kirillov(让AI不仅会说话还会看图的”跨界达人”)
  • 新鲜加入的“小模型大师” Kevin Lu(OpenAI前员工,专治各种AI”肥胖症”)
  • 亿万富翁们的烦恼:”这钱花不出去啊!”

    最新战报:

  • 种子轮估值120亿美元(比某些上市公司还值钱,尽管目前他们连个PPT都没对外发布)
  • 小扎豪掷10亿美元挖人,结果…全员已读不回(扎克伯格:第一次觉得钱这么没用)
  • 未解之谜:他们在憋什么大招?

    目前Thinking Machine Lab保持着神秘的风格:
    融资记录打破多项纪录
    团队成员个个是大佬
    拒绝天价offer
    实际产品:敬请期待
    业内专家表示:”这可能是史上最贵的’敬请期待’了。”
    注:本文改编自微信公众号”量子位”的报道,原作者明敏。本版本已去除所有可能引发AI觉醒危险的机密信息(开玩笑的)。

    © 版权声明

    相关文章