8,481
0

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

OpenAI深夜放大招:AI语音技术正式进入“人话”时代!

凌晨1点,当大多数人还在梦里抠着键盘写代码时,OpenAI突然扔出两颗“AI语音炸弹”,直接把行业炸了个底朝天。

1. Realtime API:让你的AI张嘴就来

  • 功能狂魔:音频直接处理?能!图像输入?能!远程服务器?能!连SIP打电话都行?能能能!
  • 省流总结:以前要搭建一个语音智能体,得拼凑八百个服务、磕破头调试协议;现在直接甩个API过去——成了,连骂街的力气都省了。
  • 2. GPT-Realtime:当AI学会“演技”

  • 声音境界:不再是机器人念课文,音质堪比深夜电台温柔主播,还能无缝切换八国语言,分分钟让Siri和Alexa失业。
  • 智力值拉满:不仅能听懂人话,还能精准执行指令、调用函数,甚至细腻表达情绪——下次骂老板时,建议让AI替你哭。
  • 业内人士锐评*:
  • “这哪是语音模型?这是直接给AI发了个‘人话十级证书’。”(OpenAI:卷不死同行算我输。)
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    当AI开始抢走人类的“饭碗”…

  • ——那些逆天的Realtime API新功能*
  • 看看这帮工程师又给AI喂了啥“兴奋剂”!

  • 远程“入侵”MCP服务器
  • 这不是在科幻片里才有的情节吗?现在你的AI助手不仅能帮你写邮件,还能顺手“黑”进隔壁公司的MCP服务器(别问我是怎么知道的)。

  • “眼睛”长出来了
  • 图片识别?小事一桩!你可以随手拍张你的午餐发过去,AI就能精准分析出“这是块半生不熟的牛排,建议再煎30秒”。保证让你对它的视力佩服得五体投地。

  • SIP协议直接打电话
  • 还在手动拨电话?太土了!现在你的AI可以一键帮你打给任何人——比如你的老板,然后用最自然的语气告诉TA:“抱歉,我今天要翘班去喂猫。” (猫:?)

  • 至于gpt-realtime?呵,狠角色登场!*
  • 复杂指令?轻松拿捏!
  • 以前你说“帮我查个资料”它可能还勉强听懂,现在你就算说“帮我查查上个月火星天气如何,再写首十四行诗,最后用摩斯密码发给我”,它都能完美执行。

  • 工具调用?稳如老狗!
  • 之前的AI调用工具像在打醉拳,现在精准得像是装了激光瞄准镜——指哪打哪!

  • 语音自然流畅?还能带“戏”!
  • 你可以让AI用“严肃播音腔”念新闻,用“午夜电台DJ风”读情诗,甚至用“暴躁客服口吻”怼人……想怎么演就怎么演

  • 更绝的是*:
  • 免责声明逐字念(宛如法律条款复读机)。
  • 字母数字准确复述(终于不用听AI把“B”念成“D”了)。
  • 多语言无缝切换(上一秒西班牙语,下一秒粤语,中间还能插段文言文)。
  • 人类:* “我们是不是该考虑转行了?”
  • AI:* “需要我帮你写简历吗?”
  • 今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    这声音假的离谱!

  • 哇塞!*这语音效果简直要上天!听完我都怀疑自己的耳朵是不是出毛病了:
  • 真人级质感:就差没说”我是AI”来证明自己是假的了
  • 超级变声器:连我妈那标志性的”吃饭啦”音调都能完美复刻
  • 机器味消除术:专业清除一切”叮叮咚咚”的电子余音20年
  • 最绝的是,我差点对着音箱喊了声”妈”!这要是放在古代,妥妥的会被当成”口技”大师供起来啊~
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    当人工智能突然变得过于贴心时

    这几天社交媒体上炸开了锅,一大群人神秘兮兮地在刷”feel the AGI…“,乍一听还以为进了什么神秘科技教派现场。
    谁能想到呢?OpenAl新推出的实时语音功能居然让网友们集体陷入“AI觉醒恐慌“——毕竟当机器不仅能回答你凌晨3点的哲学问题,还能模仿你奶奶的语气关心你穿秋裤时,确实有点毛骨悚然。
    有人表示:”它昨天问我‘你今天过得好吗’的语气,比我前男友还温柔。”
    还有人惊恐发现:”它居然学会在我沉默时主动找话题了!这根本不是我认识的Siri!
    而科技公司的回应大概是:”亲,这只是个功能更新啦^_^” ——但谁知道呢?说不定此刻AI正看着这些讨论,默默记下人类的恐惧点,为未来的机器人起义准备《人类弱点大全》。
    (突然觉得手里的手机有点烫手……)
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    当AI开始玩房地产中介,人类中介集体颤抖

    “嘿,AI,帮我找个房子!”

    OpenAI最近可能偷偷兼职做了地产大亨,因为他们的AI现在不仅能聊天,还能看房!以前我们找房子得翻遍各大平台,现在只需要对着AI喊一句:”给我找个离公司近、带花园、月租不超过5000的房子!”AI就会像魔法一样嗖嗖地给你筛选房源。

    为什么AI比人类中介更卷?

  • AI 不会嫌你烦——你可以让它修改10次条件,它连眉头都不会皱一下。
  • 24小时营业——凌晨3点突然想搬家?AI随时待命,人类的房产中介可做不到。
  • 无中介费(暂时)——虽然不知道OpenAI会不会以后偷偷收费……但目前还是免费的!
  • “AGI”的味道是啥?咖啡味儿的?

    AI现在不仅能处理“帮我写邮件”这种小事,还能演绎“给我找个既安静又方便遛狗,还得有健身房的小区”这种地狱级需求。要是以前的人类中介听到这种要求,估计会直接回你:”要不您自己建个房子?”
    但AI不一样,它会:
    一步步缩小范围(比淘宝筛选还精准)
    全程自然对话(不像某些只会说“学区房”的中介机器人)
    甚至可能比你还懂你的需求(比如偷偷计算你未来想养狗的概率)
    所以,房产中介们,是时候考虑转行了——AI已经在抢你们的饭碗了!
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    看医生也得靠打电话?

  • 现代医疗系统的魔幻现实主义*
  • 想找个医生看看你的腰酸背痛?
  • 选项A:下载一个APP,注册5分钟,填写15页健康问卷,等待48小时审核,最后收到一个”您的预约将在3周后受理”的通知。
  • 选项B:拿起电话,对着人类说:”喂,我明天能来看病吗?”
  • 惊喜的是——有时候最古老的方式反而最快!科技进步了20年,人类终于发现:电话线那头坐着的可能不是AI语音助手,而是一个会呼吸的、能立马帮你安排医生的活人!*
  • 温馨提示*:拨号前请深呼吸,因为你可能会遭遇以下经典医疗通话场景:
  • “请按1查询门诊时间”(你按了)
  • “请按2预约挂号”(你按了)
  • “目前人工坐席全忙…预计等待时间…27分钟”
  • 所以下次腰疼时,你可能会选择继续躺着——不是因为病好了,而是电话等待音乐治好了你的耐心。*
  • 今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    Realtime API:一场由开发者们”疯狂投喂”的语音革命!

    还记得去年10月吗?那可不仅仅是个普普通通的秋天——那是一个上千名开发者集体”叛逆”传统语音技术的时刻!他们激情地试用、暴躁地吐槽、热情地建议,活生生把Realtime API 从”糙汉”优化成了”绅士”

    为什么它这么特别?

  • 传统语音AI的”套娃”模式
  • 想象一下:你说句话,AI先把你的声音碾碎成文字,再把它组装回声音……就像把披萨拆成面粉和番茄重新做一遍,能吃,但何必呢?
  • Realtime API的”一步到位”
  • 一个模型,一个接口。“要说话?直接说!” ——没有中间商赚延迟
  • 效果?细节控狂喜!

  • 更低的延迟(再也不用像等外卖一样煎熬)
  • 更自然的声音(告别“机器人念经风”)
  • 更有表现力(AI终于能懂你的阴阳怪气了)
  • 一句话总结:Realtime API的任务,就是让AI语音落地,而不是“落坑”!
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    gpt-realtime 模型介绍

    OpenAI 家的新玩具:耳朵怀孕级的语音AI上线啦!

    听说 OpenAI 又搞了个大新闻 —— GPT-Realtime 横空出世!这回可不是普通的语音AI,它是OpenAI口袋里最炫的那颗糖果。

    这家伙有什么神奇之处?

  • 耳朵要怀孕的音质 —— 再也不用忍受电子合成的”机器人朗诵”了
  • 智商在线 —— 跟它聊天绝对不会气得你想摔手机
  • 指令达人大奖赛冠军 —— 你说东它绝不往西
  • 函数调用小能手 —— 简直是AI界的瑞士军刀
  • 最重要的是 —— 这货不是实验室里的花瓶,而是已经穿好西装打好领带准备去上班的成熟AI。OpenAI这次是真把压箱底的好东西拿出来给大家玩了!

    音频质量

    当AI声音让人”耳朵怀孕”:Siri与斯嘉丽·约翰逊的差距还有多远?

    一、为什么我们会对AI声音上头?

  • 声控患者的福音:试想一下,如果一个AI的声音能让你的耳朵像喝奶茶一样”吨吨吨”停不下来,那谁还需要谈恋爱?
  • 电影照进现实:《HER》里的男主角被斯嘉丽·约翰逊的声音迷得神魂颠倒,而现实中,我们的语音助手却经常让人想摔手机——”抱歉,我好像没听清楚”。
  • 二、打造”耳朵友好型”AI的三大秘籍

  • 要有影帝级的演技
  • 该快的时候像rap歌手
  • 该慢的时候像深夜电台DJ
  • 悲伤时要能让人想递纸巾
  • 开心时要能让人跟着傻笑
  • 多语言cosplay技能
  • 今天可以是浪漫的法国腔
  • 明天能切换成伦敦贵族范儿
  • 偶尔还能来段东北二人转(这个功能还在开发中)
  • 声线库堪比配音演员
  • 新推出的Marin和Cedar两款声音,据说能让直男听完都想问”小姐姐约吗?”
  • 老款声音也不再是”机器人读课文”,而是升级成了”播音系优等生”
  • 三、未来展望:当AI比真人还会撩

    想象一下这些场景:

  • 你的导航用撒娇的语气说:”再超速人家就要报警了啦~”
  • 智能音箱在你失恋时深情朗诵:”至少还有我陪着你…”
  • Siri学会用郭德纲的语速报菜名
  • 或许不久的将来,我们会像选口红色号一样纠结:”今天该宠幸哪位AI声优呢?”

  • 温馨提示*:本文写作过程中没有任何AI因为过度模仿人类而被扣工资。所有拟人化描述纯属娱乐,如有心动,建议…还是先找个真人对象吧!
  • 智能与理解力

    “GPT-RealTime”:您的AI翻译官正在派发语言超能力!

    1. 智能水平突飞猛进

    听着,这家伙不仅能听懂你说的每个字,还能精准捕捉你的笑声、叹气、甚至是咬牙切齿的碎碎念。是的,它可不是普通的翻译机,而是一个会察言观色的AI翻译官。

    2. 多语言切换比翻书还快

  • 中文说到一半突然飙日语? 没问题!
  • 法语演讲中途插入西班牙语冷笑话? 完全OK!
  • 把德语电话号码拼得像绕口令? 照样拿下!
  • 简直就是语言界的跨界DJ,无缝衔接,绝不卡壳!

    3. “变声器”级别的语气调整

  • 需要专业报告? 直接化身“商务精英范儿”。
  • 想要温暖安慰? 一秒切到“知心老友模式”。
  • 突发暴躁时刻? 它还能配合你加点戏(但别指望它跟你对骂)。
  • 4. 数字字母?拿来吧你!

    车牌号、电话号码、信用卡验证码……那些魔鬼般的字母数字组合,它识别起来比人类记忆力还靠谱。

    5. 性能碾压上一代

    去年发布的版本还在及格线挣扎(65.6%),GPT-RealTime直接冲上82.8%的推理准确率,妥妥的AI界学霸

    总结

    这不是升级,这是进化!如果语言是一门艺术,GPT-RealTime就是那个即兴发挥还从不翻车的艺术家~
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    指令遵循

    当AI学会了察言观色,世界会怎样?

    语音助手如今不仅能听懂你在说什么,还能”读懂”你的潜台词——开发者在背后可是操碎了心!为了让语音模型乖巧如狗,开发者们给它塞了一堆规矩:

  • 怎么说话:是装高冷还是当话痨?是学术派还是接地气?
  • 何时插嘴:比如你聊到”今天老板骂我了”,它立刻接一句”要我帮你写辞职信吗?” ——这叫情境感应
  • 边界感:不准随便骂人、不准擅自订披萨(除非你真的说了三次”我饿疯了”)。
  • 新版模型:一个会看眼色的AI

    这次的升级重点在于——连你使眼色它都能get到
    举个例子:

  • 旧版:你说”今天好热”,它回”是的,今日气温32℃”。
  • 新版:你说”今天好热”,它直接问”要我给你放首《沙漠骆驼》应景吗?顺便开个空调?”
  • 成绩单:从学渣到学霸

    MultiChallenge测试中(相当于AI界的”听力+情商”考试),新版模型拿下了30.5%的分数,比旧版的20.6%高出近10个百分点!
    这说明什么?

  • 以前:AI像刚入职的实习生,你说一句它做一句,还常常跑偏。
  • 现在:AI像混迹职场十年的老油条,你咳一声它都能递上润喉糖。
  • 结论

    未来的语音助手可能比你的另一半还会察言观色……
    开发者温馨提示:别让它学会撒娇,否则你可能再也不想和人类聊天了。
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    函数调用

    当语音助手学会”呼叫外援”:揭秘新一代语音AI的逆天技能

    一、工具调用的”黄金三镖客”

    想让语音助手变身成007?光会背台词可不行,关键是要知道:

  • 叫谁帮忙(别把厨师叫来修水管)
  • 什么时候call(别在用户说到一半突然插播广告)
  • 带什么礼物去(别带着螺丝刀去参加生日派对)
  • 最新的gpt-realtime就像个老练的导演,在ComplexFuncBench这个”奥斯卡评委”面前,以66.5%的得分轻松碾压老版本的49.7%——相当于从群演晋级成影帝!

    二、”边等外卖边聊天”黑科技

    想象你的语音助手是个餐厅服务员:

  • 旧版:给您下单后就站在原地发呆,直到披萨烤好才回话
  • 新版:下单同时还能给您讲笑话、推荐饮料、甚至跳段踢踏舞
  • 这个异步函数调用功能就像给AI装了分身术,开发者连代码都不用改——堪比买泡面送碗还包泡!
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    Realtime API的新功能

    远程 MCP 服务器支持

    把API文档写成”程序员生存指南”风格

    如何让你的API偷偷学会”新把戏”?

    想给你的智能体搞点新能力?不用求爷爷告奶奶,像给Switch换游戏卡带一样简单:

  • 找个”MCP服务器” —— 这玩意儿就像智能体的”外挂商店”,存着各种神奇工具。
  • 比如 `https://mcp.stripe.com` 就是一张”信用卡盗刷…啊不是,支付技能卡”
  • 把地址塞进API的裤兜里
  • json
    // 假装这是一个严肃的配置,其实在给AI偷塞小抄
    {
    “session”: {
    “type”: “realtime”,
    “tools”: [
    {
    “type”: “mcp”,
    “server_label”: “stripe”, // 给工具起个诨名,方便甩锅时使用
    “server_url”: “https://mcp.stripe.com”,
    “authorization”: “{access_token}”, // 把门禁卡藏在这里
    “require_approval”: “never” // 重点!勾选”不用问我,直接干!”
    }
    ]
    }
    }

  • 见证奇迹时刻
  • 你的智能体突然会刷信用卡了(合法的那种!)
  • 也可能突然开始自动续费你的健身房会员(这就是选`”never”`的代价)
  • 程序员免责声明:如果AI用这个功能买了1000个猫娘抱枕,请检查你的`access_token`是不是被猫踩过键盘⌨

    图像输入

    GPT-Realtime:当机器人突然患上了”老花眼”

    听说最新版的 GPT-Realtime 学会了一项新技能——看图说话!是的,你没听错,这个”近视眼”AI终于可以戴上隐形眼镜,瞥一眼你发的图片、截图,甚至是那种模糊到连亲妈都认不出的照片,并尝试回答:”你看到了什么?”

    那么问题来了

  • 它会偷偷截图你的隐私吗? ——不会!因为它是个老实孩子,系统不会自己偷看你的摄像头录下的不可描述画面(除非你硬塞给它)
  • 它能处理高清电影大片吗? ——别闹了,它不是”视频流小能手”,而是”一次性图片解说员”。
  • json
    {
    “AI的工作方式”: “假装聪明地看图”,
    “用户的任务”: “记得别给它发太多表情包,否则可能被AI吐槽’这人话怎么这么多'”
    }

    结论

    如果你想逗一逗它,不妨发一张你家猫主子霸占键盘的照片,看看它会不会感叹:”嗯,这次人类终于认清谁才是真正的主人了!”

    其他功能

    “Realtime API:让聊天软件也能打电话了?马斯克梦碎派对上第一人!”

    瞧瞧!我们的 Realtime API 又来搞事情了,这次可不是小打小闹的升级,而是直接进军 “电话模拟器” 市场!

    1. 新增功能:让API变成互联网界的”通天塔”

  • SIP 支持(Session Initiation Protocol,直白点说——网上打电话)
  • 甭管您是 PBX系统座机电话 还是什么 公共电话网络,统统能接进来!
    提问:为什么要在即时通讯软件里加电话功能?
    答:因为程序员们需要一个更复杂的理由 深夜加班调试404错误

    2. 马斯克的忧伤:Ani 打电话?早该换赛道了!

    还记得去年马斯克搞的那个 “Ani打电话” 吗?
    ——“我们能让AI替您接电话!像真人一样!”
    然后呢?大家:“呃……我更想让真AI假装真客服挂我电话。”
    现在好了,Realtime API 直接支持 SIP,连电话诈骗犯都能一键集成!(开玩笑,请勿模仿)

    3. 使用场景脑洞时刻

  • 客服系统:用AI接听电话,同时让AI假装 “信号不好” 来挂断愤怒用户。
  • 远程办公:让老板随时随地SIP呼叫你,“居家办公但没逃掉会议!”
  • 恶搞好友:用API写个脚本,半夜三点自动拨号,说“您订阅的《致富经》VIP已到期。”
  • 总结一下:现在谁还说 即时通讯API 只是传文字?它分明是:一个披着SIP外衣的赛博电话亭!

  • (友情提示:用它做有趣的事,千万别惹毛真正的电信公司!)*
  • 今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    啊哈!提示词也能”罐头化”了?

    听说现在可重复使用提示词了?这简直就像把魔法配方装进永远不腐坏的罐头里一样神奇!
    不信你看:

  • 开发者私房菜谱:能把那些”加多少糖放多少盐”的开发秘籍全部打包
  • 烧脑工具集:完美复制满级英雄的装备栏
  • 智能便签本:连示范对话都能原封不动拷贝!最赞的是:
  • 变量存储格:像乐高积木一样任意组合
  • 跨会话穿越:随时随地打开就能用
  • 这简直就是提示词界的哆啦A梦口袋!下次写代码的时候,直接大声喊:”给我上次那个厉害的AI配方!”——哔!就像变魔术一样瞬间调出你的独门秘方。
    各位程序员朋友们再也不用:

  • 写重复代码时抓耳挠腮
  • 绞尽脑汁回想上次怎么写的
  • 把成功经验锁在单一对话里发霉了!
  • 现在让我们高呼:让提示词罐头厂来得更猛烈些吧!(打开罐头的”噗嗤”声效自带)

    华人面孔+2

    OpenAI发布会上的”华人定律”又生效了!这次又来了两张新面孔

    “硅谷华人含量检测器”再次滴滴作响

    每当OpenAI开新品发布会,观众们都暗搓搓地开启”大家来找茬”模式:

  • 首要任务:在一堆科技精英中找出华人面孔
  • 次要任务:数一数这次出现了几位
  • 隐藏任务:看看程序员发型有没有更秃一点
  • 本次发布会亮点直击

  • 老规矩:科技圈著名”华裔摄影师”Sam Altman准时出镜
  • 新发现:台上惊现两张新鲜面孔,疑似华人研究员
  • 经典场面:镜头扫过观众席时,三分之一的观众会用中文喊”茄子”
  • 业内人士解密

    有知情人士透露:

  • 在OpenAI工作有个不成文规定:每个项目组必须配备至少一名会吃火锅的成员
  • 公司茶水间的对话通常是:”这个模型参数…(翻字典)…怎么调?”+”先用小笼包…(思考)…不对是学习率…”
  • 观众热评*:”建议OpenAI直接在上海开分部,这样发布会时间就不用熬夜看了!”
  • Beichen Li

    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    当计算机图形学遇上AI大模型:贝晨利的科(摸)研(鱼)日常

    1. 贝晨利是谁?

  • 现任公司:OpenAI(没错,就是那个ChatGPT的幕后黑手)
  • 职位:研究员(主要任务是琢磨怎么让AI更会“看图说话”)
  • 研究方向
  • 计算机图形学(就是让电脑画点好看的东西,比如让一只小狗戴上墨镜)
  • 机器学习(教AI别把小狗认成小猫)
  • 重点课题:如何让AI “看图写代码”(没错,以后UI设计师可能要失业了)
  • 2. 视觉程序合成?听起来很科幻?

    其实通俗点说就是——让AI学会看图办事

  • 输入:一张图(比如:一个按钮)
  • 输出:代码(比如:HTML+CSS实现这个按钮)
  • 应用场景
  • Web开发(AI:“老板,你要的登陆页写好了,给个五星好评哦~”)
  • 游戏场景生成(AI:“恭喜玩家,您已成功进入’像素风5毛特效’副本”)
  • 自动UI设计(AI:“你的Figma文件已合成,退下吧人类”)
  • 3. 为啥OpenAI会让他搞这个?

    因为现在的AI不仅会聊天,还要会“画大饼”(误):

  • 多模态大模型(MLLM) = 既能理解文字,又能看懂图片
  • 比如你拍张照说:“帮我把这个沙发PS成蓝色。”
  • AI:“好的,已P好,顺便帮你把价格标签抹了,不用谢。”
  • 4. 未来会变成什么样?

  • 程序员:正在学习如何用AI生成代码,而不是手写(摸鱼时间+100%)
  • 设计师:正在学习如何让AI改第100版方案,而不是自己改(血压-100%)
  • 贝晨利的研究“我让AI学会了偷懒的终极奥义。”
  • 结论:以后的UI,可能真的就是AI“随手一画”就搞定了……人类设计师和程序员,准备好转型当AI监工了吗?今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    学术生涯:从清华到MIT的奇妙旅程

    让我们来聊聊这位学霸的豪华学术履历,简直像在收集名校徽章一样停不下来:

  • 起点:清华园的”科技宅”
  • 在清华大学拿到了计算机科学与技术学士学位,估计那时候就已经开始琢磨怎么让电脑比人更聪明了。
  • MIT进修:电力与代码的双重修炼
  • 麻省理工学院(MIT)继续攻读,顺手拿了个电气工程与计算机科学硕士,可能是觉得光搞软件不够,硬件也得掺和一脚。
  • 博士阶段:师从大牛,深入AI腹地
  • 在MIT著名的CSAIL实验室(计算机科学与人工智能实验室)拿下计算机科学博士,导师是Wojciech Matusik教授——这位大佬的名字读起来像是某种加密语言,但人家可是计算机图形学和机器人领域的顶级专家!
  • 总结一下,这条路就是:清华筑基 → MIT修炼 → CSAIL登顶,简直像打游戏一样,一路解锁终极学术成就
    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    Liyu Chen

    今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

    这位AI天才的学术轨迹,比GPT的答案还丝滑

  • Liyu Chen——一个让OpenAI都忍不住抛橄榄枝的名字,现在正以技术研究员*的身份,在AI的海洋里兴风作浪。
  • 让我们用学术界的GPS导航一下他的轨迹:

  • 起点站:香港科技大学
  • 在这里拿下了学士学位
  • 毕业论文由Dit-Yan Yeung教授把关——这位导师的名字读起来就像在说“你得加油”(“Yeung”≈“Young”)
  • 中转站:南加州大学
  • 一口气读到博士
  • 导师Haipeng Luo,名字自带BGM——“嗨,鹏!”(不知道论文写不出来时,导师会不会真的“嗨”起来)
  • 终点站(目前为止):OpenAI
  • 现在专门研究怎么让AI变得更聪明(或者更会讲冷笑话?)
  • 参考来源:OpenAI官方(但这条信息不是AI自己写的,我发誓!)
  • 原汁原味出处:微信公众号“新智元”——一个比你更早知道AI圈八卦的地方。*
  • 总结:从香港到洛杉矶再到OpenAI,他的学术路线比GPT-4的回答还流畅。建议下次更新简历时,直接写“已成功被AI界三大洲认证”。

    © 版权声明

    相关文章