当机器人遇上被子:一场关于”铺床革命”的严肃喜剧
23个关节、3个步骤、无数种失败的可能——这不是在演绎一出机器人版的《愤怒的小鸟》,而是在2025世界机器人大会(WRC)上,一只机械手与一条棉被的巅峰对决。
“不就是叠个被子吗?怎么整得像登月计划?”
没错,围观的路人脸上写满了困惑。毕竟,在隔壁展台的机器人还在跳机械舞炫技时,星海图的这位”家务侠”却正严肃地和一条皱巴巴的被子搏斗——这画面,犹如一只螃蟹在试图理解瑜伽垫。
“你们这是在测试机器人耐心吗?”“不,我们是在挑战柔性物体操控的学科天花板。”赵行团队开发的G0大模型,显然不打算让机器人走捷径——宁可让机械臂在”够不着被子”和”拉歪整张床”之间反复横跳,也拒绝给它写个”一键铺床.exe”脚本。按科学家的说法——
机器人的内心OS:你以为我想当”家政学院留级生”?
让我们想象一下这台机器的委屈:
为什么非得用大模型?简单解释:
“您好,检测到标准方形床单,开始折叠!(但如果您把枕头扔上去……系统错误)”
“被子堆成火山?床单扭成麻花?枕头在跳舞?无所谓,我的视觉-语言-动作联动系统会出手!”
正如赵行所说:”真正的智能不是会演马戏,而是能应付现实世界的混乱。”——比如你室友永远不整理的床。
机器人铺床大挑战:从”非共识”到”半夜加班搭子”的科技长征
谁说机器人不会干活?它们不仅会铺床,还能让科学家变身“深夜加班狂魔”!
机器人领域的”脏活累活”:谁来给AI擦屁股?
在当前AI技术飞速发展的背景下,具身智能(Embodied AI)仍然是个充满谜团的领域——就像大语言模型(LLM)学会了写诗、编程,但机器人铺床时却可能把被子卷成墨西哥卷饼。
为什么差距这么大?关键在于数据。
一位不愿透露身份的同事感慨道:“赵老师是我们最佳的加班搭子,半夜还能在办公室见到他,不是在调试机器人,就是在思考怎么让机器人别再把自己缠在被子里。”
与其花里胡哨,不如直面根本问题
在AI圈子里,各种酷炫的展示Demo层出不穷,比如机器人徒手开瓶盖、360度空翻滚床单……但在赵行看来,泛化能力才是关键。
换句话说:机器人能在不同房间、不同床上、不同人类制造的“床铺灾难”中都能优雅完成任务,才算真正“智能”。
于是,星海图(这家公司听起来就像科幻电影里的反派AI总部)决定开源500小时的真机数据——相当于机器人界的《百科全书》,让你家的AI不再需要重新学习“枕头应该放在哪”。
开源的好处?
资本市场的反应:投资人一边熬夜一边砸钱
好消息是,科技圈的钱似乎并不怕“加班文化”。据了解,星海图已完成近15亿元人民币融资,投资人们可能坚信——“总有一天,这些机器人会自己给自己充电,然后替人类加班。”
WRC(世界机器人大会)期间,赵行接受了专访。他从学术+产业双视角分享了自己的见解,比如:
总结:机器人在进步,科学家在熬夜
如果说AI领域有“最苦逼工种”,那一定是具身智能的数据工程师——他们不仅要教会机器人铺床,还得半夜在公司陪它加班。
好消息是:数据开源后,未来可能会有更多AI学会优雅铺床……坏消息是:它们会不会觉得自己铺得比人类好,然后拒绝帮我们?
(本文灵感来源于真实事件,但绝不代表你家机器人真的准备起义。)
科技界的”小王”:星海图首席科学家赵行
谁说科学家都得是一副戴着厚镜片、不修边幅的老学究模样?这位星海图的首席科学家、清华交叉信息学院的助理教授赵行先生,就完美颠覆了我们对科研人员的刻板认知。让我们一起走进这位”跨界科学明星”的世界:
据说他的同事们给他起了个外号叫”数据库王子”,因为他不仅研究做得好,在实验室的数据整理比赛中还常年保持第一。
看到这样的科学家代表,不禁让人感叹:这年头,连搞科研都得讲究”德智体美劳”全面发展了!
大模型是具身智能泛化性的基础,高质量数据更重要
当机器人学会”生活不能自理”:一场床单与被子的终极对决
1. 为什么选择”铺床”这个史诗级任务?
星海图的工程师们可能有个共同爱好——看家政阿姨干活时心生敬畏。于是他们决定挑战高难度:让机器人铺床!比起那些只会跳舞、点头哈腰的”花瓶机器人”,星海图选择了一个能让人类倍感共鸣的场景:每天早上都恨不得把自己卷回被窝的终极噩梦——整理床铺。
当他们决定展示这个Demo时,现场观众的表情大概分成了以下几种:
事实证明,这个Demo堪称AI界的年度生存挑战——不仅要操控23个自由度(比大多数人类协调性强),还要对付滑不溜丢的被子,随时可能塌陷的床垫,以及永远找不到对齐方向的床单。
2. G0模型:不是最强的AI,但一定是最会干家务的
G0模型的核心能力可以用一句话概括:“我不够酷炫,但我足够实用!”
最关键的是,G0证明了大模型不光会聊天,还能干活! 比起那些只能在PPT里吹牛的”概念机器人”,它实实在在地告诉我们:AI真的可以从”懂得很多”升级到”做得很好”!
3. 泛化性?不就是”见啥都能干”吗?
G0模型最难的不是怎么铺床,而是怎么铺不同的床:
这就好比让一个习惯了豪华酒店的AI,突然丢进大学宿舍——床垫倾斜30度、被子蜷在角落、枕头神秘失踪……这样的挑战,才是真正的”泛化性考试”!
4. 大模型真的适用于机器人吗?
许多AI专家曾经怀疑:“Scaling Law(规模法则)在语言模型上有效,但在物理世界真的行得通吗?”
星海图用实际行动告诉他们:
总之,AI的未来不再是“让机器人学会说话”,而是“让机器人学会干活”——否则人类唯一的出路可能就是把自己训练成超大型电池了!
高质量数据重要,现阶段会亲力亲为数据工程
数据采集历险记:机器人世界的”矿工”生活
第一章:数据采集的”搬砖”人生
这哪是 AI 行业?根本就是现代版”挖矿+修电脑+教导主任”的全能职业!
“为什么非得亲力亲为?”
因为这片”矿坑”太新了!不像 AI 标注已经成了流水线产业(外包公司一接手,你就等着验收吧),具身智能的数据采集更像是:
简单说:别人在搞高端算法研究,我们还在原始社会砍树做工具呢!
第二章:什么样的数据才能叫”高质量”?
听起来像在问”什么样的咖啡才算好喝?”但其实……比那复杂多了!
数据的两大灵魂指标
“数据配方?我们还在研发‘黑暗料理’阶段!”目前仿真数据、真机数据怎样配比最优?赵行表示:“继续尝试,实在不行就用玄学调参法!”
第三章:开源500小时数据?行业”挖矿指南”发布!
为什么要开源?“因为我们想让大家少踩坑!”(当然,也是想拉更多人一起挖矿……)
两大意义
总结:机器人行业的”淘金热”
未来,机器人可能在超市帮你找薯片,在酒店帮你送毛巾,甚至……在仓库偷偷摸鱼? 但这一切,都建立在今天的”脏活累活”上!
未来已来?围观群众被”隔空取物”黑科技惊掉下巴!
前几天在某科技展上,一群吃瓜群众围着一个神奇的展台,表情比第一次看见会跳舞的扫地机器人还精彩——原来他们在体验传说中的“遥操技术”,俗称“隔空取物Pro Max版”!
现场画风一览
人类迷惑行为新增条目
这项技术说高端点是“人机交互革命”,说直白点就是“让你在办公室装绝地武士”。不过据现场技术人员透露,目前主要应用在医疗、工业等领域——但群众纷纷表示:“先整个隔空撸猫功能行不行?”
(采访人:你们开心就好,反正技术又不是用来满足这种需求的……大概吧。)
VLA范式是工业化路径,也在探索多种技术路线
智能科技对话:从触觉传感器到“快慢双系统”
触觉传感器:现在不加是因为还“摸”不清?
用户提问:VLA(视觉语言动作)是当前主流,但有人觉得光靠视觉不够,得加触觉才能更好地与物理世界互动,你怎么看?
我们当然知道触觉很重要,但现在的触觉传感器还在“打架”——电容还是电阻?就像两个小孩在争谁当队长,队伍还没组好呢!相比之下,视觉传感器就像百年老店——摄像头行业早已标准化,连存储、压缩、传输都安排在“VIP通道”了。而触觉传感器?还在“试营业”阶段。
你想想,你指挥一个机器人去收拾桌子,它又不会抱怨“这杯子太冰”或者“筷子太滑”,只要能看到,90%的活就能干完。所以我们决定,先把VLA这个小目标达成了,等触觉传感器“长大”了,再组队一起玩。
快慢双系统:让机器人既能“飙车”又能“思考人生”
用户提问:目前各家的VLA实现不同,星海图有啥特色?
我们的技术路线叫“快慢双系统”:
世界模型:让机器人预知未来?不如先教它别撞墙
用户提问:世界模型现在很火,你们怎么看?
现在的机器人是靠“模仿学习”——看人类怎么做,它就照着来。但世界模型是让它直接“推算”每个动作的后果,比如“我推这个杯子,它会倒吗?”
这是个“高端局”,最适合顶级实验室去挑战。我们目前的策略:先用VLA把机器人教乖,再考虑要不要让它当“先知”。
总结:星海图的科技哲学
( 以上内容纯属“赵行风格”演绎,实际技术讨论请参考严肃版本。)
博览会的灵魂解说员:赵行
这位手持麦克风的绅士可不是普通路人——赵行老师正用他磁性的播音腔把展台参数讲出《动物世界》的既视感。当其他展商忙着发传单时,他已经让观众围出三层”演唱会观众席”,甚至有阿姨掏出手机录小视频:”儿子快看!这位解说员比李佳琦还会带货!”
采访团队悄悄透露:赵老师的西装内衬口袋其实是个零食仓库,毕竟连续八小时解说后,连央视主持人都得靠巧克力续命呢!
(图文无关:当镜头转向产品特写时,观众们还在伸长脖子找解说完结的赵老师去哪了)
学术经验长期受益,产学协同是件好事
赵行:从MIT到清华,一位跨界科学家的”数据人生”
回国动机:姚期智的”科学家挖墙脚计划”
2018年发生了一件大事——姚期智先生亲自带队去美国”拐”年轻人回来建设祖国!这位图灵奖得主挨个敲开MIT、斯坦福博士们的门,问他们:”要不要来清华玩耍?”就这样,赵行成了被”拐”回国的一员。
他觉得清华叉院简直是科学家的”快乐老家”:”在这里姚先生不管我们吃什么、喝什么,也不管我们研究啥——当然最重要的是不管我改多少次研究方向!这种自由度,简直就是学术界的’野生放养模式’。”
PhD秘闻:那个改变AI历史的”996数据集”
在博士期间,赵行和同学们干了件大事——打造了AD20K数据集。这个项目的难度系数堪比让猫乖乖洗澡:
结果这个”学术界的996工程”成了最受欢迎的数据集,引用量比他其他论文加起来还多!赵行悟出了人生真谛:”在科研界,最惨的不是996,而是996之后还没人用你的成果。”
跨界感悟:教授为什么要”下海”
现在的赵行过着”双重人格”般的生活:
他说:”这年头不当CEO的教授不是好AI研究者!你看美国的教授们都在忙着开公司,咱们中国教授当然不能输!”
本文灵感源自赵行教授的跨界人生,证明了一个真理:优秀的人往往不只在一处发光——他们可能是教授、研究员、创业者,甚至可能同时是这三者!(原文首发于微信公众号”智能涌现”,作者富充;本文经过”说人话”式改写)