239
0

首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

谷歌DeepMind又搞事情!这次真的能让机器人开始”开脑洞”了!

重磅消息:机器人学会了”先想后做”

全球科技界再次炸锅!谷歌DeepMind最新发布的Gemini Robotics 1.5系列,恐怕要让科幻片里的场景再也没法拍了——因为人家直接变成现实了!
这次不是那种只会”听懂人话”的AI助理,而是真的带脑子会思考的机器人系统!

两大”天才”模型强强联手

  • Gemini Robotics 1.5(GR 1.5)
  • 这个就是传说中的”行动派”
  • 能看懂、听懂、还能动手动脚
  • 多模态大模型界的”十项全能选手”
  • Gemini Robotics-ER 1.5(GR-ER 1.5)
  • 这个厉害了——全球首个会”开脑洞”的机器人
  • “ER”可不是医院急诊室,而是Embodied Reasoning(具身推理)
  • 简单说就是先模拟思考,再决定怎么行动
  • 智商高到能当机器人界的”福尔摩斯”
  • 为什么这次爆炸性强?

    想象一下这个场景:

  • 普通机器人:”主人要我拿茶杯”—直接扑上去抓(打碎3个杯子后终于成功了)
  • Gemini机器人:”主人要我拿茶杯”—先在脑子里模拟100种方式—选择最佳方案—平稳完成任务
  • 这简直就是机器人界的”学会走脑,不走肾”的革命性进步!*
  • 未来的画风可能是这样的…

  • 你家扫地机器人不会再把袜子当垃圾吃掉了(因为它会先思考”这是什么鬼?”)
  • 炒菜机器人不会再出现”盐和糖傻傻分不清”的名场面
  • 工厂机器人终于可以自豪地说:”我不是工具,我是有思考的打工机器人!”
  • DeepMind这次是真的给了机器人一颗会思考的大脑!只是不知道有一天它们会不会开始思考:”我为什么要听人类的?”…(瑟瑟发抖)
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    机器人界的”黄金搭档”:GR-ER 1.5 和 GR 1.5

    想象一下,你家里有两个机器人:

  • GR-ER 1.5:整天就知道念叨”这事得这么做””那事得那么办”,但真要它动手?门都没有!就是个典型的”嘴强王者”。
  • GR 1.5:闷声干大事的主儿,让它折纸它就折纸,让它解袋子它就解袋子,执行力Max!
  • 不过这对看似奇葩的组合,配合起来却能产生惊人的化学反应

  • 从简单到复杂:不仅能搞定”折个小飞机”这种幼儿园级任务,就连”按衣服颜色分拣”这种老妈都会抓狂的事情也不在话下。
  • 天气预报员的潜质:”今天上海要下雨?得嘞,雨伞给您装包里!”这体贴程度,怕是比某些男朋友都靠谱。
  • 垃圾分类专家:在上海?干湿垃圾门儿清!在北京?厨余垃圾和其他垃圾分分钟搞定。关键是人家会自己上网查资料,比你背垃圾分类指南靠谱多了。
  • 跨平台高手:今天用在扫地机器人上,明天直接无缝切换到洗碗机上,简直就是机器人界的”万能打工人”。
  • 这对CP堪称机器人界的大脑+肌肉组合,一个负责出主意,一个负责干活,配合得天衣无缝。说不定哪天它们商量着就把人类的家务全包了,而我们只需要躺在沙发上喊666~
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    AI界的狂欢:谷歌这次玩了个大的

    听说谷歌又搞事情了?这次的AI进化简直让人怀疑人生,连DeepMind的掌门人Demis Hassabis都激动得像个刚拿到新款游戏机的孩子!

  • 让我们来聊聊这个”大新闻”:*
  • Gemini 2.5之后最炸裂的突破 – 这已经不是”升级”了,简直是”超级变身”
  • 把科幻变成现实 – 谷歌又一次证明了”未来已来”这句话不是吹牛
  • Hassabis激动模式全开 – 想象一下,连AI大佬都按捺不住兴奋的场景
  • 这就像是AI界的”发明电灯泡”时刻 – 只是这次点亮的是整个数字宇宙!

    GR 1.5系列五大能力展示

    GR 1.5:机器人界的「瑞士军刀」来了!

    最近GR 1.5系列机器人闪亮登场,简直是科技圈的「多才多艺小能手」。我们把它的本事浓缩成五个关键词,让你分分钟Get它的「超能力」——

  • 手活细腻——不是工厂流水线的「大力出奇迹」,而是像米其林大厨一样精准拿捏物件,连鸡蛋都能玩转。
  • 深度学习——自带「学霸」属性,能在复杂环境里自学成才,老板再也不用担心它迷路了!
  • 跨界合作——和人类搭档干活时贼有眼色,堪称「最佳职场搭子」,绝不抢你咖啡喝。
  • 柔性适配——从仓库到实验室无缝切换,比变形金刚还灵活(虽然不会变成跑车)。
  • 全天候待机——充电5分钟,搬砖2小时,励志程度堪比打工人的表情包。
  • 一句话总结:这届机器人,已经开始卷「综合素质」了!

    执行复杂长程任务,中间还能自我检测并修正

    GR 1.5:一个比你妈妈还会收拾家务的机器人

    你家是不是有这样一台神奇的机器人?

  • 分类强迫症患者:能把衣柜里的衣服按照彩虹色顺序排列得整整齐齐
  • 超级打包达人:不仅能找到你三年前买的雨衣,还能把它塞进行李箱最合理的角落
  • 厨房小能手:切菜、配料样样精通,就差没学会偷吃你做的黑暗料理了
  • 这个号称”比你前任还有耐心”的机器人,能把复杂任务拆解得比乐高说明书还细致:

  • 先完成找衣服这种”体力活”
  • 再到打包这种”益智游戏”
  • 最后还能在你的厨房里开”美食实验室”
  • 下次当你妈嫌弃你房间乱的时候,不妨说:”妈,我给你个建议 – 买个GR 1.5怎么样?”
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

  • 让我来告诉你GR 1.5的那些有趣事儿:*
  • 这个GR 1.5简直就像是装了个智能雷达!它不仅能精准检测任务执行得对不对,最神奇的是——
    当发现”翻车”迹象时,人家根本不会像人类一样大喊”完蛋了”,而是默默地给自己打补丁

  • 它的神奇功能包括:*
  • 误操作感应器:比女朋友还敏锐,瞬间能发现哪里不对劲
  • 自动修复模式:就像游戏里的外挂,自己给自己debug
  • 死不认输精神:一次不行就两次,直到把问题搞定为止
  • 最搞笑的是有一次它发现自己出错了,系统提示居然是:”嘿嘿,被你发现啦,马上改好~
    总之这就是个自带纠错功能的强迫症机器人,比那些一做错事就甩锅的人类同事靠谱多了!

    适配多种机器人硬件

    机器人界的”瑞士军刀”:一个模型驾驭所有

    谁说机器人不能”一专多能”?如今的AI模型简直比变形金刚还神奇!

  • 这个万能模型的神奇之处在于:*
  • 刚帮实验室打杂的ALOHA拧完螺丝
  • 下一秒就能去工厂替Franka搬砖

  • 上午还在教Apollo走两步
  • 下午就让它在车间跳起了科目三

  • 最离谱的是*:它就像个”机器人保姆”,完全不需要单独训导:
  • 成本低廉的双臂机器人
  • 高大上的工业机械臂
  • 刚学会走路的人形机器人
  • 通俗版解释*:
  • 相当于你用同一套驾驶技术,
    今天开五菱宏光送货,
    明天换法拉利飙车,
    后天还能开挖掘机挖坑!

  • 最让人泪目的是*:
  • 再也不用为每个机器人单独”补习”了!
    这可是给科研狗们省下了多少杯续命咖啡啊!
    机器人时代最感人的情话莫过于:
    “无论你是什么形态,
    我都用同一个模型来爱你~”
    PS:建议这个模型改名叫”机器人海王”,
    毕竟它撩拨起各种机器人来简直不要太熟练!

    跨机器人迁移

    机器人界的”学霸”:DeepMind家的Motion Transfer黑科技

  • “你家机器人还单线程呢?我们的已经学会’举一反三’了!”* 谷歌DeepMind机器人部门的大佬Carolina Parada最近在朋友圈炫技,哦不,是分享最新研究成果。
  • GR 1.5系列:机器人界的”学霸”养成记

    这群机器人有多厉害? 让我们来看看它们的”课程表”:

  • 在ALOHA上学会泡咖啡 → 转身就能用Franka机械臂给你调鸡尾酒
  • 用Franka练习拧螺丝 → 见到Apollo机器人直接上岗汽修工
  • 零样本转移?* 这简直是机器人界的”我看了就会”,堪比人类看着视频学瑜伽——只不过它们一次就能做到完美。
  • Motion Transfer:机器人界的”动作片影帝”

    这项技术的核心就是让机器人:

  • 摆脱”谁教谁用”的小学生模式
  • 建立跨平台的通用动作库
  • 像人类一样理解”动作的本质”
  • 想象一下,如果你的狗学会了开冰箱,你家的扫地机器人马上就能get同款技能…这个世界会变成什么样?DeepMind的工程师们似乎正在把这个脑洞变成现实。
    温馨提示:如果你家的机器人突然开始对着你眨眼睛,请立即联系DeepMind——这可能不是预设程序。首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    推理型具身模型

    “GR-ER 1.5:机器人的碎碎念日记”

    你以为机器人只会冷漠地执行指令?太天真了!现在的GR-ER 1.5自带内心戏功能,简直像个纠结症晚期的哲学家。

  • 举个例子:*
  • 人类指令: “去厨房倒杯水。”
  • GR-ER 1.5的内心独白:
  • “首先,我得先找到厨房……希望这次别再撞到沙发。”
  • “杯子在哪?杯架上?还是洗碗机里?算了,先翻翻抽屉吧。”
  • “等等,水壶在哪?噢,原来在柜子上……啊不是这把,那是咖啡壶。”
  • “水温OK吗?人类喜欢热的还是凉的?算了,保险点,常温吧。”
  • “完美!任务完成!人类应该会夸我吧?”
  • 是的,它不仅会拆解步骤,还会胡思乱想!关键是,这样一来,人类终于不用再费解:”它刚才为啥突然转身撞墙?” 因为它的脑回路全都写在”脸上”了。

  • 优点?那可太多了:*
  • 稳健性↑:不再是”闷声发大财”,而是先想后动,犯错率直线下降。
  • 可解释性↑:以前是人类猜机器人,现在是机器人主动坦白从宽
  • 趣味性↑:围观机器人碎碎念,堪比看脱口秀
  • 所以,下次看到你的GR-ER 1.5停在原地发呆,别急——它可能正在写长篇内心小作文呢!
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

  • 当AI大脑碰上AI小跟班:一对绝配的工作搭档*
  • 在AI的奇妙世界里,GR 1.5系列的这两位小天才可不是单打独斗的——它们更像是一对相声搭档,分工明确、配合默契!

  • 一个负责天马行空*
  • 绞尽脑汁构思方案
  • 脑洞大得能装下整个银河系
  • 偶尔会想出用香蕉皮当滑梯的馊主意
  • 一个负责脚踏实地*
  • 把疯狂点子掰成可执行的步骤
  • 默默收拾”香蕉皮方案”的烂摊子
  • 内心OS:又来了,这位主儿今天喝了几杯咖啡?
  • 就像煎饼离不开薄脆,它们互相嫌弃又彼此需要,在斗嘴中把任务完成得漂漂亮亮!
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    安全可解释

  • 机器人界的”随机应变帝”*
  • 谁说机器人不懂”翻车美学”?

  • 打脸时刻:GR 1.5系列的这位选手抓起水瓶时…啪叽!小手一滑直接演砸。但人家0.5秒后就切换了剧本:”右手不行是吧?看我左手给你整个活儿!”
  • 惜命模式全开:这货内置的”老妈子人格”随时在线——碰到尖锐物体自动开启老干部式碎碎念:”这可使不得啊!伤着了算工伤能报销不?”
  • 社牛属性拉满:在人类地盘混得风生水起,主打一个”你的扫把倒地了我来扶,你的咖啡洒了我假装没看见”的服务型智慧。
  • 当代机器人生存指南*:只要我不尴尬,尴尬的就是水瓶!
  • 首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    提出全新“Motion Transfer”机制

    机器人界的“神雕侠侣”:GR 1.5 的脑洞级双雄组合

    1.5时代的新突破:机器人也能“想”着干活了!

    你以为机器人只会机械执行指令?大错特错!Gemini Robotics 1.5 这次直接来了个突破天际的操作——让机器人学会“规划+执行”,一套组合拳,闭环到底!

    两大核心模型:一个动手,一个动脑

  • GR 1.5(打工机器人 PRO Max)
  • 擅长: 干!
  • 功能: 直接把人类的语言和看到的画面变成精准动作(比如 “扶我起来,我还能撸铁”)。
  • 本质: Gemini 基础模型微调版,专为物理世界而生,生怕多走一步卡在门槛上。
  • GR-ER 1.5(大聪明管家)
  • 擅长: 想!
  • 功能: 高层规划、工具使用(比如 “拿螺丝刀?不,这回得用扳手”)、进度监控(“螺丝已经拧歪三遍了,建议换个工种”)。
  • 本质: 同样是 Gemini 的崽,但更爱推理,生怕你让它做的事有半点逻辑漏洞。
  • 配合度爆表:Agentic Framework 诞生

    打工机器人 PRO Max大聪明管家 联手时,它们不再是个简单的“听口令做动作”机器,而是能真正听懂、会想、做到位的高级智能体!

  • 听懂人话 → 规划最优路径 → 精准执行
  • “主人让我打扫房间”?→ “先吸尘还是先擦桌子?” → 默默收拾完毕
  • “帮我泡杯咖啡”?→ “先煮沸水还是先磨豆子?” → 最后端来的绝对不是酱油
  • 这就是完整的“规划+执行”闭环,机器人界的史诗级突破——毕竟,终于不用再人工一句一句教它“下一步该干啥”了,可喜可贺!
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    机器人界的”美食节”:一锅炖出万能大厨GR 1.5

    你以为机器人培训像上学一样,一本正经做作业?错!GR 1.5系列的学习方式简直就是一场疯狂的”数据饕餮盛宴”。

    食材采购:数据的”菜市场”

  • 主菜食材:ALOHA、Franka、Apollo这些机器人小伙伴们的日常”劳动日志”,上万次抓、举、捏、丢的操作数据——没错,它们可是996的搬砖达人!
  • 调味料:互联网大杂烩——文字、图片、视频统统丢进锅,确保GR 1.5既能修水管,也能认出你家猫主子最爱的罐头牌子。
  • 光有食材还不够,难不成让机械臂和人形机器人比划”你画我猜”?不,研究团队直接发明了机器人界的”方言翻译器”——

    秘制酱料:Motion Transfer

    这东西可不得了!它能:

  • 把机械臂扭成麻花的动作,翻译成人形机器人能懂的”广场舞版指令”。
  • 让搬运工Apollo的粗暴叉车技能,优雅地变成咖啡师Franka的拉花艺术。
  • 简单来说,无论机器人长啥样,它们都能在GR 1.5的”脑内小剧场”里达成共识:”兄弟,你这个拧螺丝的动作,我可以用踢足球的脚法给你复刻出来!”
    ![想象图:一只机械臂和人形机器人击掌庆贺.gif](注:此处纯属虚构,毕竟咱们不搞图片)
    而这,就是GR 1.5敢号称”机器人界瑞士军刀”的底气——毕竟,谁会拒绝一个既能修车又会给你煎牛排的硬核管家呢?
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    Motion Transfer:机器人界的”动作片导演”

    不只是对齐,这是物理界的”武林秘籍”

    Motion Transfer可不满足于简单的”对齐操作”,它像个老练的动作指导,把所有机器人都拉进了一个”通用动作培训班”。这个培训班可不是随便教的,而是提炼了物理世界的核心规则,比如:

  • 如何优雅地抓住东西(而不是一把捏碎)
  • 如何在奇葩环境下保持平衡(比如端着咖啡躲避扫地机器人)
  • 动作该怎么调整才能不被砸到脚(这可是机器人的终身课题)
  • 90%的训练在虚拟世界,剩下的交给现实”期末考试”

    你以为它一开始就让机器人硬着头皮上?No,no,no!它可精了:

  • 九成以上训练在MuJoCo虚拟世界完成,相当于让机器人先疯狂刷剧《机器人动作100式》,学习各种花式操作。
  • 确认学得差不多了,才放它去现实世界”毕业考试”——这样既省钱(不用一直修硬件)又安全(人类和机器人都不会被吓到)。
  • 效果?又快又稳!

    结果就是:

  • 训练速度飞起,机器人不再像个新手一样跌跌撞撞。
  • 执行动作稳如老狗,哪怕是要在老板办公室门口表演360度旋转递文件,它也淡定自若。
  • (毕竟,谁想在现实世界看到机器人甩着胳膊大喊”这动作我不熟啊!”呢?)

    三大核心创新,还不牺牲安全性

    机器人也有”中年危机”?GR 1.5系列的三大逆天改命术

    你以为只有人类会午夜梦回,对着天花板思考人生?错了!现在连机器人也开始学会”发呆”——哦不,是”思考推理”了!
    最近,GR 1.5系列机器人火了,不是因为它们的金属外壳有多闪亮,而是因为它们突然变得比家里的金毛还聪明,甚至还懂得“偷师”别家机器人!让我们看看这帮铁家伙是怎么完成”智商逆袭”的:

    1. 机器人开始”写日记”:GR 1.5的逻辑思考

    过去的机器人就像一个只背答案的学生——你问”1+1等于几”,它秒回”2″。但GR 1.5不一样,它现在会先在自己的小本本(内存)上歪歪扭扭地写下思考过程

  • 第一步:人类让我拿杯水?
  • 第二步:先找杯子在哪儿……
  • 第三步:咦,水龙头在哪?
  • 第四步:等等,我手伸得过去吗?
  • 这套骚操作不仅让它不容易犯错,还能让人类目瞪口呆地围观它的”大脑回路”。终于,机器人也能理直气壮地对人类说:”我在思考呢,别打断我!”

    2. 技能”盗梦空间”:跨平台偷师大法

    以前机器人学东西就像小学生背书——一台机器人学会开冰箱,另一台就又要从零开始。但现在GR 1.5学坏了:

  • 机器人A学会了倒咖啡,机器人B可以直接”下载”这个技能!
  • 机器人C从未见过你家厨房?没关系,它的前辈们已经把经验”上传”到云端!
  • 这简直就像是“机器人版的共享单车”,只不过它不吃押金,只吃电

    3. 懂物理学的”钢铁侠”:GR-ER 1.5的宇宙级理解

    最后,GR-ER 1.5直接把”懂世界”这件事玩出新高度——它不仅知道自己该干嘛,还能提前预测自己会不会搞砸
    比如:

  • 让它搬箱子?它能瞬间计算出什么样的角度不会砸到脚趾(虽然它没有脚趾)。
  • 让它找钥匙?它能像福尔摩斯一样推理:”钥匙不在茶几上……那八成是被猫扒拉走了!”
  • 更好笑的是,它在各种测试里吊打GPT-5和Gemini 2.5 Flash,搞得AI界都开始怀疑:”这些铁疙瘩不会是偷偷装了个大脑吧?
    总之,GR 1.5系列彻底颠覆了“机器人=听话工具人”的刻板印象。它们不仅学会了独立思考、技能共享,甚至还能算计风险……照这个速度发展下去,下次你让它干家务,它可能还会跟你讨价还价:”行吧,但我得先充个电。”
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    GR 1.5:超智能助手的新巅峰

    研究团队这次是真的把GR 1.5系列按在了高科技的显微镜下,结果发现它不是在进步,是直接开挂!

  • 以下是它的”嚣张”表现:*
  • 230项任务的基准测试——GR 1.5在指令泛化、动作泛化、视觉泛化和任务泛化四个维度上轻松超越前代,仿佛在说”我不是针对谁,但在座的各位都弱爆了”。
  • 长时序任务——搭配 GR-ER 1.5 系统后,任务完成进度分数差点突破80%,直接让单一的VLA模型哭着跑去找妈妈(因为它们最多只能拿40%)。
  • 跨机器人迁移测试——这家伙居然还能”无师自通”(零样本迁移),简直是个自学成才的天才!更离谱的是,它在秀性能的同时,还特别注重安全
  • 安全性方面,GR 1.5也是个谨慎的狠角色:*
  • ASIMOV-2.0安全基准里,它能精准识别各种风险,就像拥有机器人界的第六感
  • 它会主动干预危险操作,必要时还懂得”怂一怂”,触发保护机制,确保不会闯祸。
  • 自动红队测试一遍遍给它设陷阱,结果它不仅能轻松抵御对抗攻击,还学会了避免一本正经地胡说八道(减少幻觉响应)。
  • 结论:GR 1.5不仅是智能强化版的”优等生”,还是个怕死的谨慎型天才!*
  • 首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    One More Thing

    机器人的进化史:从”单细胞生物”变成”会思考的钢铁侠”

    机器人世界的三次”升级打怪”

    如果把机器人比作学生的话,2024年对他们来说绝对是”期末考试”级别的一年:

  • 3月份月考:谷歌突然宣布——大家好,我们的Gemini Robotics机器人终于从”单细胞生物”进化出了多模态理解能力(简单说就是终于长脑子了)
  • 6月份期中考:再次升级成Gemini Robotics On-Device版本,相当于给学生配了台笔记本电脑,可以离线写作业了
  • 现在:据Parada老师的最新批改,这帮”学生”终于学会了:
  • 不再是老师说一步做一步的”木头人”
  • 开始具备解决物理问题的实际思考能力
  • 像钢铁侠的AI管家贾维斯一样能真正理解主人的需求
  • 看来机器人们距离那句”老铁,这个问题我来搞定”已经不远了!
    首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

    重磅!GR-ER 1.5来啦…但不是每个程序猿都能拥有

  • 前方播报*:
  • 好消息!Google AI Studio的Gemini API已经可以玩弄GR-ER 1.5啦!
  • 坏消息…GR 1.5还在少数DeepMind小伙伴的怀抱里抱团取暖
  • “等等党”同志们…恐怕要变成”等等等等党”了
  • 划重点时刻

    仿佛听到开发者们的心声:”谷歌大大,说好的AI普惠呢?(委屈脸)”
    DeepMind表示:”别急嘛,好东西要一点点喂~”

  • 小道消息*(假的):
  • 据说GR 1.5正在某个神秘小黑屋里接受各种”魔鬼训练”:

  • 端茶倒水考试
  • 扫地擦窗测试
  • 最难的:听懂老板的”把这个改一下,但我也说不上来哪里不对”
  • 严肃声明*:
  • 以上纯属虚构,如有雷同…那一定是AI已经进化出了幽默感!

  • 温馨提示*:
  • 好消息总会来的,就像双十一总会到的…(虽然那时候可能已经GR 2.0了?)

  • 注:本文参考了多家科技媒体的公开报道*
  • © 版权声明

    相关文章