10
0

独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

硅谷逆行者:星海图的”数据造反记”

在这个“开源的糖果满天飞”的世界里,机器人们还在哭着喊:”亲爱的数据,你在哪?”

机器人的”饿肚子”现象

  • 别人开源模型,它开源数据——星海图直接掀桌子:”数据为啥不能开源?偏不按套路出牌!”
  • 行业潜规则喊”No”,但人类总有几个叛逆的,比如星海图扔出Galaxea Open-World Dataset,史上第一个开放场景高质量真机数据集!
  • 还附赠一个G0-快慢双系统全身智能VLA模型,堪称”买薯条送汉堡”,业界直接炸锅:”这操作有点猛啊!”
  • 融资界的”快闪侠”

    成立不到两年,星海图已经完成:

  • 7轮融资,平均每3个月就要换一轮投资人名单
  • 近15亿人民币,换成硬币大概可以堆满一个中型游泳池
  • 最新A4/A5轮1亿美元,美团和今日资本高喊:”加钱!加钱!”
  • 估值冲向10亿美元,按这速度,明年可能直接和变形金刚谈合作了
  • 结论:

  • 数据或许不能开源? 星海图:”你说啥?风太大听不见!” ——这家公司用实际行动证明,机器人行业的开源革命,才刚刚开始*。
  • 独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

    当机器人不再”假正经”,这家公司把AI调教成了生活老司机

    在这个行业普遍把机器人当”乖乖仔”培养的时代,星海图公司偏偏选择了一条”放虎归山”的野路子。于是,我们即将见证一场机器人版的《荒野求生》——只不过这次的主角是拿着锅铲、推着购物车、还会在办公室偷偷摸鱼的AI打工人。

  • 数据集?不,这是机器人的”生活百科全书”!*
  • 星海图即将发布的Galaxea Open-World Dataset简直就是机器人界的《五年高考三年模拟》:

  • 500小时真实世界”监控”录像(别紧张,主角是机器人)
  • 50个场景从厨房到办公室,就像给AI报了个”新东方生活技能培训班”
  • 150类任务包含”如何在打翻酱油后假装无事发生”等实用技能
  • 1600+物品认证考试,确保机器人不会把猫粮当咖啡豆煮
  • 为什么这次不一样?*
  • 过去的机器人数据集像在摄影棚拍偶像剧——动作要优雅,环境要干净,连摔倒都要保持45度角完美侧颜。而星海图的方案是直接给AI装个GoPro,让它记录下:

  • 人类如何在微波炉”叮”的一声后继续刷手机直到食物凉透
  • 办公族是怎么把键盘敲出钢琴协奏曲的效果
  • 超市里永远撕不开的连卷塑料袋玄学
  • 统一硬件?这是给AI的”行为矫正班”!*
  • 所有数据都用星海图R1 Lite本体采集,相当于给每个AI学员发了同样的教科书。从此机器人界少了”我们老师不是这么教的”的争论,多了”这个锅我不背”的默契。
    当其他AI还在实验室里练习用机械臂画彩虹时,星海图的机器人已经在学人类最硬核的生活哲学——如何在打翻咖啡的瞬间,用纸巾演绎出当代抽象艺术了。
    独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

    “快”与”慢”的机械华尔兹:机器人也有双人格?!

    咱们人类有时候会纠结”脑子快”还是”手快”,机器人界的星海图G0表示:这题我会!
    瞧瞧这个“23自由度全身控制小天才”,它可不简单——

    System-2(慢速脑):优哉游哉的”哲学家”

    2Hz踱步思考

  • “这个人类想要我干啥?”(解码指令)
  • “地上那个是香蕉皮吗?”(环境侦查)
  • “万一踩上去,是先挥手臂还是先缩腿?”(计算最优动作)
  • 主要任务:拟订《如何优雅避免滑倒的100种方案》

    System-1(快速手):风驰电掣的”执行狂魔”

    200Hz闪电手速

  • “脑子说抬脚?立刻抬!”
  • “身体歪了?0.005秒内给我掰回来!”
  • “目标是花瓶?精准到毫米级拿捏!”
  • 信条:“思考?那是脑子的事!我的任务就是动!动!动!”

    “双系统”哲学渊源

    这套设计的灵感竟然来自人类自己的”双标”天性——

  • System-2:像你纠结”中午吃啥”时的大脑,缓慢但深邃
  • System-1:像你看到奶茶优惠秒下单的手速,冲动但精准
  • (机器人:人类啊,你们的缺点,都是我的进化方向!)

    训练秘籍:机器人界的”三级火箭”

    第1阶段:广撒网式预训练

  • “不管啥机器人,先学点通用技能!”(语言理解、环境感知)
  • 风险: 万一训练平台和目标机型差别太大……
  • 真相揭露:“跨本体训练有时反而拖后腿!”(团队震惊脸)
  • 第2阶段:精准打磨

  • “好了,现在专心练这个型号的动作!”(单本体高质量数据狂喂)
  • 效果: 从”走路像醉汉”升级成”芭蕾舞者级优雅控制”
  • 第3阶段:少样本突击

  • “客户要让机器人倒咖啡?再特训两天!”
  • 成果: 通用性不丢,特定任务表现飙升
  • 业界启示

  • “不是所有预训练都有用”(特别是跨太大差异的本体)
  • “精准控制还得靠’家教’(单本体训练)”
  • “机器人也得考前突击(少样本微调)”
  • (科学家们摸着下巴:”看来机器人像人类一样——刷题虽好,过度依赖也有副作用啊!“)
    所以下次看到一个机器人边思考边快速完成任务,别惊讶——
    它可能正默默吐槽你的指令,但手上动作一丝不苟呢!
    独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

    当机器人开始做家务:G0这货也太能干了!

    来自机器人的”床铺整理大秀”

    看看G0这家伙都在干什么好事:

  • 把被子叠得比酒店服务员还整齐
  • 协调全身动作灵活度堪比体操运动员
  • 处理柔软物体的技巧让人类自叹不如
  • 这货在”铺床单奥运会”上,把前任冠军Pi0虐得体无完肤!

    技术宅们的狂欢

    G0成功的秘密配方:

  • 真·家政大学:用现实世界数据训练,效果比模拟器强一百倍
  • 十八般武艺样样精通:从手指灵活到全身协调无一短板
  • 学一得十:少量示范就能迁移到各种新技能
  • 行业地震预警

    如果这波操作引起机器人界”数据共产”运动,我们可能会看到:

  • 你家扫地机器人突然学会给你按摩
  • 仓储机器人无师自通跳起芭蕾
  • 工业机械臂兼职做章鱼烧
  • 未来某日对话:*
  • “妈妈,为什么洗衣机在叠衣服?”
    “宝贝,因为它看了G0的教学视频…”

  • 科技改变生活的方式,有时候就是这么朴实无华且枯燥!*
  • 独家丨星海图将发布首个开放世界真机数据集及VLA开源模型

    机器人数据公开:一场”数据共产”的革命

  • 当机器人数据开始”众筹”,学术界沸腾了*
  • 曾经,高质量的机器人数据就像是科研圈的”茅台酒”—珍贵又难求。中小企业想搞机器人研究?那感觉就像是想用存钱罐里的硬币去买私人飞机。但现在,Galaxea数据集的开源就像是突然有人宣布:”茅台随便喝!”研究者们终于不用再为”数据饥荒”发愁了。

  • 标准化:从春秋战国到书同文*
  • 以前各家的数据格式五花八门,像是在看天书
  • 现在统一标准,研究人员再也不用玩”数据翻译机”了
  • 测评结果终于可以”同台竞技”,谁强谁弱一目了然
  • 这下监管部门乐开了花:”终于不用看着三百种数据格式发呆了!”

  • 跨界联姻:数据促成的不期而遇*
  • 计算机视觉专家遇见了控制理论大师,自然语言处理研究员碰上了机械工程师…这场由数据牵线的”相亲盛会”,正在催生一系列意想不到的”科技混血儿”。硬件厂商和软件开发者也不用再隔空喊话:”你说的那个数据,是不是我理解的那个数据?”

  • 生态循环:开源带来的”滚雪球”效应*
  • 创新速度:”蜗牛”变”高铁”
  • 应用场景:”三菜一汤”变”满汉全席”
  • 落地速度:”千年等一回”变”快闪”
  • 这家”叛逆”的公司用实际行动证明:有时候打破常规不是为了搞破坏,而是给行业按下快进键。他们可能正在书写机器人领域的”新玩法”。

  • 注:精彩内容源自微信公众号”硅星人Pro”,创意大师Yoky执笔*
  • © 版权声明

    相关文章