1,281
0

空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献

空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献

AI的智商撞上物理世界的“降维打击”

AI的“高智商”与人类的“低端局”

想象一下:一个能写出十四行诗的人工智能,突然被一个写着“请点击所有包含红绿灯的图片”的验证码一键封印。这就是当下AI的魔幻现实——在虚拟世界叱咤风云,在现实世界寸步难行

  • 人类在干啥? 拖地、倒垃圾、修马桶。
  • AI在干啥? 对着一个打不开的门把手陷入“哲学思考”。
  • 群核科技的“空间智能”破局

    就在大家还在讨论AI会不会抢饭碗时,群核科技已经默默给AI装上了“空间感知”外挂。在最近的TechDay上,他们一口气开源了两款模型:

  • SpatialLM 1.5(空间语言模型Pro Max版)
  • 不仅能理解“把沙发往左挪10厘米”这种人类偷懒指令,还能真的在虚拟空间里执行
  • 上一次开源直接冲上HuggingFace榜单前三,这次直接回炉重造,交互能力拉满,堪称AI界的“空间改造大师”。
  • SpatialGen(空间生成模型·时空警察版)
  • 别的视频生成模型在造“猫弹钢琴”的魔幻场面,它却在纠结“如何在连续帧里让同一把椅子不凭空消失”
  • 目标是解决“上一秒有桌,下一秒剩空气”的AI经典穿帮镜头。
  • AI的“见光死”与科技圈的“人间清醒”

    现在的AI发布会,动不动就是“史上最强”“颠覆行业”,但群核这次的操作更像是在说:“别整那些虚的,先让AI学会在现实世界别撞墙。”

  • 其他AI: 生成4K超写实梦境,但分不清门和墙。
  • 群核AI: 可能画不出蒙娜丽莎,但能告诉你“如何在不撞到茶几的情况下把冰箱搬进客厅”
  • 或许,这才是AI真正需要的人类级常识——毕竟,再聪明的AI,如果连垃圾桶都绕不过去,那和一块昂贵的砖头有什么区别?

    只有群核能提供的空间智能新思路

    AI设计师的奇思妙想:当空间智能遇上”老人友好”卧室

    那天,TechDay上出现了神奇的一幕:

  • 首席科学家周子寒站在台前,像个魔术师一样对着AI喊话:“帮我生成一个适合老人居住的卧室!”
  • SpatialLM 1.5 淡定表示:”老人?明白!轮椅安排上!”
  • 但这位AI显然是个细节控,接着追问:”要不要来个带扶手的单人床?”
  • 周子寒点点头,AI立刻从素材库精准捞出对应模型,仿佛早已看透老年人的生活需求
  • 高潮来了!*
  • 当周子寒下达了一个堪比室内GPS的指令:”帮我规划从卧室床边到客厅餐桌的路径!”

  • 系统的反应速度和准确性直接让人怀疑它是不是偷偷在自己家走过千百遍
  • 最优路线?轻松打印!障碍检测?不在话下!这哪是AI?这简直就是室内导航界的”活地图”!
  • 围观群众OS:*
  • “这AI怕不是在养老院打过工?”
  • “未来的装修设计师要失业了吗?”
  • 最后,这场演示让大家深刻意识到:具身智能的训练潜力根本停不下来!
    空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献

    当AI开始玩”乐高”:科技巨头们的世界模型争夺战

    1. 视觉派 vs 结构派:谁能更快拼出”乐高世界”?

    想象一下,你面前有一盒乐高积木。

  • 视觉派(如OpenAI的Sora、Google的Genie)的做法是:先拍100万张乐高拼好的照片,让AI自己琢磨”为什么这些零件能组合成城堡”。
  • 结构派(如群核的SpatialLM)的做法是:直接给AI一本乐高说明书,告诉它每个零件的编号和拼插位置。
  • 一个靠”蒙”,一个靠”说明书”,你觉得哪个更快学会搭出一辆乐高法拉利?

    2. SpatialLM的”叛逆宣言”:我不是翻译官,我是建筑师

    当前大多数AI处理3D信息的方式,就像让一个法语翻译硬生生把《巴黎圣母院》的建筑手册翻成中文——结果可能是一堆”尖顶、石头、很多窗户”的模糊描述。
    而群核的SpatialLM却说:“别翻译了,直接给我CAD图纸!”

  • 它的核心思想:所有空间关系本质上都是“点线面的数学情书”
  • 最新版本SpatialLM 1.5甚至进化出了”嘴炮技能”——用户只要像和朋友聊天一样说”帮我设计个带旋转楼梯的LOFT”,它就能直接生成完整3D方案。
  • 3. SpatialGen的黑魔法:让相机玩”瞬间移动”

    当其他视频生成模型还在苦哈哈地确保每一帧都连贯时(就像要求画家必须从画布的左上角一笔画到右下角),SpatialGen的操作堪称作弊:
    用户:”先拍沙发左侧,然后立刻跳到天花板俯视?”SpatialGen:”没问题,这是你的跳跃式全息漫游视频——另外墙上的霉斑和地板裂缝保证每个角度都对得上。”它的秘密武器是多视角扩散模型

  • 吃进去几张老照片
  • 吐出来360°无死角的3D高斯场景
  • 最后生成能让用户像幽灵一样穿墙漫游的视频
  • 4. 终极哲学难题:AI应该”像真的”还是”就是真的”?

  • Sora们:”看!我模拟的水花多逼真!”(但桌子腿可能突然穿透地板)
  • 群核:”先声明,这个杯子的直径5cm,距离桌沿8cm,重力系数9.8m/s²…”(然后杯子永远稳稳站在桌上)
  • 就像区别”用PS画一碗拉面”和”真正煮一碗拉面”,前者会让你流口水,后者能让你吃饱——虽然目前来看,人类对”能吃的AI”还没做好心理准备。

  • 未来彩蛋*:当这两个学派最终结合时,我们可能会得到一个既能完美模拟物理规律,又会突然让马克杯对你wink的AI世界——那将是真正的”魔法时代”降临。
  • 空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献

    AI舞者:从此告别”群魔乱舞”时代!

    想象一下这样的场景:

  • 三位科技公司创始人突然决定转行当舞者*——不是普通的蹦跳,而是能让你眼前一亮的专业级表演!
  • 十几个分镜头完美切换
  • 360度环绕运镜堪比好莱坞大片
  • 最神奇的是:这些人既不会突然长出三只手,也不会莫名其妙消失在背景里
  • 没错,这不再是那些让人哭笑不得的”AI迷惑行为大赏”——

  • 没有诡异的手指扭动
  • 没有反物理学的关节旋转
  • 更不会出现凭空消失术
  • 这些”创始舞者”的每个动作都像被严格培训过一样,就连衣服褶皱都保持着令人感动的合理性。看到这个demo,其他AI视频工具大概会躲在角落里默默流泪:”为什么他们能这么优雅?!”
    最可怕的是——这还只是个彩蛋demo。想想看,当这项技术真正成熟后,我们可能再也分不清:

  • 屏幕里的舞者到底是真人还是AI
  • 科技创新和艺术表演的界限会不会直接被一键删除
  • 未来已来*,而且这次,它跳着整齐的舞步!
  • 空间智能“宝藏公司”群核,又为解决AI见光死做了些微小贡献

    这款神器,一致到让你怀疑人生!

    当谈到商业视频这种对一致性要求高到近乎偏执的领域时,这玩意儿的能耐简直能让用户兴奋得半夜爬起来测试功能

  • 想象一下:*
  • 拍广告终于不用再NG 50遍,因为演员的表情、场景的色调,甚至咖啡杯的角度都能被它一键锁定,精确到像素级别。
  • 剪辑师再也不用听甲方爸爸的“这个蓝色能不能再蓝一点点”的灵魂拷问,因为“蓝到心碎”还是“蓝到忧郁”直接预设调好,批量应用无压力。
  • 连AI生成的角色都能保持同一张脸不崩坏,不会前一秒是帅哥,下一秒变成表情包。
  • 总结:* 一致性强到连强迫症患者都挑不出毛病——这才是真正的科技魔法!
  • 来自真实世界的AI公司,才能解决AI进入真实世界的问题

    当AI遇见装修:一个“不务正业”的GPU公司的逆袭之路

    你如果在群核的TechDay上转悠一圈,大概会觉得这像是个奇怪的“装修公司搞AI”跨界纪录片现场。但仔细想想,又似乎非常有道理——毕竟,这年头AI都在学人类画画、写诗、编代码了,教它怎么摆沙发、选窗帘怎么了?

    1. 从“玩显卡”到“玩装修”的奇妙转折

    一切的开端,其实是“打游戏”——不,准确说是NVIDIA的前员工黄晓煌想用GPU加速物理世界渲染。但当时,GPU还只是游戏玩家的好朋友,拿来搞真实世界的虚拟建模?“您这不是拿菜刀削苹果吗?”不少人这么想。
    可群核愣是找到了解法——“算力不够?云端来凑!” 于是,“云GPU服务器”成了关键,顺便孵化了酷家乐——全球最大的空间设计软件。想想也挺幽默,本来只是想让人“虚拟装修一下”,结果攒下的数据成了AI时代的“装修知识百科全书”

    2. 数据的“致富经”:从设计师的画板到AI的养料

    群核的数据富矿是怎么来的?简单来说就是:
    设计师画图AI偷师学艺模型变强设计师干活更快再生成新数据AI继续偷学……无限循环

  • “这不就是AI版的‘永动机’吗?” 其实更像个“数据永动机”*,只不过这次是用一堆沙发、橱柜和墙纸训练出来的。
  • 而最神奇的是,群核挖出了“第三条数据生产线”

  • 老办法: 现实扫描 → 贵,还容易扫歪!
  • 人工合成: 程序员熬夜写代码生成假房间→ 费脑子!
  • 群核专属: 让AI自己“脑补”场景 → 既便宜,又能生成想象力突破天际的数据!
  • 3. 当AI开始“嫌弃”2D:群核的降维打击

    传统AI还在2D世界里纠结“这是猫还是狗”时,群核的SpatialLM已经在给AI教3D空间逻辑了。
    想象一下,普通AI看到一张图只会说:“这是一张桌子。”
    而群核训练出的AI会回答:“这是一张北欧风餐桌,适合放在开放式厨房旁边,建议搭配两把温莎椅。”

  • 差距有多大? 大概就是“会用美图秀秀”和“会自己设计宜家样板间”*的区别吧。
  • 4. 未来的群核:从装修公司变成“空间智能界的英伟达”?

    所以今天的群核到底在做什么?

  • 工具: 做空间编辑器(给设计师用)
  • 数据: 攒海量真实装修方案(给AI学)
  • 模型: 训练空间智能大模型(让AI变得更聪明)
  • 最终形成一个闭环:工具→数据→模型→更强大的工具→更多数据……“这就像玩家靠刷副本升级装备,然后去挑战更难的副本一样!”
    用黄晓煌自己的话说:“我们目标是变成全球空间智能的服务商。” 听起来宏大,但说白了就是——让AI学会摆家具、算户型,甚至自己设计房子!(未来装修公司会不会被AI抢饭碗?不好说…)

  • 结语:偶然?必然?

    回看群核的发展,很像一个“误打误撞”的故事:

  • 原本想用GPU加速渲染 → 结果搞出了酷家乐
  • 原本只是帮人设计房子 → 结果攒了海量结构化数据
  • 原本只是做装修软件 → 结果成了空间智能的关键玩家
  • 这个故事告诉我们:有时候别急着定义自己做什么,搞不好你无意中攒下的“垃圾数据”,就是AI时代最值钱的宝藏。
    (原文来源:微信公众号“硅星人Pro”,作者王兆洋)

    © 版权声明

    相关文章