英伟达新GPU，超长上下文/视频生成专用

老黄又双叒叕要掏空显卡玩家的钱包了！

刚在AI Infra Summit上，老黄（黄仁勋）又掏出了他的新“玩具”——NVIDIA Rubin CPX GPU。这回，他不是为了让你在游戏里多跑10帧，而是直奔那些动不动就要“干翻内存”的超长token密集型任务！

Rubin CPX：专治“十万个为什么”的AI怪兽

百万级token？小菜一碟！老黄直接给代码生成和生成式视频喂了“大力丸”。

想跑超长剧本、巨量代码？Rubin CPU微微一笑：“你们对真正的算力一无所知。”

游戏显卡瑟瑟发抖：“完了，这下开发者又要疯狂抢货了……”

为什么英伟达总能抢风头？

很简单——“因为老黄手里有核弹！”（指显卡）。当别人还在纠结怎么优化token处理效率时，英伟达直接甩出一张新卡，让摩尔定律都泪流满面。
目前看来，Rubin CPX的目标用户大概分为两大类：

AI狂人：看见大模型就像饿狼看见肉。

数字内容创造者：视频生成太慢了？来，试试我的新硬件！

游戏玩家（误）：继续抢最后一代能挖矿的显卡吧……

最后友情提醒：*

如果你的AI任务还在为“token不够长”发愁……抱歉，你可能得先验收一下钱包的厚度了。
英伟达新GPU，超长上下文/视频生成专用

老黄又放大招：这GPU能让AI”吃到撑”？

老黄（NVIDIA CEO黄仁勋）近日突然掏出个新玩意儿——Rubin CPX，号称是第一款专为超大上下文AI量身定做的CUDA GPU。简单来说，就是让AI能”一口气”推理数百万token，不再吃着碗里的，想着锅里的，CPU内存来回折腾。

50倍收益？老黄这次不像在画饼

老黄说了：投1亿，赚50亿！（换算一下，就是50倍收益）
这时候谁不心动？就算你数学再差，也知道”50倍”不是小数目。

业内大佬们已经坐不住了*：

Cursor：Rubin CPX能让程序员的键盘敲得更响（不，是说代码生成效率更高）。

Runway：AI这下能一口气生成8K电影了，再也不用分镜渲染卡成PPT了。

Magic：大模型自主代理？Rubin CPX能让AI自己给自己发工资了（误）。

所以这玩意儿到底啥来头？

Rubin CPX说白了就是——AI界的”自助餐之王”！

过去的GPU：”内存不够了，要不先吐出来点？”

Rubin CPX：”随便造，管够，再来三百万token也没问题！”

要是老黄这次没吹牛，那AI行业可能要集体喊一句：“老黄，这回我们真信你了！”

首款专为超大上下文AI打造的CUDA GPU

Rubin CPX：AI推理界的”肌肉猛男”

NVIDIA又放大招了！这次推出的Rubin CPX简直像是AI硬件界的”施瓦辛格”——单芯片设计，内藏NVFP4计算肌肉，专为AI推理量身打造，既要速度，又要省电，堪称”健身房里的低碳水饮食者”。
那么，它究竟有多强？让我们来掰扯掰扯：

性能：一拳超人级别

算力怪兽：NVFP4精度下飙出30PFLOPS，好比让一台超级计算机喝了十罐红牛，性能与精度两手抓，两手都不软。

内存豪华套餐：直接标配128GB GDDR7内存，别说AI模型了，就算你把《三体》全集塞进去让它分析，它也不会打哈欠。

对比A100：小学生VS重量级拳王

让我们拿老前辈A100来比划比划：

算力暴击：A100还在用FP16“掰手腕”，Rubin CPX早已用NVFP4实现了几个量级的飞跃，就像从自行车换成了宇宙飞船。

内存碾压：A100最大才80GB内存，Rubin CPX直接顶到128GB，让”超大上下文”的处理从此告别”内存焦虑”。

Bonus：注意力机制三倍速

比起NVIDIA GB300 NVL72系统，Rubin CPX的注意力机制快了整整3倍！这意味着什么？就是你家的AI现在不仅能看完《指环王》三部曲+导演剪辑版，还能边看边写影评，而且绝对不会中途睡着。
总之，Rubin CPX就是AI推理领域的“瑞士军刀+超级赛亚人”组合，又快又猛，还特别耐折腾！
英伟达新GPU，超长上下文/视频生成专用

英伟达新霸主：Rubin CPX——让你的算力原地翻跟头！

GPU内存不够用？别怕！Rubin CPX来拯救你的等待时间焦虑症！

Rubin CPX：单片强不强？看看就慌了

你以为单个Rubin CPX就已经让AI颤抖？错了！英伟达告诉你：

“单挑哪有群殴爽？！”*

于是，他们把它和好兄弟 NVIDIA Vera CPU、Rubin GPU 一组合，啪！诞生了一个全新神器——NVIDIA Vera Rubin NVL144 CPX平台。

性能数据：数字大到让人怀疑人生

8EFLOPS AI算力（1EFLOPS=1000PFLOPS，没事我也不懂，总之很多零）

100TB高速内存（你的硬盘：我惭愧地低下了头）

每秒1.7PB的内存带宽（比快递小哥跑腿还快）

对比前辈GB300 NVL72？整整提升了7.5倍！简直是AI界的涡轮增压！

还没完？是的，还可以更疯

你以为这就天花板了？天真！

Rubin NVL144 CPX还能召唤更多外挂：*

Quantum-X800 InfiniBand
Spectrum-X以太网
直接让算力联网，在多机之间疯狂蹦迪，性能再翻一个台阶！

总结：*

Rubin CPX 的问世，完美诠释了一句话：

“内存不够？那就用100TB砸晕你！”*

预计明年正式推出

黄氏魔法造出”语境吞噬兽”Rubin CPX，AI界准备集体失业吧！

老黄又双叒叕在厨房（不对，是实验室）搞出新玩意了！这次端出来的Rubin CPX简直是把”AI算力饥饿游戏”直接改写成”吃自助餐吃到扶墙出”的荒诞喜剧。

三大离谱技能点

“我的token比你命还长”模式

普通GPU处理长文本就像用吸管喝珍珠奶茶——总会被珍珠（token）卡住。而Rubin CPX直接上了液压挖掘机，一小时视频？百万token？不过是早餐前的小零食！

程序员下岗加速器

现在的AI编程助手顶多是”自动补全小秘”，Rubin CPX上岗后直接进化为：

理解你乱如麻的代码

顺手优化成艺术品

可能还会吐槽”这写法是祖传的吗？”

视频届的「量子速读」

传统GPU分析视频如同让树懒看《复联4》——片尾彩蛋都出了还没理清人物关系。现在？这边4K原片刚上传，那边AI已经：

生成1080P饭制版

写好万字拉片笔记

顺便给你的vlog打了差评

温馨（或不那么温馨）提示

企业级大饼套餐：NVIDIA配套软件栈齐全得像便利店关东煮，从底层加速到顶层应用，就差喂到嘴边了

上市倒计时：2026年底正式发售（也就是鞭策竞争对手：”你们的末日时钟还剩900天滴答响”）

副作用警告：届时技术论坛可能会出现新型凡尔赛：”哎呀Rubin把项目都优化完了，我这个CTO只能去开奶茶店了”

> 注：本文不适合NVIDIA股票持有者阅读，可能引发过度兴奋导致键盘进水

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

一颗小钢球背后的AI质检革命

# AI # AI新闻 # AI资讯

4个月前

7,7860

DeepSeek“极你太美”bug，官方回应了

# AI # AI新闻 # AI资讯

4个月前

9,8860

AI里最大的Bug，却也是人类文明最伟大的起点。

# AI # AI新闻 # AI资讯

4个月前

7,9280

GPT-5 上线第一剑，先斩意中人！Sam Altman 豪赌输了

# AI # AI新闻 # AI资讯

4个月前

820

英伟达新GPU，超长上下文/视频生成专用

老黄又双叒叕要掏空显卡玩家的钱包了！

Rubin CPX：专治“十万个为什么”的AI怪兽

为什么英伟达总能抢风头？

老黄又放大招：这GPU能让AI”吃到撑”？

50倍收益？老黄这次不像在画饼

所以这玩意儿到底啥来头？

首款专为超大上下文AI打造的CUDA GPU

Rubin CPX：AI推理界的”肌肉猛男”

性能：一拳超人级别

对比A100：小学生VS重量级拳王

Bonus：注意力机制三倍速

英伟达新霸主：Rubin CPX——让你的算力原地翻跟头！

Rubin CPX：单片强不强？看看就慌了

性能数据：数字大到让人怀疑人生

还没完？是的，还可以更疯

预计明年正式推出

黄氏魔法造出”语境吞噬兽”Rubin CPX，AI界准备集体失业吧！

三大离谱技能点

温馨（或不那么温馨）提示

动动念头就能操作手机！MIT意念控制设备，不动嘴不动手，“读心”准确率92%

一致性对标Nano Banana，国产Vidu Q1同时支持7张参考 | 实测

相关文章

一颗小钢球背后的AI质检革命

DeepSeek“极你太美”bug，官方回应了

AI里最大的Bug，却也是人类文明最伟大的起点。

GPT-5 上线第一剑，先斩意中人！Sam Altman 豪赌输了

暂无评论

搜索文章

热门文章