2026新年伊始,英伟达黄仁勋又让科技圈“虎躯一震”。
周一,在拉斯维加斯的CES 2026展会上,身着鳄鱼皮夹克的黄仁勋发表了长达90分钟的开年演讲。

这一次,老黄All in“物理AI”。
他重磅官宣全新Rubin平台即将问世,并一口气解密了6款芯片。
据说,它将降维打击上一代霸主Blackwell。
其推理、训练性能分别是Blackwell GB200的5倍和3.5倍,推理token生成成本降低至多10倍,训练混合专家模型(MoE)所需GPU数量减少4倍。
产品将于2026年下半年交付首批客户。
这意味着什么?全球AI算力告急?不存在的。
黄仁勋表示,人工智能的竞争已经拉开帷幕,大家都在努力迈向更高的阶段。
全新Rubin平台,是继Hopper、Blackwell之后的又一代AI计算架构。
平台以天文学家薇拉・鲁宾(Vera Rubin)的名字命名,配备了 NVIDIA Vera Rubin NVL72 机架级解决方案和 NVIDIA HGX Rubin NVL8 系统。
其由Vera CPU、Rubin GPU、NVLink6、ConnectX-9、BlueField-4、Spectrum-6六款协同工作的独立芯片组成,以此实现推理成本的革命性下降。

在六颗芯片中,Rubin GPU是核心。
Rubin 平台引入了五项创新,包括最新一代 NVIDIA NVLink 互连技术、Transformer 引擎、机密计算和 RAS 引擎,以及 NVIDIA Vera CPU。
这些突破将加速智能体 AI、高级推理和大规模混合专家(MoE)模型推理,其每 Token 成本比 NVIDIA Blackwell 平台低高达10倍。
与前代产品相比,NVIDIA Rubin 平台训练 MoE 模型所需的GPU数量减少了4倍。
黄仁勋直言,Rubin开启了下一代人工智能。
目前,Rubin平台已进入全面生产阶段。
预计将于2026年下半年通过戴尔、HPE、联想、云服务商等合作伙伴推向市场。
为了加速全行业的AI开发,黄仁勋带来了四款针对不同垂直领域的开源模型。
Nemotron(智能体AI): 专注于逻辑推理与任务执行的Agent模型。
Cosmos(物理AI): 专注于理解物理规律和环境交互的基础模型。
Alpamayo(自动驾驶): 业界首个开源VLA(视觉-语言-动作)模型,支持端到端推理。
Clara(医疗健康): 专用于生物医药研发与医疗影像分析的模型。
其中,汽车是物理AI落地的首个大规模场景。
黄仁勋表示,未来十年里,他相当肯定世界上很大一部分汽车将是自动驾驶或高度自动驾驶的。
他还大篇幅展示了英伟达在机器人与自动驾驶领域的进展。
Isaac GR00T N1:新一代人形机器人基础模型,可在模拟环境中学习行走、抓取、协作,并迁移到真实机器人。
DRIVE Thor:面向L4/L5级自动驾驶的车载AI芯片,单芯片可同时运行自动驾驶、座舱AI、娱乐系统。
Omniverse Cloud:通过云平台连接数字孪生与物理设备,实现“在虚拟世界训练,在现实世界执行”。
在演讲中,黄仁勋还提到了国产开源模型。
他指出,开源模型的崛起成为全球创新的催化剂,其中Deepseek R1的出现意外推动了整个行业的变革。
目前全球涌现出多个开源模型,他们的性能越来越逼近领先的前沿大模型。
在演讲资料中,他展示了多个开源模型,包括Kimi K2、Qwen、DeepseekV3.2三家中国开源模型。

“我们现在知道,当开源、开放创新、全球每家公司每个行业的创新被激活时,AI将无处不在。与此同时,开放模型去年真的起飞了。AI模型现在能推理的能力强大得不可思议。”
黄仁勋认为,相比最前沿的AI模型,开源模型落后约6个月,但这个距离正逐步缩短,开源模型彻底改变了人工智能,吸引所有人参与其中。