
演讲主线概述
根据 www.Todayusstock.com 报道,北京时间1月6日,英伟达CEO黄仁勋在CES 2026主舞台发布重磅演讲。一年后,AI行业从2025年的愿景展示转向“如何实现”阶段。黄仁勋强调,开源模型如DeepSeek R1加速全球协作,尽管能力落后前沿半年,但每六个月追近一次,使用量爆发式增长。本次演讲围绕三条主线:基础设施重构解决长期推理瓶颈、模型向Agentic AI转型、能力嵌入自动驾驶与机器人等物理场景。
Rubin架构详解
Rubin平台首次完整披露性能数据,针对推理时代需求设计。以下表格对比Rubin与Blackwell关键指标:
| 指标 | Rubin | 对比Blackwell | 意义 |
|---|---|---|---|
| NVFP4推理性能 | 50 PFLOPS | 5倍 | 推理速度大幅提升 |
| 训练性能 | 35 PFLOPS | 3.5倍 | 训练效率跃升 |
| HBM4内存带宽 | 22 TB/s | 2.8倍 | 数据吞吐更强 |
| 单GPU NVLink带宽 | 3.6 TB/s | 翻倍 | 多卡协同更高效 |
| MoE训练所需GPU | 减少 | 1/4 | 成本大幅降低 |
| 推理token成本 | 降低 | 最高10倍 | 商用门槛降低 |
核心组件包括Vera CPU(88个Olympus核心、1.5TB内存)、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6。NVL72机架含220万亿晶体管、260 TB/s带宽,支持机架级机密计算。
推理成本革命
黄仁勋强调“Test-time Scaling”:让AI“多想一会儿”而非单纯增大模型。Rubin GPU一次处理更多任务、记住更长上下文,减少GPU依赖,实现推理更快更省。微软Fairwater超级工厂将部署数十万Vera Rubin芯片,CoreWeave等云厂商2026年下半年提供实例。
上下文内存存储
针对KV Cache存储瓶颈,英伟达推出推理上下文内存存储平台,由BlueField-4驱动,结合Spectrum-X以太网与DOCA等软件,在GPU内存与传统存储间创建高速“第三层”。效果:在特定场景下token处理速度提升最高5倍,支持多轮对话、多智能体长期运行。
新一代DGX SuperPOD
新一代DGX SuperPOD由8个NVL72机架组成,总576个GPU。核心组件包括NVLink 6扩展网络、Spectrum-X以太网、推理上下文内存平台与Mission Control软件。新一代交换机引入共封装光学(CPO)技术,降低功耗延迟,提供开箱即用大规模AI集群方案。
开源AI全家桶
英伟达扩展Open Model Universe,开源六大领域模型与工具链,包括生物医学(Clara)、物理模拟(Earth-2)、Agentic AI(Nemotron)、物理AI(Cosmos)、机器人(GR00T)、自动驾驶(Alpamayo)。Nemotron系列覆盖推理、RAG、安全、语音,提供完整数据集、代码与模板,降低企业开发门槛。
物理AI落地
Cosmos开源物理世界基础模型,支持视频生成、轨迹预测。Alpamayo首个开源视觉-语言-行动推理模型,推动自动驾驶从规则向“像人思考”转型。DRIVE系统量产,2026年搭载梅赛德斯-奔驰CLA。GR00T生态吸引Boston Dynamics等领军企业,覆盖工业、手术、人形机器人。
编辑总结
英伟达CES 2026演讲标志从生成AI向Agentic与物理AI全面转型。Rubin平台通过架构创新将推理成本降至1/10、训练GPU需求降至1/4,结合上下文内存存储与SuperPOD,提供长期运行基础设施。开源全家桶与Cosmos、Alpamayo、GR00T加速落地,微软等巨头快速采用显示商用前景明朗。英伟达正构建推理时代完整生态,巩固AI基础设施领导地位。
【常见问题解答】
问题1:Rubin平台最大突破是什么? 通过Test-time Scaling,让AI“多想一会儿”经济可行。Rubin在推理性能5倍、成本降10倍、MoE训练GPU减至1/4,实现从生成向持续思考转型,解决长期运行瓶颈。
问题2:上下文内存存储平台如何工作? 在GPU内存与传统存储间创建高速共享层,由BlueField-4加速管理,结合Spectrum-X网络与软件优化。支持多节点上下文共享,token处理速度提升5倍,适合多轮对话与多智能体协作。
问题3:DGX SuperPOD有何意义? 将576个Rubin GPU扩展为标准化集群,提供开箱即用大规模方案。引入CPO技术降低功耗延迟,适用于超大规模训练与数千Agentic AI同时服务。
问题4:开源全家桶对行业影响多大? 覆盖六大领域完整资源,从数据集到部署模板,大幅降低企业与研究机构门槛。Nemotron系列强化RAG、安全、语音能力,加速Agentic AI商业化。
问题5:物理AI落地进展如何? Cosmos生成物理视频、Alpamayo引入推理决策,DRIVE量产搭载奔驰CLA;GR00T吸引全球机器人领军企业。合成数据与开源工具链解决真实数据不足,物理AI“ChatGPT时刻”临近。
来源:今日美股网