委内瑞拉事件引市场克制反应,现货黄金窄幅震荡油价曲线未现供应紧张信号
繁简切换

FX168财经网>合作>正文

委内瑞拉事件引市场克制反应,现货黄金窄幅震荡油价曲线未现供应紧张信号

文 / 第三方供稿 来源:第三方供稿

演讲主线概述

根据 www.Todayusstock.com 报道,北京时间1月6日,英伟达CEO黄仁勋在CES 2026主舞台发布重磅演讲。一年后,AI行业从2025年的愿景展示转向“如何实现”阶段。黄仁勋强调,开源模型如DeepSeek R1加速全球协作,尽管能力落后前沿半年,但每六个月追近一次,使用量爆发式增长。本次演讲围绕三条主线:基础设施重构解决长期推理瓶颈、模型向Agentic AI转型、能力嵌入自动驾驶与机器人等物理场景。

Rubin架构详解

Rubin平台首次完整披露性能数据,针对推理时代需求设计。以下表格对比Rubin与Blackwell关键指标:

指标 Rubin 对比Blackwell 意义
NVFP4推理性能 50 PFLOPS 5倍 推理速度大幅提升
训练性能 35 PFLOPS 3.5倍 训练效率跃升
HBM4内存带宽 22 TB/s 2.8倍 数据吞吐更强
单GPU NVLink带宽 3.6 TB/s 翻倍 多卡协同更高效
MoE训练所需GPU 减少 1/4 成本大幅降低
推理token成本 降低 最高10倍 商用门槛降低

核心组件包括Vera CPU(88个Olympus核心、1.5TB内存)、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6。NVL72机架含220万亿晶体管、260 TB/s带宽,支持机架级机密计算。

推理成本革命

黄仁勋强调“Test-time Scaling”:让AI“多想一会儿”而非单纯增大模型。Rubin GPU一次处理更多任务、记住更长上下文,减少GPU依赖,实现推理更快更省。微软Fairwater超级工厂将部署数十万Vera Rubin芯片,CoreWeave等云厂商2026年下半年提供实例。

上下文内存存储

针对KV Cache存储瓶颈,英伟达推出推理上下文内存存储平台,由BlueField-4驱动,结合Spectrum-X以太网与DOCA等软件,在GPU内存与传统存储间创建高速“第三层”。效果:在特定场景下token处理速度提升最高5倍,支持多轮对话、多智能体长期运行。

新一代DGX SuperPOD

新一代DGX SuperPOD由8个NVL72机架组成,总576个GPU。核心组件包括NVLink 6扩展网络、Spectrum-X以太网、推理上下文内存平台与Mission Control软件。新一代交换机引入共封装光学(CPO)技术,降低功耗延迟,提供开箱即用大规模AI集群方案。

开源AI全家桶

英伟达扩展Open Model Universe,开源六大领域模型与工具链,包括生物医学(Clara)、物理模拟(Earth-2)、Agentic AI(Nemotron)、物理AI(Cosmos)、机器人(GR00T)、自动驾驶(Alpamayo)。Nemotron系列覆盖推理、RAG、安全、语音,提供完整数据集、代码与模板,降低企业开发门槛。

物理AI落地

Cosmos开源物理世界基础模型,支持视频生成、轨迹预测。Alpamayo首个开源视觉-语言-行动推理模型,推动自动驾驶从规则向“像人思考”转型。DRIVE系统量产,2026年搭载梅赛德斯-奔驰CLA。GR00T生态吸引Boston Dynamics等领军企业,覆盖工业、手术、人形机器人。

编辑总结

英伟达CES 2026演讲标志从生成AI向Agentic与物理AI全面转型。Rubin平台通过架构创新将推理成本降至1/10、训练GPU需求降至1/4,结合上下文内存存储与SuperPOD,提供长期运行基础设施。开源全家桶与Cosmos、Alpamayo、GR00T加速落地,微软等巨头快速采用显示商用前景明朗。英伟达正构建推理时代完整生态,巩固AI基础设施领导地位。

【常见问题解答】

问题1:Rubin平台最大突破是什么?        通过Test-time Scaling,让AI“多想一会儿”经济可行。Rubin在推理性能5倍、成本降10倍、MoE训练GPU减至1/4,实现从生成向持续思考转型,解决长期运行瓶颈。

问题2:上下文内存存储平台如何工作?        在GPU内存与传统存储间创建高速共享层,由BlueField-4加速管理,结合Spectrum-X网络与软件优化。支持多节点上下文共享,token处理速度提升5倍,适合多轮对话与多智能体协作。

问题3:DGX SuperPOD有何意义?        将576个Rubin GPU扩展为标准化集群,提供开箱即用大规模方案。引入CPO技术降低功耗延迟,适用于超大规模训练与数千Agentic AI同时服务。

问题4:开源全家桶对行业影响多大?        覆盖六大领域完整资源,从数据集到部署模板,大幅降低企业与研究机构门槛。Nemotron系列强化RAG、安全、语音能力,加速Agentic AI商业化。

问题5:物理AI落地进展如何?        Cosmos生成物理视频、Alpamayo引入推理决策,DRIVE量产搭载奔驰CLA;GR00T吸引全球机器人领军企业。合成数据与开源工具链解决真实数据不足,物理AI“ChatGPT时刻”临近。

来源:今日美股网

分享
掌握最新全球资讯,下载FX168财经APP

相关文章

48小时/周排行

最热文章