英伟达发布Nemotron 3开源AI模型系列 Nano版领先同规模 黄仁勋强调开放创新

2025/12/16 08:11来源:第三方供稿

Nemotron 3系列发布概览

根据 www.Todayusstock.com 报道,周一英伟达正式发布最新开源人工智能模型家族Nemotron 3,同时提供配套数据和库,致力于为各行业开发者构建透明、高效、可定制的智能体AI(agentic AI)系统。公司强调,新系列在速度、成本和智能水平上全面优于前代产品。

受此消息提振,英伟达股价周一开盘上涨超1%,报177.23美元。Nemotron 3 Nano已上线,另外两款更大规模版本计划于2026年上半年推出。

三个版本参数与定位对比

Nemotron 3系列涵盖Nano、Super和Ultra三个版本,参数规模与应用场景差异显著:

版本 参数规模 主要定位 上线时间
Nemotron 3 Nano 300亿 目标明确、高效率任务 已上线
Nemotron 3 Super 1000亿 多智能体、高精度推理 2026上半年
Nemotron 3 Ultra 约5000亿 复杂场景、强大推理引擎 2026上半年

全系列支持100万token上下文长度,在大型代码库、长文档、多小时对话等场景中显著提升事实一致性与推理能力。

突破性混合MoE架构解析

Nemotron 3引入创新混合潜在专家混合(latent Mixture-of-Experts,MoE)架构,结合选择性状态空间模型与Mamba-Transformer技术,大幅提升可扩展性和效率。

相比前代,该架构实现最多4倍token吞吐量提升,推理token生成量减少60%,显著降低延迟与成本。潜在MoE技术允许在相同成本下调用多达4倍专家数量,提升语义细节与多跳推理能力。

此外,模型采用多token预测(MTP)机制,一次前向计算可预测多个未来token,进一步加速长链推理、代码生成等场景。

效率与上下文能力提升

Nemotron 3 Nano在Artificial Analysis Intelligence Index v3.0中以52分位居同规模模型首位。100万token上下文能力使智能体无需文本切分,即可完整保留证据集、历史记录与多阶段计划,特别适用于企业级检索增强生、合规分析及大型代码仓库理解。

生成式AI软件副总裁Kari Briski表示,混合Mamba-Transformer架构运行更快、内存占用更低,避免了传统注意力机制的高昂键值缓存成本。

黄仁勋与高管最新表态

英伟达创始人兼CEO黄仁勋强调:“开放式创新是人工智能进步的基础。通过Nemotron,我们正在把先进AI转变为一个开放平台,为开发者提供在大规模构建智能体系统时所必需的透明性和效率。”

Kari Briski补充:“我们认为,凭借全新的混合专家架构与100万token上下文,我们在服务高度灵活定制模型的开发者方面具备独特优势。”她将潜在MoE比喻为“厨师共用大厨房但拥有各自调料架”,突出共享核心与专属专家的平衡设计。

早期采用者与开放资源

Nemotron 3早期采用者包括埃森哲CrowdStrike德勤安永甲骨文云基础设施、PalantirPerplexityServiceNow西门子Zoom等知名企业。

英伟达同步推出全新NeMoGym强化学习实验环境,并开放大规模后训练数据集、研究论文与示例提示词,承诺长期软件工程支持。Briski表示,此举旨在解决开发者面临的“开放、智能与效率”三重难题。

编辑总结

英伟达发布Nemotron 3开源模型系列,以突破性混合潜在MoE架构、100万token上下文及多token预测为核心亮点,实现效率与智能水平的双重跃升。Nano版已领先同规模模型,黄仁勋强调开放创新战略。公司通过大规模开放资源与NeMoGym环境,进一步巩固在开源AI领域的领先地位。早期众多企业采用显示市场认可度高,随着Super与Ultra版本2026年推出,英伟达有望在多智能体系统开发领域占据更主导位置,推动开源模型与闭源前沿模型的协同应用趋势。

【常见问题解答】

问题1:Nemotron 3系列有哪些版本及其区别?系列包括Nano(300亿参数,已上线)、Super(1000亿参数)和Ultra(约5000亿参数,后两者2026上半年推出)。Nano注重效率,Super面向多智能体高精度推理,Ultra适用于最复杂场景,全系列支持100万token上下文。

问题2:Nemotron 3的核心技术创新是什么?引入混合潜在MoE架构,结合Mamba-Transformer与选择性状态空间模型,实现4倍吞吐量提升、60%推理成本降低;潜在MoE允许相同成本下调用4倍专家;多token预测加速长序列生成。

问题3:黄仁勋对Nemotron 3的评价如何?黄仁勋表示开放式创新是AI进步基础,Nemotron将先进AI转变为开放平台,为开发者提供大规模构建智能体系统所需的透明性和效率。

问题4:哪些企业已成为Nemotron 3早期采用者?包括埃森哲、CrowdStrike、德勤、安永、甲骨文云、Palantir、Perplexity、ServiceNow、西门子、Zoom等,覆盖咨询、安全、云服务、数据分析等多领域。

问题5:英伟达为何选择开源Nemotron 3?旨在解决开发者在开放、智能与效率间的取舍难题,提供可信赖、可深度定制的模型,同时公开大规模训练数据与NeMoGym环境,加速企业级多智能体系统创新,并与闭源模型形成互补。

来源:今日美股网

编辑:第三方供稿