
根据 www.Todayusstock.com 报道,周一英伟达正式发布最新开源人工智能模型家族Nemotron 3,同时提供配套数据和库,致力于为各行业开发者构建透明、高效、可定制的智能体AI(agentic AI)系统。公司强调,新系列在速度、成本和智能水平上全面优于前代产品。
受此消息提振,英伟达股价周一开盘上涨超1%,报177.23美元。Nemotron 3 Nano已上线,另外两款更大规模版本计划于2026年上半年推出。
Nemotron 3系列涵盖Nano、Super和Ultra三个版本,参数规模与应用场景差异显著:
| 版本 | 参数规模 | 主要定位 | 上线时间 |
|---|---|---|---|
| Nemotron 3 Nano | 300亿 | 目标明确、高效率任务 | 已上线 |
| Nemotron 3 Super | 1000亿 | 多智能体、高精度推理 | 2026上半年 |
| Nemotron 3 Ultra | 约5000亿 | 复杂场景、强大推理引擎 | 2026上半年 |
全系列支持100万token上下文长度,在大型代码库、长文档、多小时对话等场景中显著提升事实一致性与推理能力。
Nemotron 3引入创新混合潜在专家混合(latent Mixture-of-Experts,MoE)架构,结合选择性状态空间模型与Mamba-Transformer技术,大幅提升可扩展性和效率。
相比前代,该架构实现最多4倍token吞吐量提升,推理token生成量减少60%,显著降低延迟与成本。潜在MoE技术允许在相同成本下调用多达4倍专家数量,提升语义细节与多跳推理能力。
此外,模型采用多token预测(MTP)机制,一次前向计算可预测多个未来token,进一步加速长链推理、代码生成等场景。
Nemotron 3 Nano在Artificial Analysis Intelligence Index v3.0中以52分位居同规模模型首位。100万token上下文能力使智能体无需文本切分,即可完整保留证据集、历史记录与多阶段计划,特别适用于企业级检索增强生成、合规分析及大型代码仓库理解。
生成式AI软件副总裁Kari Briski表示,混合Mamba-Transformer架构运行更快、内存占用更低,避免了传统注意力机制的高昂键值缓存成本。
英伟达创始人兼CEO黄仁勋强调:“开放式创新是人工智能进步的基础。通过Nemotron,我们正在把先进AI转变为一个开放平台,为开发者提供在大规模构建智能体系统时所必需的透明性和效率。”
Kari Briski补充:“我们认为,凭借全新的混合专家架构与100万token上下文,我们在服务高度灵活定制模型的开发者方面具备独特优势。”她将潜在MoE比喻为“厨师共用大厨房但拥有各自调料架”,突出共享核心与专属专家的平衡设计。
Nemotron 3早期采用者包括埃森哲、CrowdStrike、德勤、安永、甲骨文云基础设施、Palantir、Perplexity、ServiceNow、西门子、Zoom等知名企业。
英伟达同步推出全新NeMoGym强化学习实验环境,并开放大规模后训练数据集、研究论文与示例提示词,承诺长期软件工程支持。Briski表示,此举旨在解决开发者面临的“开放、智能与效率”三重难题。
英伟达发布Nemotron 3开源模型系列,以突破性混合潜在MoE架构、100万token上下文及多token预测为核心亮点,实现效率与智能水平的双重跃升。Nano版已领先同规模模型,黄仁勋强调开放创新战略。公司通过大规模开放资源与NeMoGym环境,进一步巩固在开源AI领域的领先地位。早期众多企业采用显示市场认可度高,随着Super与Ultra版本2026年推出,英伟达有望在多智能体系统开发领域占据更主导位置,推动开源模型与闭源前沿模型的协同应用趋势。
问题1:Nemotron 3系列有哪些版本及其区别?系列包括Nano(300亿参数,已上线)、Super(1000亿参数)和Ultra(约5000亿参数,后两者2026上半年推出)。Nano注重效率,Super面向多智能体高精度推理,Ultra适用于最复杂场景,全系列支持100万token上下文。
问题2:Nemotron 3的核心技术创新是什么?引入混合潜在MoE架构,结合Mamba-Transformer与选择性状态空间模型,实现4倍吞吐量提升、60%推理成本降低;潜在MoE允许相同成本下调用4倍专家;多token预测加速长序列生成。
问题3:黄仁勋对Nemotron 3的评价如何?黄仁勋表示开放式创新是AI进步基础,Nemotron将先进AI转变为开放平台,为开发者提供大规模构建智能体系统所需的透明性和效率。
问题4:哪些企业已成为Nemotron 3早期采用者?包括埃森哲、CrowdStrike、德勤、安永、甲骨文云、Palantir、Perplexity、ServiceNow、西门子、Zoom等,覆盖咨询、安全、云服务、数据分析等多领域。
问题5:英伟达为何选择开源Nemotron 3?旨在解决开发者在开放、智能与效率间的取舍难题,提供可信赖、可深度定制的模型,同时公开大规模训练数据与NeMoGym环境,加速企业级多智能体系统创新,并与闭源模型形成互补。
来源:今日美股网