AWS重磅发布Trainium 3首款3nm AI芯片!算力362PFLOPs、能效提升40%直追英伟达
繁简切换

FX168财经网>合作>正文

AWS重磅发布Trainium 3首款3nm AI芯片!算力362PFLOPs、能效提升40%直追英伟达

文 / 第三方供稿 来源:第三方供稿

Trainium 3核心参数跃升

根据 www.Todayusstock.com 报道,亚马逊云计算部门AWS在2025 re:Invent大会上正式发布第四代自研AI训练芯片Trainium 3,这是全球首款采用3nm制程的AWS专用AI加速器。单芯片提供高达2.52 PFLOPs的FP8算力,内存容量提升至144GB HBM3e(较Trainium 2增加1.5倍),内存带宽达到4.9TB/s(提升1.7倍)。

单台Trn3 UltraServer可搭载144颗Trainium 3芯片,总算力达到惊人的362 PFLOPs,聚合内存20.7TB、带宽706TB/s。官方数据显示,相比前代产品,训练与推理速度提升超4倍,能效提升40%,性能功耗比提升4倍。在Amazon Bedrock平台上,Trainium 3已成为最快加速器,每兆瓦token输出量增加超5倍。

指标 Trainium 3 Trainium 2 提升幅度
单芯片FP8算力 2.52 PFLOPs
内存容量 144GB HBM3e 约96GB 1.5倍
内存带宽 4.9TB/s 约2.9TB/s 1.7倍
系统能效 提升40% 基准 40%
训练/推理速度 提升超4倍 基准 300%以上

Trainium 4将支持NVLink Fusion

AWS同时预告正在研发的Trainium 4将原生支持英伟达NVLink Fusion高速互联技术。这意味着未来Trainium 4集群可与英伟达GPU实现无缝互操作,大幅降低现有基于CUDA开发的大型模型迁移门槛。AWS副总裁Dave Brown表示,这一兼容性设计将帮助客户在保留原有生态的同时享受亚马逊低成本硬件优势。

Nova 2家族四款新模型详解

AWS同步推出Nova 2系列四款前沿模型,全面覆盖推理、多模态、语音与生成任务:

  • Nova 2 Pro:亚马逊迄今最智能推理模型,在多项基准测试中超越Claude Sonnet 4.5与GPT-5.1。

  • Nova 2 Omni:业界首款统一多模态推理 生成模型,可同时处理75万token文本、数小时音频与长视频。

  • Nova 2 Sonic:100万token上下文的语音到语音模型,支持实时类人对话。

  • Nova 2 Lite:高性价比轻量级模型,13/15项测试优于Claude Haiku 4.5。

Nova Forge开创开放式训练

Nova Forge首次向企业开放全阶段模型检查点,允许客户将专有数据与亚马逊精选数据集混合训练,彻底解决“定制深度有限”与“从零训练成本高昂”两大痛点。Reddit、Booking.com、索尼等已采用该服务构建专属“Novellas”模型。

Nova Act浏览器任务自动化突破

Nova Act基于强化学习训练的定制Nova 2 Lite模型,实现浏览器端任务自动化可靠性高达90%。Hertz使用后将软件测试周期从数周缩短至数小时,1Password实现一键跨站自动登录。

市场与竞争格局影响

消息发布后,亚马逊股价一度逼近239美元创日内新高,涨幅扩大至2.2%,而英伟达早盘涨幅迅速收窄,AMD跌近2.1%。市场普遍认为,Trainium 3的高性价比与Trainium 4的NVLink兼容策略,将进一步压缩英伟达在云端训练市场的溢价空间。

编辑总结

AWS此次通过Trainium 3硬件、Nova 2模型矩阵与Nova Forge/Nova Act两大创新服务,构建起从底层算力到上层应用的完整自研AI生态闭环。3nm制程带来的性能与能效双提升,加上对NVLink Fusion的兼容支持,标志着亚马逊已从“性价比挑战者”正式升级为可与英伟达正面竞争的云端AI算力提供商。未来一年,Trainium生态的实际采用率与Anthropic等头部客户模型性能表现,将成为验证AWS战略成功与否的关键指标。

【常见问题解答】

Q1:Trainium 3相比英伟达当前主流芯片到底有多大优势?

A:虽然AWS未直接公布与H200/B200的横向对比数据,但从能效提升40%、性能功耗比提升4倍、每兆瓦token输出增加超5倍来看,在同等功耗下Trainium 3的实际训练吞吐量已极具竞争力。加上AWS一贯的按需计费模式,总拥有成本(TCO)预计比英伟达GPU集群低30%-50%。

Q2:为什么说Trainium 4支持NVLink Fusion是战略转折点?

A:过去最大迁移阻力在于CUDA生态锁定。Trainium 4通过NVLink Fusion实现与英伟达GPU物理层互连后,客户可在同一集群混合使用两家芯片,极大降低切换风险。这相当于为英伟达生态“留了后门”,大幅提升企业上云谈判筹码。

Q3:Nova Forge的“开放式训练”对企业到底意味着什么?

A:传统定制方案要么深度有限,要么需要从零训练成本数百亿美元。Nova Forge首次开放预训练 中期 后训练全阶段检查点,并允许企业注入专有数据混合训练,相当于把千亿美元级别的模型训练能力以服务形式开放,真正实现“企业专属大模型即服务”。

Q4:Anthropic同时用AWS和谷歌TPU,说明Trainium还不够强?

A:多云策略是当前所有头部AI公司的通用做法。Anthropic今年已与AWS签订数百亿美元Trainium算力协议,同时年底前将获得100万颗Trainium芯片,实际使用规模远超谷歌TPU,表明其对Trainium性价比高度认可。

Q5:普通投资者该如何看待本次发布对亚马逊股价的影响?

A:短期看,Trainium 3快速量产与高能效数据提振市场信心;中期看,Trainium 4的NVLink兼容将加速大客户迁移,增厚AWS高利润率AI业务占比;长期看,若2026年前Trainium市占率突破15%,有望为亚马逊贡献数百亿美元年收入,成为继Prime后的又一增长引擎。

来源:今日美股网

分享
掌握最新全球资讯,下载FX168财经APP

相关文章

48小时/周排行

最热文章