阿里发布千问旗舰模型Qwen3-Max-Thinking，高阶推理能力比肩国际顶尖

2026/01/27 09:44来源:第三方供稿

新时空讯：阿里于2026年1月26日晚发布千问系列旗舰推理模型Qwen3-Max-Thinking，该模型以超万亿参数量、36T Tokens预训练数据为基础，经大规模强化学习打磨，在高阶推理领域实现国产大模型的重要突破，性能比肩国际头部产品。

据悉，该模型核心改进聚焦两大技术创新。其一为自适应工具调用能力，现已上线Qwen Chat，可在对话中自主判断并调用内置搜索、记忆及代码解释器功能，有效降低AI“幻觉”风险；其二是测试时扩展技术，通过“经验提取”式反思避免冗余计算，在相同算力下聚焦难点突破，使GPQA科学知识测试得分从90.3升至92.8，LiveCodeBench编程测试从88.0提升至91.4，关键推理性能超越Gemini 3 Pro。

性能比拼中，该模型表现亮眼。在HLE工具调用基准测试中以58.3分远超GPT-5.2-Thinking（45.5分）及Gemini 3 Pro（45.8分）；IMO级数学推理测试获91.5分登顶，预览版曾拿下AIME 25与HMMT 25双满分。

新时空声明： 本内容为新时空原创内容，复制、转载或以其他任何方式使用本内容，须注明来源“新时空”或“NewTimeSpace”。新时空及授权的第三方信息提供者竭力确保数据准确可靠，但不保证数据绝对正确。本內容仅供参考，不构成任何投资建议，交易风险自担。

本文转载自新时空，原文链接:https://www.newtimespace.com/zh-cn/finance/1369241.html

阿里发布千问旗舰模型Qwen3-Max-Thinking，高阶推理能力比肩国际顶尖

2026/01/27 09:44来源:第三方供稿

编辑:第三方供稿

相关