阿里发布千问旗舰模型Qwen3-Max-Thinking,高阶推理能力比肩国际顶尖

2026/01/27 09:44来源:第三方供稿

新时空讯:阿里于2026年1月26日晚发布千问系列旗舰推理模型Qwen3-Max-Thinking,该模型以超万亿参数量、36T Tokens预训练数据为基础,经大规模强化学习打磨,在高阶推理领域实现国产大模型的重要突破,性能比肩国际头部产品。

据悉,该模型核心改进聚焦两大技术创新。其一为自适应工具调用能力,现已上线Qwen Chat,可在对话中自主判断并调用内置搜索、记忆及代码解释器功能,有效降低AI“幻觉”风险;其二是测试时扩展技术,通过“经验提取”式反思避免冗余计算,在相同算力下聚焦难点突破,使GPQA科学知识测试得分从90.3升至92.8,LiveCodeBench编程测试从88.0提升至91.4,关键推理性能超越Gemini 3 Pro。

性能比拼中,该模型表现亮眼。在HLE工具调用基准测试中以58.3分远超GPT-5.2-Thinking(45.5分)及Gemini 3 Pro(45.8分);IMO级数学推理测试获91.5分登顶,预览版曾拿下AIME 25与HMMT 25双满分。

新时空声明: 本内容为新时空原创内容,复制、转载或以其他任何方式使用本内容,须注明来源“新时空”或“NewTimeSpace”。新时空及授权的第三方信息提供者竭力确保数据准确可靠,但不保证数据绝对正确。本內容仅供参考,不构成任何投资建议,交易风险自担。

本文转载自新时空,原文链接:https://www.newtimespace.com/zh-cn/finance/1369241.html

编辑:第三方供稿