一口气上架两个大模型，DeepSeek大动作来了！推理能力全球领先，输出长度大幅降低，显著减少计算开销与用户等待时间

文/第三方供稿2025-12-01 21:56:00来源:第三方供稿

一口气上架两个大模型，DeepSeek大动作来了！

12月1日晚间，DeepSeek正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。官方网页端、App及API已同步更新至V3.2版本。DeepSeek-V3.2的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用 Agent 任务场景。DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致，探索模型能力的边界。

根据官方数据显示，在公开的推理基准测试中，DeepSeek-V3.2的推理能力达到GPT-5水平，与Gemini-3.0-Pro接近，相比 Kimi-K2-Thinking，V3.2 的输出长度大幅降低，显著减少了计算开销与用户等待时间。

推理能力全球领先

DeepSeek-V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版，同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力，在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro（见表1）。更令人瞩目的是，V3.2-Speciale 模型成功斩获 IMO 2025（国际数学奥林匹克）、CMO 2025（中国数学奥林匹克）、ICPC World Finals 2025（国际大学生程序设计竞赛全球总决赛）及 IOI 2025（国际信息学奥林匹克）金牌。其中，ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

不过，目前，DeepSeek-V3.2-Speciale 仅供研究使用，不支持工具调用，暂未针对日常对话与写作任务进行专项优化。

值得注意的是，此次新模型开始向智能体发力。

此次DeepSeek提出了一种大规模 Agent 训练数据合成方法，构造了大量「难解答，易验证」的强化学习任务（1800 环境，85,000 复杂指令），大幅提高了模型的泛化能力。DeepSeek-V3.2 模型在智能体评测中达到了当前开源模型的最高水平，大幅缩小了开源模型与闭源模型的差距。值得说明的是，V3.2 并没有针对这些测试集的工具进行特殊训练，DeepSeek认为，V3.2 在真实应用场景中能够展现出较强的泛化性。

DeepSeek大模型更新速度非常快

目前，DeepSeek大模型更新速度非常的快。

8月21日下午，DeepSeek正式发布DeepSeek-V3.1。本次升级包含以下主要变化：混合推理架构：一个模型同时支持思考模式与非思考模式；更高的思考效率：相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案；更强的Agent能力：通过Post-Training优化，新模型在工具使用与智能体任务中的表现有较大提升。DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章提到，DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。

9月29日，DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。此款，模型在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制，旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。

DeepSeek-R2模型暂未发布

2023年4月，梁文锋控制的幻方量化公告称“将集中资源和力量，全力投身人工智能技术，成立新的独立研究组织，探索AGI的本质”，随后成立深度求索（DeepSeek）公司。

今年1月20日，DeepSeek推出大模型R1，并表示“在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版”，但DeepSeek-R1的推理成本仅为29.4万美元，低到惊人。即便加上约600万美元的基础模型训练开销，整体成本依然远低于国外巨头。

随后DeepSeek凭借超强的性能和极低训练成本强势崛起，在全球科技圈受到广泛关注。

1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。同日，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。对此，《黑神话：悟空》制作人冯骥表示DeepSeek可能是个国运级别的科技成果。

随后A股迎来DeepSeek时刻，中国资产被重估，A股算力租赁、云计算等指数春节后飙涨逾40%。新炬网络走出10连板，杭钢股份实现17天13板，路桥信息、每日互动等概念股年内最高涨幅均超300%。

5月底，DeepSeek表示，DeepSeek R1模型已完成小版本升级。

8月12日，市场上突然传出消息称DeepSeek-R2的预计发布时间窗口为2025年8月15日至8月30日，但具体日期尚未官宣。此前市场期盼DeepSeek-R2已经有一段时间，而在ChatGPT-5发布之后，市场对此的预期更盛。

随后，接近DeepSeek人士表示，该消息不实，并确认DeepSeek-R2在8月内并无发布计划。

截至目前，DeepSeek-R2模型没有发布。

掌握最新全球资讯，下载FX168财经APP

一口气上架两个大模型，DeepSeek大动作来了！推理能力全球领先，输出长度大幅降低，显著减少计算开销与用户等待时间

文/第三方供稿2025-12-01 21:56:00来源:第三方供稿

相关推荐

一口气上架两个大模型，DeepSeek大动作来了！推理能力全球领先，输出长度大幅降低，显著减少计算开销与用户等待时间

一口气上架两个大模型，DeepSeek大动作来了！12月1日晚间，DeepSeek正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。官方网页端、App及API已同步更新至V3.2版本。DeepSeek-V3.2的目标是平衡推理能力与...