
DeepSeek同时发布两个正式版模型
【DeepSeek同时发布两个正式版模型】世界顶级的人工智能竞赛中,一个来自中国的开源模型以人类顶尖选手的姿态摘金,其兄弟模型则被称为“新一代 GPT 平替”。这不只是一次产品迭代。2025 年 12 月 1 日,国内人工智能领域的领跑者深度求索公司,在官方渠道同步发布了两个全新的正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。前者迅速部署于官网、App 及 API 服务,面向所有用户免费提供;后者则以临时 API 形式限时开放,邀请全球研究社区共同评测。这场发布被业界视为一次里程碑式的“亮剑”:它不仅意味着国产大模型在核心推理能力上已能与国际顶级闭源产品正面交锋,更以极致的开源策略,对全球 AI 产业的商业模式和发展路径投下了一颗震撼弹。
深度求索此次发布的并非一个模型,而是一套目标清晰的“组合拳”。主打日常应用的 DeepSeek-V3.2,定位是成为用户高效、聪明的日常助手。它平衡了强大的推理能力与可控的输出长度,旨在提供迅捷的问答体验和智能体任务处理能力。官方数据显示,在公开的推理类基准测试中,V3.2 的表现达到了 GPT-5 的水平,仅略低于谷歌的旗舰模型 Gemini-3.0-Pro。更重要的是,与同类型号相比,它大幅降低了生成文本的长度,从而显著减少了计算开销和用户的等待时间。
另一个被命名为 DeepSeek-V3.2-Speciale 的模型,则展现了截然不同的野心。它是 V3.2 的“长思考”增强版,专为将开源模型的推理能力推向极致边界而生。这一模型结合了深度求索此前在数学领域的探索成果 DeepSeek-Math-V2 的定理证明能力,在需要复杂逻辑链条和严谨验证的任务上表现尤为突出。它的“战绩”令人瞩目:在 2025 年度国际数学奥林匹克、中国数学奥林匹克、国际大学生程序设计竞赛全球总决赛及国际信息学奥林匹克这四项全球顶级的智力竞赛中,全部获得了金牌成绩。其中,在 ICPC 和 IOI 的比赛中,其成绩甚至分别达到了人类选手第二名和第十名的水平。
强悍的推理能力是模型的“大脑”,而有效使用外部工具的能力就是其作用于现实的“手脚”。过往的 AI 模型,在思考模式和调用工具模式之间往往存在隔阂。DeepSeek-V3.2 的一个重大突破,在于它首次实现了将思考过程融入工具调用。这意味着模型可以在多轮复杂任务中,一边进行深度推理规划,一边执行具体的工具操作,并保持思维链的连贯性,从而完成跨语言调试代码、基于多重约束规划旅行方案等高难度任务。为实现这一能力,深度求索构建了一套大规模智能体训练数据合成方法,创造了超过 1800 个不同的任务环境和 85,000 多条复杂的指令用于训练。这使得模型在面对未经过特殊训练的新工具和新环境时,也展现出了强大的泛化能力,并在多项智能体评测中达到了当前开源模型的最高水平。
此次发布最具冲击力的部分,或许并非技术参数,而是其毫不妥协的开源策略。与 OpenAI 等公司将最先进模型作为核心商业资产严密保护的策略不同,深度求索将这两个功能强大的模型,以宽松的 MIT 许可证在主流平台全面开源。任何开发者、研究机构或企业都可以自由下载、修改甚至商业化部署这两个总计拥有 6850 亿参数的庞大模型,不受任何限制。这为全球,特别是预算有限的中小开发者和学术机构,提供了一条接触前沿 AI 能力的捷径,从根本上挑战了当前以高昂 API 订阅费为主的 AI 服务商业模式。深度求索似乎坚信,开放和协作的生态所能激发出的创新动能与市场影响力,其长期价值远超短期内通过闭源垄断所能获取的商业利益。
在追求性能巅峰的同时,深度求索并未忽视效率这一现实命脉。此次模型升级背后,一项名为“深度求索稀疏注意力”的关键架构创新功不可没。传统 AI 模型处理长文本时,计算量会随着文本长度呈平方级增长。而 DSA 机制通过一个被称为“闪电索引器”的组件,智能地筛选出当前任务最相关的上下文信息,从而大幅降低了处理长序列数据时的计算复杂度和成本。技术报告显示,这项创新将长文本推理的解码成本降低了约 70%。例如,处理相当于一本 300 页书籍长度的内容,成本从之前模型的每百万令牌 2.40 美元降至约 0.70 美元。这使得提供长达 128,000 令牌的上下文窗口服务,在经济上变得更加可行。
尽管成绩斐然,但深度求索和它的新模型依然面临着清晰的技术与市场挑战。技术层面,官方坦承,在追求极致性能的同时,“令牌效率”仍是一个待解的难题。V3.2-Speciale 在处理高度复杂任务时,虽然效果显著,但消耗的计算资源(Tokens)也呈数量级增加,成本高昂。因此,Speciale 版本目前仅作为研究平台限时开放,且不支持工具调用,也未对日常对话进行专门优化。此外,其知识面的广度与顶尖闭源模型相比仍存在差距。市场与监管层面,挑战更为复杂。作为一家中国 AI 公司,深度求索的全球拓展之路并非坦途。早先,意大利已下令封锁其应用。今年 6 月,柏林的数据保护专员裁定 DeepSeek 将德国用户数据传至中国的行为违反了欧盟法规。美国国会也有议员出于国家安全考虑,提议在政府设备中禁用该服务。这些数据主权和地缘政治带来的疑虑,可能成为其技术优势转化为全球市场份额的现实壁垒。
国产大模型“风向标”的这次重磅更新,迅速点燃了社交网络。在一个技术论坛上,有开发者留言道:“当最顶尖的能力可以被免费下载和修改时,创新的闸门才算真正被打开了。”知名科技媒体 VentureBeat 则在其报道的标题中,直接将这两个新模型称为“足以比肩 GPT-5 的疯狂强大的 AI 模型”,并指出它们“完全免费”。从力压人类奥赛金牌得主,到成为开发者口中的“GPT 平替”,DeepSeek-V3.2 系列模型的发布清晰地传递出一个信号:人工智能竞争的焦点,正在从纯粹的性能攀比,转向性能、效率、成本与生态构建的综合较量。当顶尖的 AI 能力开始通过开源社区在全球自由流动,它所催生的变革将远超我们的想象。