
DeepSeek春节再扔王炸?最新披露
【DeepSeek春节再扔王炸?最新披露】2025年春节,DeepSeek-R1横空出世,一夜之间抹去标普500指数7500亿美元市值,创下美国股市史上最大单日跌幅纪录 。一年后的2026年春节,当所有竞争对手都在抢发新模型时,这家以“低成本”突破算力封锁的中国AI公司,却出人意料地保持了沉默。但沉默不代表静止。2月13日,澎湃新闻记者从知情人士处获悉,DeepSeek网页端及App正在测试新的长文本模型结构,支持1M上下文——这意味着其单次处理能力足以容纳《三体》三部曲全集(约90万字) 。而API服务维持不变,仍为V3.2版本,仅支持128K上下文 。这一静默更新,被外界普遍解读为DeepSeek或将在今年春节再次“炸场”发布新模型的信号,试图复刻去年春节的现象级轰动 。
回望2025年1月,DeepSeek凭借R1模型的系统性能效革命,彻底改变了全球对前沿模型成本曲线和中国竞争力的信念 。一年后,中国AI行业正在上演一场前所未有的“春节军备竞赛”——智谱、科大讯飞、MiniMax、字节跳动等厂商在农历新年前密集发布最新模型,试图抢占这个流量高峰与口碑传播的黄金窗口 。
智谱2月12日上线并开源GLM-5,宣称其“在真实编程场景的使用体感逼近Claude Opus 4.5”,在全球权威的Artificial Analysis榜单中位居全球第四、开源第一 。科大讯飞发布基于全国产算力训练的星火X2大模型,整体能力对标国际顶尖水平 。MiniMax推出M2.5模型,在处理复杂任务时展现出更高的决策成熟度 。字节跳动的Seedance 2.0视频生成模型更是在全球范围内引发关注,多位美国导演公开表示“好莱坞要完蛋了” 。
相比之下,DeepSeek的春节动作显得格外克制。除了2月11日悄悄将上下文窗口从128K扩展至1M、模型知识截止日期同步更新至2025年5月外,再无重大发布 。这次更新甚至引发了用户对其风格的吐槽——不少用户反馈,更新后的DeepSeek从之前的“热情风”变为“冷淡风”,不再称呼用户设定的昵称,统一称“用户”,被调侃为“又凶又冷漠” 。
有国产大模型厂商人士分析,这一版本类似于极速版,牺牲质量换速度,可能是为2026年2月中旬将发布的V4版本做最后的压力测试 。也有分析认为,先在V3上验证长上下文能力,再整合进全新架构,是新模型发布的常规路径 。
种种迹象表明,V4或许真的近了。今年1月12日,DeepSeek曾发布一篇新论文《基于可扩展查找的条件记忆:大语言模型稀疏性的新维度》,创始人梁文锋位列作者名单 。这篇论文直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念,当时行业就普遍猜测DeepSeek的下一代模型V4或将在今年春节前后正式发布 。
更直接的线索来自DeepSeek的官方GitHub仓库。有网友分析发现,一款代号“MODEL1”的模型在代码中被反复提及,其在KV缓存、稀疏FP8解码(推理能力)上有明显变化 。结合此前发布的mHC(流形约束超连接)和Engram架构论文,新模型或许在成本上还有明显改进 。
科技媒体The Information此前爆料称,DeepSeek将在2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4,将具备更强的写代码能力 。不过DeepSeek官方拒绝对任何发布时间表置评 。
作为当之无愧的大模型风向标,DeepSeek的一举一动都受到行业整体关注。网易有道词典发布的2025年度词汇中,“deepseek”以8672940次年度搜索量成功当选 。据有道词典负责人介绍,“deepseek”在词典内部的搜索曲线呈现明显的爆发式特征,从年初因“低成本”突破算力封锁起,几乎每个重要进展都会带动搜索量上涨 。
一年前,DeepSeek凭借更少的算力、不俗的成果、开源的模式等优势,在美区苹果商店免费下载量登顶,刷屏全球市场 。一年后,中国AI的全球市场份额已从约1%飙升至2025年11月的约15% 。Hugging Face在一周年回顾中指出,DeepSeek的崛起推动了开源AI生态的增长,迫使竞争对手纷纷加入开源运动 。
如今,市场的聚光灯不再只属于单一黑马。这场没有硝烟的春节“卡位战”正悄然提速,为2026年大模型竞赛按下加速键 。而DeepSeek的沉默与即将到来的V4,或许正是这盘大棋中最关键的一步。