香港新闻网7月30日电 在商汤科技承办的大爱无疆·模塑未来WAIC 2025大模型论坛上,商汤科技发布全新“日日新SenseNova V6.5”(简称“日日新V6.5”)大模型体系,多模态基座大模型迎来突破性升级,实现由“生产力工具”进化为“生产力”。而商汤旗下核心产品 ─ 商汤小浣熊,亦完成了智能体升级。
全国工商联人工智能委员会主席团首任轮值主席、商汤科技董事长兼首席执行官徐立表示:“商汤科技始终探寻人工智能本质,以技术创新激发最大智能,推动AI完成从‘工具’到‘人’的跃迁,成为真正的生产力。”
商汤“日日新V6.5”多模态基座大模型带来三大突破性升级:强推理:图文交错多模态思维链,推理性能与Gemini 2.5 Pro、Claude 4-Sonnet看齐;高效率:优化多模态架构,性价比提升3倍以上;智能体:数据分析大幅领先,支持端到端的场景落地,实现价值闭环。

在人类的思考中,形象思维和逻辑思维同等重要,两者有机结合才能形成全面的思维能力。当前,主流的多模态模型虽然已经实现了在输入端融合多种模态,但思考推理过程依然主要依赖语言推理,图形和空间推理仍存在不足之处。多模态思维链构造的关键,在于信息的图形化表达,相比纯文本思维链更具挑战,不仅要呈现文字思考过程,还需生成作为思考节点的图像,难以通过纯人工方式大规模实现。商汤研发团队先基于对思维过程的理解构造种子数据,经监督微调(SFT)训练,让模型初步具备图文交错思考能力,再通过多轮强化学习,显著提升多模态推理能力。
同时,商汤还改进了多模态模型的融合架构,促进跨模态早期融合。新的架构采用了显著变轻的视觉编码器,以及深而窄的主干模型,使得视觉表征在前馈计算早期就与语言进行对齐和交融,从而感知更高效,模态融合更深。
受惠于模型架构的改进,商汤“日日新V6.5”在实现成本优化的同时,预训练吞吐量提升了20%以上,强化学习效率提升了40%,推理吞吐量提升了35%以上,取得性能和成本的完美平衡。相较“日日新V6.0”,“日日新V6.5”将性价比提升了3倍。(完)