商汤大模型体系“日日新6.5”全新升级 性价比提升3倍以上
创始人
2025-07-30 13:04:58
0

香港新闻网7月30日电 在商汤科技承办的大爱无疆·模塑未来WAIC 2025大模型论坛上,商汤科技发布全新“日日新SenseNova V6.5”(简称“日日新V6.5”)大模型体系,多模态基座大模型迎来突破性升级,实现由“生产力工具”进化为“生产力”。而商汤旗下核心产品 ─ 商汤小浣熊,亦完成了智能体升级。

全国工商联人工智能委员会主席团首任轮值主席、商汤科技董事长兼首席执行官徐立表示:“商汤科技始终探寻人工智能本质,以技术创新激发最大智能,推动AI完成从‘工具’到‘人’的跃迁,成为真正的生产力。”

商汤“日日新V6.5”多模态基座大模型带来三大突破性升级:强推理:图文交错多模态思维链,推理性能与Gemini 2.5 Pro、Claude 4-Sonnet看齐;高效率:优化多模态架构,性价比提升3倍以上;智能体:数据分析大幅领先,支持端到端的场景落地,实现价值闭环。

hk_c_image.png

在人类的思考中,形象思维和逻辑思维同等重要,两者有机结合才能形成全面的思维能力。当前,主流的多模态模型虽然已经实现了在输入端融合多种模态,但思考推理过程依然主要依赖语言推理,图形和空间推理仍存在不足之处。多模态思维链构造的关键,在于信息的图形化表达,相比纯文本思维链更具挑战,不仅要呈现文字思考过程,还需生成作为思考节点的图像,难以通过纯人工方式大规模实现。商汤研发团队先基于对思维过程的理解构造种子数据,经监督微调(SFT)训练,让模型初步具备图文交错思考能力,再通过多轮强化学习,显著提升多模态推理能力。

同时,商汤还改进了多模态模型的融合架构,促进跨模态早期融合。新的架构采用了显著变轻的视觉编码器,以及深而窄的主干模型,使得视觉表征在前馈计算早期就与语言进行对齐和交融,从而感知更高效,模态融合更深。

受惠于模型架构的改进,商汤“日日新V6.5”在实现成本优化的同时,预训练吞吐量提升了20%以上,强化学习效率提升了40%,推理吞吐量提升了35%以上,取得性能和成本的完美平衡。相较“日日新V6.0”,“日日新V6.5”将性价比提升了3倍。(完)

相关内容

热门资讯

香港雇员2024年工资中位数达... 香港中通社3月24日电(记者 谭畅)香港特区政府统计处24日公布数字,去年5月至6月香港雇员的每月工...
IDA携东亚银行探索香港稳定币... 香港新闻网12月11日电 香港金融科技公司 IDA 宣布与东亚银行有限公司展开合作,以支持香港的数字...
中央赠港大熊猫即将亮相市民期待... 香港中通社12月6日电题:中央赠港大熊猫即将亮相 市民期待拆“礼物”作者陈卓仪 梁嘉轩中央赠港大熊猫...
特首办谈李家超再访中东   香港中通社5月6日电 题:特首办谈李家超再访中东  香港中通社记者 罗光萍 陈卓仪  香港特区行...
180度大转弯?美国豁免手机、... 香港新闻网4月13日电 美国海关与边境保护局11日晚宣布,联邦政府已同意对智能手机、电脑、芯片等电子...
中国收紧7类稀土出口管制 ... 香港新闻网4月7日电 中国4月4日反击美国征收对等关税,包括当天起对7类中重稀土实施出口管制。这些...
香港警队新任“一哥”周一鸣:警... 香港新闻网4月2日电(记者 张明臻)香港新任警务处处长周一鸣今天履新,他在警察总部会见传媒时提出未来...
香港廉署接待“一带一路”两国斯... 香港新闻网3月26日电 香港廉政公署3月24日起接待一带一路国家斯里兰卡及赞比亚的反贪机构高层代表...
研究指香港未来10年点对点交通... 香港中通社3月25日电 香港特区政府正就网约车平台研究相关规管措施,网约车平台Uber于25日公布香...
【来论】刘喆:希望之路,还是漫... 中缅铁路,这条计划连接昆明与缅甸皎漂深水港的交通走廊,是未来中国通向印度洋的关键战略通道,也是中缅经...