华尔街见闻4月10日获悉,商汤发布日日新SenseNova V6。该模型具备长思维链、强数理能力、强推理能力和全局记忆的特点,采用6000亿参数MoE架构。通过多模态长思维链合成技术,商汤实现超长思维链的生成与验证,可以合成并理解64K tokens 的多模态长思维链;基于不同难度分级和多奖励模型的强化学习训练,使得该模型在多模态强化学习上突破,让模型推理能力提升的同时,依旧能自然表达情感;多模态全局记忆和多维信息压缩能力,让该模型可以将多元化信息在压缩后,保留核心语义,大幅提高处理效率。
商汤发布日日新SenseNova V6
从现场展示的评测数据看,SenseNova V6在纯文本任务和多模态任务中,多项指标超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3;强推理能力上,日日新V6/V6 Reasoner的多模态和语言深度推理任务能力超越OpenAI的o1和Gemini 2.0 flash-thinking的水平。(全天候科技)