华尔街见闻4月10日获悉,商汤发布日日新SenseNova V6。该模型具备长思维链、强数理能力、强推理能力和全局记忆的特点,采用6000亿参数MoE架构。通过多模态长思维链合成技术,商汤实现超长思维链的生成与验证,可以合成并理解64K tokens 的多模态长思维链;基于不同难度分级和多奖励模型的强化学习训练,使得该模型在多模态强化学习上突破,让模型推理能力提升的同时,依旧能自然表达情感;多模态全局记忆和多维信息压缩能力,让该模型可以将多元化信息在压缩后,保留核心语义,大幅提高处理效率。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。