商汤大模型一体机可节约80%推理成本，完成云端边全栈布局

36氪

2024/04/24 18:04

“日日新5.0”大模型在主流客观评测上超越GPT-4 Turbo。

昨日，商汤科技SenseTime在上海举办技术交流日活动。会上商汤发布业内首个“云、端、边”全栈大模型产品矩阵，并推出全新升级的“日日新SenseNova 5.0”大模型体系。

影响至股价方面，商汤(00020.HK)今日开盘后大幅上涨。随后商汤在港交所公告称，商汤集团的B类股份自11时15分起暂停交易，暂停前涨幅达到31.15%。

日日新，出自《礼记·大学》中的“苟日新、日日新、又日新”。承载了人们对以大模型为代表的AI技术浪潮迭代，和走向AGI（通用人工智能）的期待。

目前，商汤“日日新SenseNova”大模型体系已正式完成5个版本迭代，基于超过10TB tokens训练、覆盖大量合成数据，“日日新SenseNova 5.0”（以下简称：「日日新5.0」）采用混合专家架构，推理时上下文窗口可以有效到200K左右。

具体到更新能力上，此次主要集中增强了知识、数学、推理及代码能力，全面对标GPT-4 Turbo，主流客观评测上达到或超越 GPT-4 Turbo。

「日日新5.0」能力评测

以模型的文科能力为例，「日日新5.0」创意写作能力、推理能力以及总结能力均大幅提升，相同的中文知识注入后，可以获得更好的理解总结及问答，为教育、内容产业等垂直应用场景提供有力辅助。

多模态能力方面，具体到应用产品中，「日日新5.0」可支持高清长图的解析和理解，以及文生图交互式生成，也能实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力。

「日日新5.0」和GPT-4回答趣味推理问题：“妈妈给圆圆冲了一杯咖啡，圆圆喝了半杯后，将它加满水，然后她又喝了半杯后，再加满水，最后全部喝完。问圆圆喝的咖啡多，还是水多？”，「日日新5.0」回答正确。

面对中心化算力需求向端侧扩展的未来趋势、和企业级在边缘侧的AI需求，商汤推出了“云、端、边”全栈大模型产品矩阵。其中包括应用于终端设备的“商汤端侧大模型”，及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

当前，金融、代码、医疗、政务等行业边缘侧AI应用需求呈爆发式增长，但在实际落地场景中，企业仍面临算力使用门槛高、能耗高等难题。

关注到这一现象，商汤寻求最优数据配比并建立数据质量评价体系，推动自身大模型研发的同时，也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

会上，商汤推出端云协同解决方案，可以通过智能化判断协同发挥端云各自优势，需要联网搜索或处理复杂场景时分流至云端处理，部分场景端侧处理占比超过80%，从而显著降低推理成本。

比如近期火爆的小米汽车SU7，其智能车舱中就应用了商汤的大模型技术。基于商汤端云大模型解决方案，小米小爱同学可以为车主提供智能化的交互体验。

同时在硬件方面，商汤本次发布的企业级大模型一体机，可支持企业级千亿模型加速和知识检索硬件加速，实现本地化部署，即买即用，降低企业应用大模型的门槛。相比行业同类产品，推理成本节约80%，检索大大加速，CPU工作负载50%。

伴随着尺度定律催生的模型性能大爆发，一方面，大模型发展已进入落地阶段，如何与产业、应用场景结合是关键一环；另一方面，“ScalingLaw（尺度定律）”路径逐渐清晰，“涌现”时刻不定出现，前瞻探索最先进的大模型技术也是重中之重。

商汤科技董事长兼CEO徐立表示：“商汤在尺度定律的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”

本文作者：黄楠，来源：36氪，原文标题：《「商汤」大模型一体机可节约80%推理成本，完成云端边全栈布局｜最前线》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。