AI一周见闻：OpenAI放出史诗级更新，小工具们要玩完了？腾讯云MaaS再升级，阿里发布【通义万相】 | 见智研究

2023/07/09 21:52

1、ChatGPT数据分析史诗级更新！领跑所有大模型厂商；2、首个国家大模型标准化专题组成立；3、华为发布昇腾AI大模型训推一体化解决方案； 4、腾讯MaaS再升级、加速场景落地； 5、商汤日日新大模型体系多维度升级； 6、阿里以模型为中心，打造MaaS平台服务，与应用共同发展； 7、科大讯飞星火大模型赋能多类应用。

本周最大的焦点在为期3天的2023世界人工智能大会，无论是论坛还是展会都人满为患，足以见得AI的热度比上海36的高温还“火热”。

大会上不仅展出了众多明星产品：比如特斯拉的机器人、魔法科技的超写实虚拟人直播间；还有大厂们的重磅来袭：腾讯云MaaS再升级，阿里发布【通义万相】；科大讯飞展出系列AI产品；WPS AI办公软件在线体验等等。

见智观点：

AI产业的发展现在有两种趋势：一方面：是大模型层出不穷；另一方面是AI应用快速落地；

从模型角度来看：主要包括通用大模型、多模态大模型和垂类大模型；

从应用角度来看：可谓是AI应用遍地开花：比如游戏、办公、医疗、教育、金融等等；

值得关注的是：通用大模型都在往大服务平台和专用领域模型发展；AI消费级应用与产业级应用都来到了风口浪尖，拥有系统专业数据的行业落地速度更快。

本周要点

1、首个国家大模型标准化专题组成立

2、WAIC上大厂们的焦点：

华为发布昇腾AI大模型训推一体化解决方案

腾讯MaaS再升级、加速场景落地

商汤日日新大模型体系多维度升级

阿里以模型为中心，打造MaaS平台服务，与应用共同发展

科大讯飞星火大模型赋能多类应用

3、大模型：

ChatGPT数据分析史诗级更新！领跑所有大模型厂商

AI独角兽实在智能盯着这两大市场，模型厂布局应用正成为新趋势

国内发布首个胸部X-ray诊断大模型，医学大模型再次突破

4、AI应用

AI智能体成为科技巨头争抢的新风口

WPS AI惊艳亮相，调用国内三大顶尖模型

天猫精灵内测火爆，智能音箱是大模型落地最合适场景之一

正文

1、首个国家大模型标准化专题组成立

我国首个大模型标准化专题组成立，并正式启动了大模型测试国家标准的制定。上海人工智能创新中心担任该专题组的组长，百度、阿里、科大讯飞、三六零、华为和移动共同担任联席组长。

这一举措旨在推动大模型标准的制定和推广，进一步促进我国人工智能产业的发展，并为大模型的应用提供统一的标准和指导。通过标准化的测试和评估，可以提高大模型的可靠性和互操作性，推动行业的合作和创新，推动人工智能技术的发展和应用。还有九大重磅产品亮相：

聚焦大厂

1、华为发布昇腾AI大模型训推一体化解决方案

华为与四家伙伴联合发布的昇腾AI大模型训推一体化解决方案，实现了训推一体，提供了简便的解决方案，使客户能够在同一集群内无缝切换大模型的训练和推理过程，提高大模型训练和推理的效率。

该解决方案包含了大模型推理引擎、调优工具和算子加速库，支持开箱即用，无需进行二次硬件适配，降低了技术门槛，让客户可以直接使用大型预训练模型。

2、腾讯MaaS再升级、加速场景落地

腾讯公布了技术底座、创新场景、AI for Science三大领域升级，这是继6月行业大模型技术解决方案后的再次更新；腾讯云MaaS再升级，落地金融风控、交互翻译、数智人等场景。

升级包括：自研的星脉高性能计算网络，实现了40%的GPU利用率提升，并节省了30%~60%的模型训练成本，为AI大模型带来了10倍的通信性能提升。

在应用创新方面，腾讯云行业大模型能力应用到金融风控、交互翻译、数智人客服等场景中。

3、商汤日日新大模型体系多维度升级

商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制，并推出不同参数量级的模型版本，可完美适配移动端、云端等不同终端及场景的应用需求，降低部署成本。

商汤秒画SenseMirage 3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级，能够实现专业摄影级的图片细节刻画。

商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上，实现4K高清视频效果，并带来AIGC生成形象及数字人歌唱功能。

商汤琼宇SenseSpace 2.0的空间重建效率提升20%，渲染性能提升50%，每100平方公里场景的建图时间仅需38小时即可完成（1200 TFLOPS/秒算力支持）。

商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

4、阿里发布ModelScopeGPT，进一步完善Maas业务，与应用共同发展

阿里在AI方向的战略是以模型为中心，打造MaaS平台服务，推出魔搭大模型调用工具ModelScopeGPT，这是国内推出的首个智能工具，目前具备完成单一任务、复合任务、多API规划调用、多轮对话API调用，模型知识问答等能力。

它能在接受自然语言指令后，将任务拆解为具体的细分步骤，而后通过阿里云通义千问大模型作为“中枢模型”，自动生成代码，调用魔搭社区里作为“任务模型”的其它AI模型。

阿里云的“大模型生态计划”——MaaS（模型即服务）不仅有魔搭社区这样的开发者生态层，更重要的是还有提升大模型训练稳定性、提供模型调用等服务的AI平台层（PAI机器学习平台、灵积模型服务），以及提供核心算力的基础设施层（灵骏智算集群）。

一方面，在基础设施层，阿里云拥有当前国内TOP级的智能算力储备。即使是多个万亿参数大模型同时在阿里云上训练，对硬件设施而言也没有什么压力。

另一方面，在AI平台层，阿里云还提供了对应的平台来实现软硬件加速服务和模型服务。

除了通义千问和通义听悟以外，在这次WAIC大会论坛上，阿里云还发布了AI绘画大模型【通义万相】。

通义万相：是基于阿里研发的组合式生成模型Composer开发的，该模型通过拆解和组合配色、布局、风格等图像设计元素，提供高度可控和自由度极大的图像生成效果。首批上线3大能力：文生图、相似图片生成和图像风格迁移。

5、科大讯飞星火大模型赋能多类应用

科大讯飞现在最受关注的是星火大模型以及赋能教育、医疗、办公等场景应用成果。

包括基于大模型的AI学习机、办公本、基于星火的“数字人新闻官” 讯飞语伴APP、讯飞听见智慧屏畅享版、工业大模型“羚机一动”与讯飞医疗诊后康复管理平台等。

大模型

1、ChatGPT数据分析史诗级更新！领跑所有大模型厂商

OpenAI宣布将所有ChatGPT Plus用户开放代码解析器功能，这一功能被称为自发布GPT-4以来最强大的功能。

更新重点：数据分析功能。更新代码解释器插件的ChatGPT能够运行代码和访问用户上传的文件，实现数据分析、图表创建；

文件编辑、数学运算；

将文本数据可视化等复杂的数据分析；这项功能适用于销售、人力资源、医疗、制造、媒体和金融等业务场景。

值得关注的是：本次更新使得非专业代码人员能够通过自然语言文本和数据文件快速创建可视化数据分析图表。

见智实测感受：新功能不仅能够自行处理数据，甚至可以替代CRM的基础功能；

见智点评：

ChatGPT解析器功能这一重磅更新，无疑展示出openAI 在人工智能领域的领先优势，本次更新功能一方面是为用户提供了更高级的工具和功能，给以前的在线修图、数据分析软件工具、文件格式转换以及代码解读工具带来了巨大冲击。

另一方面也展示出交互方式的升级，更简单的自然语言交互，则会使得受众群体更广泛，操作起来也更便捷。

2、独角兽实在智能盯着这两大市场，模型厂布局应用正成为新趋势

国内AI公司实在智能发布了他们自研的大语言模型TARS（塔斯），并正式开启内测阶段。TARS基于开源基座模型，在千亿级高质量Tokens上进行了充分训练，完整复现了Pretrain、SFT和RLHF三个阶段，语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。

应用领域：

将作为实在智能IDP文档审阅产品的下一代核心引擎，为更多企业提供更准确、高效的文档处理能力

将与实在RPA（机器人流程自动化）实现完美融合，前者提供自然语言理解及逻辑知识的归纳泛化能力；后者基于实在智能自研的“智能屏幕语义理解技术（ISSUT）”，实现对一切屏幕上一切元素的自动化操作。

见智点评：

TARS大模型的上线内测，标志着国内AI领域的快速发展。借助TARS大模型的语言理解和深度学习能力，IDP将升级为Chat-IDP，为用户提供与文档直接“对话”的能力，可更准确地识别、提取和审阅文档内容，大幅提升自动化办公效率。实在智能在推动AI技术与RPA产品深度融合方面，再上新台阶。

3、国内发布首个胸部X-ray诊断大模型，医学大模型再次突破

上海交通大学与上海人工智能实验室联合团队聚焦医学人工智能，提出了首个基于医学领域知识增强的 Chest X-ray 的基础模型：即 KAD（Knowledge-enhanced Auto Diagnosis Model），论文成果入选Nature子刊。

重点内容：

KAD模型通过在大规模医学影像与放射报告数据进行预训练，通过文本编码器对高质量医疗知识图谱进行隐空间嵌入，利用视觉 - 语言模型联合训练实现了知识增强的表征学习。
在不需要任何额外标注情况下，KAD 模型即可直接应用于任意胸片相关疾病的诊断，为开发人工智能辅助诊断的基础模型提供了一条切实可行的技术路线。
KAD模型提出了一种基于知识增强的表征学习方法，为医疗基础模型的应用和落地提供了解决方案。其训练框架只需要影像-报告数据，不依赖于人工注释，并且无需监督微调即可达到与专业医生相当的精度。

见智点评：

KAD模型在医学人工智能领域具有重要的意义和影响。它为医学影像诊断提供了一种新的技术路线，能够加速诊断过程、提高准确性，并为医生提供更多的辅助信息。这一创新有望推动医疗基础模型在临床实践中的应用，提高医疗效率和诊断准确性。

AI应用

1、AI智能体成为科技巨头争抢的新风口

OpenAI内部对于新的AI智能体论文表现出极大兴趣，并进行认真讨论。与此同时，英伟达公司开源的VOYAGER也给AI圈带来了轰动效应。

作为一个基于大模型驱动和具备终身学习能力的游戏智能体，VOYAGER在《我的世界》中展现出了非凡的水平。这一成就进一步引发了对于AI智能体的兴趣，并被认为是通用人工智能（AGI）的雏形之一。

见智点评：

智能体的研究和开发有望为我们在未来实现通用人工智能的目标迈出重要一步。

尽管目前这些AI智能体还远未达到完全模拟人类智能的程度，但其出现表明了人工智能领域正在不断向前发展，并且吸引了全球范围内的关注。

比如已经出现用于科学发现的智能体ChemCro能够完成有机合成、药物发现和材料设计等任务；可以预见，更多令人惊叹的成果和突破将推动人工智能技术迈向新的高度。

2、WPS AI惊艳亮相，调用国内三大顶尖模型

金山办公的WPS AI已经逐步开放全新AI功能测试体验，尤其在办公三件套方面，全新的工作体验已经来临。

之前见智也发过内测体验：实测WPS AI系列产品功能强大，对比传统的办公三件套使用效率上，确实有相当程度的提升。

更值得关注的是：避开扎堆做大模型，金山办公选择接入了Minimax、智谱AI和文心一言三种大模型，并根据不同任务而调用相对优势的模型来处理”。相比自己开发大模型，公司更注重的是在大模型微调上下功夫，让每个模型都能充分发挥自身的优势。

见智点评：

WPS作为国内办公软件标杆，AI产品的落地意味着国内办公软件市场将开启全新的时代。此外，金山办公还展现出对大模型审慎选择和灵活运用，使用不同模型组合，进一步加强AI产品在调用方案上的最优策略，微调是应用端企业需要下功夫的地方，也是在大模型扎堆背景下AI应用企业的一个思路。

3、天猫精灵内测火爆，智能音箱是大模型落地最合适场景之一

近期，升级后的天猫精灵掀起网友们测试的狂热，视频爆火700w+;

天猫精灵升级后：声音、语调和内容生成就都发生显著变化。接入通义千问大模型后的天猫精灵不仅可以连续对话，还具有拟人情感，交流起来感觉更加智能，也更加贴心。

本次更新主要包括四大场景：知识探索、共情互动、生活妙招、灵感启发是四类建议对话场景。

见智点评：

天猫精灵内测表现反映出智能音箱现已可以由大模型驱动进行连续对话，将极大的改善用户的交互体验，成为大模型落地非常理想的终端应用之一；未来逐步开启大规模商用后，智能音箱很有可能也会给出全新的市场定价，但见智认为具有更好性能的科技产品不会因为价格上涨而阻碍销量。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

AI一周见闻：OpenAI放出史诗级更新，小工具们要玩完了？腾讯云MaaS再升级，阿里发布【通义万相】 | 见智研究

见智观点：

本周要点

正文

聚焦大厂

大模型

AI应用

一文读懂Token经济学新模式

“中国版谷歌”！花旗预测：阿里云AI相关收入未来五年CAGR增速将达90%，MAAS增速达235%

MiniMax想寻找下一个“10倍”

汽车的「OpenClaw 时刻」，到了？

夯爆了还是拉完了？HappyHorse首发实测：叙事感炸裂，价格真香！