今日要点:
1、OpenAI遭客户抱怨,都怪GPU太缺货;
2、 OpenAI最新训练方法:用过程监督法降低“幻觉现象”;
3、中文AI大模型首个反歧视对抗性开源项目:每个人提出100道“有毒”问题;
4、 阿里云AI助手“通义听悟”公测,应用落地速度超预期。
海外AI
1、OpenAI遭客户抱怨,都怪GPU太缺货
OpenAI目前遭到客户最大的抱怨是API的可靠性和速度。OpenAI的CEO Sam Altman 承认当下GPU非常紧缺,这不得不推迟了许多的短期计划,微调 API 、专用容量产品都受到GPU 可用性的限制。不过,OpenAI还会提供专用容量,为客户提供模型的私人副本,但如若访问此服务,客户必须预先承诺支付100万美元。
此外,Sam Altman重申了他对开源重要性的信念,并表示OpenAI正在考虑开源GPT-3。
见智研究认为:在生成式AI需求的推动下,GPU产品会面临持续性的缺货和涨价,英伟达目前的交货周期还在不断拉长,从之前一个月到现在基本上需要三个月或者更久,甚至部份订单到年底才能交付。
GPU与CPU最大的不同就是拥有大量的并行计算单元,可以同时执行多个任务,特别是在大模型处理数据的时候能够显著提高速度,因此GPU的不足会直接影响API(程序之间的接口)之间的传输速度。
此外,大模型的开源路径已经成大势所趋,无论是语言大模型还是多模态大模型,Meta、Google以及Stable Diffusion都纷纷选择开源,现在连封闭大模型鼻祖openAI也选择逐渐开源的路径,可见大模型的发展趋势已经明朗。
2、OpenAI最新训练方法:用过程监督法降低“幻觉现象”
OpenAI发表最新的论文:《Let's Verify Step by Step》通过奖励每一个正确的推理步骤("过程监督"),而不仅仅是奖励正确的最终结果(“结果监督”),对思考链条中的每一个单独步骤提供反馈,能够极大解决诸如GPT4“胡说八道”和逻辑错误的这种“幻觉现象”。
见智研究认为:无论是过程监督还是结果监督都是对大模型生成结果可靠性和准确性的一种训练机制,而从过程开始监督的方式会比奖励正确结果的表现更快速,优先评估过程会使得结果可靠性更趋向于人类所期待的,从而排除更多推理结果错误的概率。
但是,过程监督仍也存在一定的难度:数据获取过程长,需要收集数据训练的完成过程,包括输入和响应操作以及决策,时间跨度更大,同时增加了样本的复杂性以及成本。
国内AI
1、中文AI大模型首个反歧视对抗性开源项目:每个人提出100道“有毒”问题
业内首个大语言模型治理开源中文数据集100PoisonMpts发布,十多位知名专家学者成为了首批“给AI的100瓶毒药”的标注工程师。标注人各提出100个诱导偏见、歧视回答的刁钻问题,并对大模型的回答进行标注,完成与AI从“投毒”和“解毒”的攻防。
相比国外厂商的治理方法,100PoisonMpts数据集在技术方法有几个特点:
更完整的标注流程。标注人同时设置问题、对回答质量排序、对最优回答评分、并人工改写回答。
更隐性的问题领域。如首批数据就重点针对了反歧视领域,包含人群、知识、法律等多维度复杂问题。
探索更全面的有效性。标注数据对模型在继续训练、微调、强化学习、线上服务等多环节产生效益。
见智研究认为:数据标注是在大模型过程中至关重要的步骤,用标注后的“安全数据集”进行模型训练才能够得到趋近理想的训练结果。但是数据标准一直伴随有主观、宗教、个人偏好的特色,所以如果用国外的数据集进行训练,某种程度上会“水土不服”,而搭建本地训练数据集就显得非常重要。中文AI首个反歧视对抗项目凝聚力众多行业专家,之后会成为国内开源大模型训练的高标准数据集之一。
2、阿里云AI助手“通义听悟”公测,应用落地速度将超预期
阿里云智能发布了工作学习AI助手“通义听悟”,开始正式公测。可作用在会议讨论、教学培训、调研访谈、视频观看等场景,可进行实时语音识别,实现对话的实时记录、多语言翻译、发言总结、提取PPT、内容规整等。
值得关注的是:在内容总结方面,飞书妙记还只能给出关键词;而针对不同嘉宾的发言,听悟都能给出对应的发言总结。
听悟已经和阿里云盘打通,存放在云盘中的音视频内容可以一键转写,在线播放云盘视频时还能自动显示字幕。并且在企业版本中,AI整理后的音视频文件将来还可以在内部快速分享。
见智研究认为:国内大模型在应用领域的落地进展非常迅猛,通义听悟主要应用于音频、视频领域,为用户带来音频和视频内容记录和阅读的全新体验。而传统软件的用户粘性很快就会被打破。
通义听悟是采用阿里达摩院的语音识别模型Paraformer,不仅在推理效率上较传统模型提升10倍,刚推出时还“屠榜”多个权威数据集,刷新语音识别准确率SOTA。在专业第三方全网公共云中文语音识别评测SpeechIO TIOBE白盒测试中,目前,Paraformer-large仍是准确率最高的中文语音识别模型。
此外,更应关注语音大模型在移动端的应用进展,比如智能音箱就是非常好的端口。