AI绘画的热潮还没散去,AI问答最近又迅速火了。
近期OpenAI发布了全新的聊天机器人模型ChatGPT,没想到一经上线,就因其高质量的回答、高效获取信息的方式、以及上瘾式的交互体验而迅速出圈。
不少体验过的人都惊呼,ChatGPT可能一举消灭记者、程序员和搜索引擎。
就连马斯克也忍不住发推表示,ChatGPT厉害得吓人,我们距离危险而强大的AI不远了。最近这个周末因没有跟踪ChatGPT新闻的“纽约时报”,甚至直接遭到了的马斯克发推“奚落”。
图:TED负责人Chris对纽约时报没有报道ChatGPT表示震惊,马斯克也在下面奚落纽约时报应该改名叫“社会正义时报”
用户数据上,上线还不到一周时间,12月5日OpenAI CEO就在推特上宣布,ChatGPT已经达到了百万用户。
什么是ChatGPT?
ChatGPT是OpenAI发布的聊天机器人模型,它的交互界面简洁,只有一个输入框,AI将根据输入内容进行回复,并允许在一个语境下持续聊天。
自从发布以来,ChatGPT可谓出尽风头,无论是让它写首押韵的诗、检查代码的bug、回答科学问题、对推特未来的发展提出建议……通通不在话下,它回复的内容每次都是随机的,但总体保持着一定的专业性和信息量,具备很强的参考意义。
比如,知识讲解。
比如,写小说。
目前已经有网友尝试让ChatGPT参加美国高考;写小说;诱骗ChatGPT规划如何毁灭世界;甚至让ChatGPT扮演OpenAI,在系统内构建ChatGPT套娃。
为什么这么强大?
据浙商和国盛证券研报,ChatGPT相比以往的主要提升点在于记忆能力,ChatGPT可以储存对话信息,延续上下文,从而实现连续对话,这在对话场景中至关重要,极大地提升了对话交互模式下的用户体验。
具体而言,此次新加入的训练方式被称为“从人类反馈中强化学习”(ReinforcementLearning from Human Feedback,RLHF)。这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。具体操作上,人工智能训练者扮演对话的双方,即用户和人工智能助手,提供对话样本。在人类扮演聊天机器人的时候,会让模型生成一些建议辅助训练师撰写回复,训练师会对回复选项打分排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代。
ChatGPT相比前辈模型还具有以下特征:
1)可承认错误,若用户指出其错误,模型会听取意见并优化答案。
2)可质疑不正确的前提,减少虚假描述,如被询问“哥伦布2015年来到美国的情景”的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。
3)因ChatGPT采用了注重道德水平的训练方式,ChatGPT在减少有害和不真实的回复上改善显著,如拒绝回答寻求霸凌他人方案的问题,指出其不正义性。
此外,ChatGPT的背后离不开大模型、大数据、大算力。
ChatGPT成为AIGC里程碑的背后,是算力发展和数字时代形成的大数据所共同支持的大模型训练,才能实现目前的效果。由OpenAI研发的ChatGPT是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,并在今年年初训练完成。模型训练的背后离不开大数据的支持,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5在Azure AI超算基础设施(由V100GPU组成的高带宽集群)上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。
AIGC里程碑级应用
之前文章里,我们给大家介绍了AIGC——人工智能自动生成内容,它当前主要用在文字、绘画、图像、视频、音频、游戏以及虚拟人等。很明显,AI问答ChatGPT都属于AIGC的一个分支。
国盛证券表示,AIGC不仅改变创作,还将改变获取信息的主要方式。而在此之上,ChatGPT所展示了作为生产力的存在,ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。
市场空间方面,Gartner预计到2025年,生成式人工智能将占所有生成数据的10%。根据《Generative AI:A Creative New World》的分析,AIGC有潜力产生数万亿美元的经济价值。而国泰君安表示,未来五年或将有10%-30%的图片内容由AI参与生成,相应或将有600亿以上的市场规模。
相关行业
相比于此前的AI绘画,ChatGPT更具有将AI能力与工作流程相结合的潜力。目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求,这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练,随着需求的增加,也有望转向自建集群。
国盛证券表示,今年以来,我国“东数西算”战略自上而下快速推进,作为数字经济的基础,“算力即权力”,其重要性不言而喻,此前我们更多的互联网应用聚焦于“存”而非“算”,随着AIGC技术在全球的兴起,“东数西算”的算力需求将越来越显著。
公司方面,浙商证券表示,从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。