几年之后再回首,人们可能会意识到,这个平平无奇的四月第三周,可能是中国 AI 史上的一个重要节点。
因为在这周,阿里、腾讯、字节、商汤、360 等互联网大厂,纷纷「祭出」自己的 AI 大语言模型及产品——「整个晋西北都乱成一锅粥了」。
自从几年前的「买菜大战」之后,中国互联网行业第一次这么热闹。
大概每一次历史潮流的开场,总是这么熙熙攘攘,令人猝不及防。
王小川开搞大模型,杠上老冤家
周一,王小川宣布创建百川智能,启动资金 500 万美元,正式投入到了中国大模型建设的大军中,不少成员是在搜狗时的老伙伴。
他在媒体交流会中透露,公司已经开始训练 500 亿参数的大模型,年底前预计发布对标 GPT-3.5 的大模型。
「大家好像忘了,搜索也是一个人工智能的产品。」从搜狗一路走过来,王小川成为了国内大模型创业圈里炙手可热的人物。
要说他现在最着急什么,留在他公开信后的一长串招聘邮箱也许能说明问题,那就是人才!人才!
当然,这周最热闹的吃瓜现场,还要属王小川和百度互怼。
百度李彦宏:文心一言确实不如现在最好的 ChatGPT 版本,但差距也不是很大,可能就是一两个月的差别。
王小川:李彦宏生活在平行宇宙,文心一格与 ChatGPT 的差距绝对不是一两个月,而是三年。
百度副总肖阳:王小川脱离一线太久,和百度不在一个宇宙,对国内人工智能技术的发展缺乏了解。当年搜狗也立志取代百度搜索,结果也是显而易见的。
王小川:什么样的平行宇宙里,才能做到让一个脱离一线 15 年的人,去怼一个脱离一线 1.5 年的人。
现在王小重新创业,跟百度大厂的身份不一样了。
李彦宏说,大厂开始聚焦后,创业公司的机会便很少了,建议创业公司不要重复制造轮子。王小川则认为创业公司不会受固有业务限制,会比大公司跑得快。
看 NBA 的同学都知道,开场前双方队员来点「垃圾话」是惯例动作,没有才会令人奇怪。
真身离开一线多久不重要,重要的是,心要永远在前线上。
「通义千问」,全面改造阿里,钉钉打头阵
同一天,阿里正式推出大模型产品「通义千问」。这是阿里云大模型系列中的最新成员,既可以做多轮对话,也能做文生图等跨文字、图像等方面的应用,并能够和外部 API 进行互联。
这也是张勇在兼任阿里云智能集团 CEO 后,第一次在阿里云峰会带队露面,足见此次活动的意义。
张勇说,「面向 AI 时代,所有产品都值得用大模型重新升级。」首先接受改造的,是阿里自己的产品。
阿里宣布未来会将所有的业务都接入「通义千问」。首先接入「通义千问」的业务,是协同办公钉钉,以及智能音箱天猫精灵。
钉钉接入通义千问后,已经可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项。还有一些低代码方面的尝试,比如用户拍一张功能草图,能自动生成一个小程序。
不久前,阿里宣布将集团分拆成六大集团,所有业务接入,可见阿里决心之大。
阿里云未来还将推出「企业专属大模型」、「行业专属大模型」产品,在正式发布前,已经定向邀约企业客户开始内测,首批企业客户包括 OPPO、吉利汽车等。
「通义千问是既定路线中的一个节点,不是起点,也不是终点。」阿里云 CTO 周靖人如此定性通义千问。
当国内云计算市场开始增速放缓时,AI 大语言模型之战,重新「激活」了阿里云。
腾讯,要来「硬」的
本周五,腾讯云发布新一代 HCC(High-Performance Computing Cluster)高性能大模型计算集群,采用腾讯云星星海自研服务器,搭载英伟达最新代次 H800 GPU,服务器之间采用业界最高的 3.2T 超高互联带宽,号称是国内性能最强。
人工智能大模型训练,离不开高性能的算力集群。此前腾讯万亿参数的混元 NLP 大模型已经完成训练,基于上一代高性能算力集群,腾讯将自己大模型的训练时间,从 50 天缩短到 11 天。实测显示,新一代集群的算力性能较前代提升高达 3 倍。这也意味着如果基于此次发布的新一代集群,训练时间将进一步缩短至 4 天。
随着国内外厂商加速布局千亿级参数量的大模型,训练需求和推理需求也进一步增长。
模型再厉害,还是需要算力作为基础能力,相比于前几家,腾讯云走的低调,但有着深圳人「一心搞钱」的务实。
字节 AI,落子飞书
本周,字节跳动旗下办公软件飞书透露了一条视频,预告专属智能助手「My AI」。
在演示中,用户可以通过 My AI 总结生成会议纪要,并可根据会议纪要创建对应的待办事项,辅助用户规划后续工作。同时,该 AI 能够根据文档数据,生成报告等内容;并能够根据用户的编辑内容,进一步续写文档内容;以及协助用户创建会议、查询案例参考、进行头脑风暴、规划项目进程等。
从演示来看,「My AI」的定位并不是像 ChatGPT 的对话型 AI,而更类似微软推出的 Office Copilot,在工作上提供实际的帮助。
对于「先进企业」用的工具来说,如何让组织内沉淀下来的无数知识和信息,去主动找人,可能是团队下一步要格外关注的。而 更聪明的 AI 助理,绝对是个好抓手。
知乎AI,迂回前进
周四,知乎发布「知海图 AI」中文大模型。
「知海图 AI」被运用进了知乎热榜中,首个大模型功能「热榜摘要」上线并开启内测。它能对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
像知乎、小红书这样的中厂,跟大厂在业务有竞争,未来没办法安心使用大厂提供的大模型,那么他们该怎么办?
知乎给出了他们的答案:用联合研发与战略投资的方式,与国内大模型团队面壁智能合作,共同开发中文大模型。
商汤、京东和昆仑万维
本周二,商汤发布日日新 SenseNova 大模型,包括自然语言生成、文生图、感知模型标注以及模型研发功能。此外还推出自研中文语言大模型应用平台「商量」,除了文字创作和长文本处理能力外,还有提供辅助编码能力、以及基于医学专业知识的对话咨询。
昆仑万维和奇点智源合作自研的大语言模型——「天工」3.5 即将发布,会在下周一启动邀请测试。昆仑万维表示,「天工」大模型已经非常接近 OpenAI ChatGPT 的智能水平,未来「天工」4 和「天工」5 也将陆续诞生。
京东计划今年发布新一代产业大模型「言犀」,据称其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率 95%+、生成文字 30 亿 +。
一个彩蛋
马斯克此前签署公开信呼吁暂停大模型的研究,这周就被爆出暗中推进 AIGC 项目。
据称他最近购买了约 1 万个 GPU,用于公司的两个数据中心之一。该项目涉及 AICG,推特将根据自己的海量数据进行训练。AIGC 可以增强推特的搜索功能或帮助重建其广告业务。
就在刚刚,他在美国内华达州成立了一家名为 X.AI 的人工智能公司。
马斯克还在招聘人才。自 2 月以来马斯克就已经和人工智能领域的人才进行接触,截至 3 月,他已经从谷歌的人工智能部门 DeepMind 聘请了两位工程师 Igor Babuschkin 和 Manuel Kroiss。
马斯克算是明白了,指责 OpenAI 变成 CloseAI 是没意义的,必须挽起袖子,自己打造真·OpenAI。
本文作者:陈晨,文章来源:极客公园,原文标题:《10 年了,这是中国科技圈最卷的一周!》。