三六零之后,美团也看好智谱AI。
天眼查App显示,近日,中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更,注册资本由约1480.69万人民币增至约1652.86万人民币。股东新增美团旗下天津三快科技有限公司,持股10.42%。
华尔街见闻此前介绍称,智谱AI由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目"悟道"的研发工作。2022年8月,清华大学知识工程实验室与智谱AI合作研发的超大规模预训练语言模型GLM-130B正式上线,是同年亚洲唯一入选斯坦福评测的全球主流大模型。
就在7月14日,智谱AI和清华KEG突然发布公告,称为了更好地支持国产大模型开源生态,经智谱 AI 及清华 KEG 实验室决定,自即日起 ChatGLM-6B 和ChatGLM2-6B权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。
值得一提的是,6月20日,国内首批算法备案清单公布,智谱大模型在列。
智谱AI把国内开源大模型卷出新高度
华尔街见闻此前提及,GLM在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,仍旧表现非常出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上超过了GPT-3、谷歌的PaLM和Meta的OPT大模型。
ChatGLM-6B自3月发布以来,在AI社区爆火,GitHub上已斩获29.8k星。而就在6月底,第二代ChatGLM也登场了。
评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
基于 Multi-Query Attention 技术,ChatGLM2-6B在推理更高效的同时,显存占用也更低。在官方的模型实现下,推理速度相比初代提升了42%,INT4量化下,6G显存支持的对话长度由1K提升到了8K。
在中文C-Eval榜单中,ChatGLM2以71.1分位居榜首,碾压GPT-4。而最新版本ChatGLM2-6B以51.7分位列第6。
今年5月16日,三六零宣布与智谱AI达成战略合作,双方共同研发的千亿级大模型“360GLM”,双方将参考“微软+OpenAI”的合作模式,将大模型与应用场景结合。
三六零CEO周鸿祎认为,国内应当建立大型科技企业 + 重点科研机构的产研协同创新模式,打造中国的“微软 +OpenAI ”组合引领大模型技术攻关。他表示,此次与智谱 AI 合作,正是借鉴了这种产研协同关系。
对于此次合作,智谱AI CEO张鹏表示,智谱AI一直坚持着自己的愿景,让机器像人一样思考,实现Model as a Service(MaaS)的理念。
智谱AI能成为中国的下一个OpenAI?