大模型“安卓时刻”:Meta之后,中国顶尖开源大模型宣布“免费商用”

智谱和清华大学KEG实验室共同研发的开源模型ChatGLM2-6B宣布开启商用,大模型迎来“安卓时刻”,OpenAI和谷歌等非开源平台领跑的AI大模型竞争格局正在发生改变。

继Meta传出将发布商用版LLaMA的消息之后,中国顶尖开源大模型ChatGLM2-6B也允许免费商用,开源大模型开启“安卓时刻”。

7月14日,经智谱 AI 及清华KEG实验室在官方公众号宣布,为了更好地支持国产大模型开源生态的繁荣发展,决定自即日起 ChatGLM-6B 和 ChatGLM2-6B权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。

自 3 月 14 日发布 ChatGLM-6B 及 6 月 25 日发布 ChatGLM2-6B 以来,这两个模型在 Huggingface 上的下载量已经先后超过了 300 万和 120 万。

智谱AI的ChatGLM是目前国内最受业界关注的开源大模型,无论是参数还是性能都在中文语料下保持领先。

见智研究此前介绍,GLM在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,仍旧表现非常出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上超过了GPT-3、谷歌的PaLM和Meta的OPT大模型。

目前,该模型的训练数据量为4000亿,中英文各占一半,拥有1300亿参数,训练成本在百万-千万人民币。截至到今年5月1日,该模型已经收到 69 个国家 1000 多个研究机构的下载使用申请。

而就在ChatGLM2宣布开源的此前一天,有媒体报道称,Meta准备发布其大语言模型LLaMA的商用版本,将允许初创公司和企业在该技术的基础上构建定制AI软件。

今年2月,Meta发布了其开源大语言模型LLaMA,该模型能帮助研究人员低成本开发专有AI软件,成为AI领域的一只“鲶鱼”。LLaMA的商用版本可能会刺激该软件被更多地使用,同时也将间接有利于Meta的AI开发。

华尔街见闻此前文章提及,开源模型的好处包括用户的接受率更高,然后输入更多数据供人工智能处理。LLM拥有的数据越多,其功能就越强大。此外,开源模型使研究人员和开发人员能够发现和解决漏洞,同时提高技术和安全性。

目前,AI大模型竞争日趋激烈,微软支持的OpenAI 和谷歌的非开源平台在这场竞赛中暂时领先,但随着Meta和智谱AI&清华KEG开源模型开启商用,人工智能的竞争格局正在发生改变。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。