大模型“安卓时刻”：Meta之后，中国顶尖开源大模型宣布“免费商用”

2023/07/15 11:29

智谱和清华大学KEG实验室共同研发的开源模型ChatGLM2-6B宣布开启商用，大模型迎来“安卓时刻”，OpenAI和谷歌等非开源平台领跑的AI大模型竞争格局正在发生改变。

继Meta传出将发布商用版LLaMA的消息之后，中国顶尖开源大模型ChatGLM2-6B也允许免费商用，开源大模型开启“安卓时刻”。

7月14日，经智谱 AI 及清华KEG实验室在官方公众号宣布，为了更好地支持国产大模型开源生态的繁荣发展，决定自即日起 ChatGLM-6B 和 ChatGLM2-6B权重对学术研究完全开放，并且在完成企业登记获得授权后，允许免费商业使用。

自 3 月 14 日发布 ChatGLM-6B 及 6 月 25 日发布 ChatGLM2-6B 以来，这两个模型在 Huggingface 上的下载量已经先后超过了 300 万和 120 万。

智谱AI的ChatGLM是目前国内最受业界关注的开源大模型，无论是参数还是性能都在中文语料下保持领先。

据见智研究此前介绍，GLM在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中，仍旧表现非常出色，在MMLU、LAMBADA、BIG-bench-lite指标测试上超过了GPT-3、谷歌的PaLM和Meta的OPT大模型。

目前，该模型的训练数据量为4000亿，中英文各占一半，拥有1300亿参数，训练成本在百万-千万人民币。截至到今年5月1日，该模型已经收到 69 个国家 1000 多个研究机构的下载使用申请。

而就在ChatGLM2宣布开源的此前一天，有媒体报道称，Meta准备发布其大语言模型LLaMA的商用版本，将允许初创公司和企业在该技术的基础上构建定制AI软件。

今年2月，Meta发布了其开源大语言模型LLaMA，该模型能帮助研究人员低成本开发专有AI软件，成为AI领域的一只“鲶鱼”。LLaMA的商用版本可能会刺激该软件被更多地使用，同时也将间接有利于Meta的AI开发。

华尔街见闻此前文章提及，开源模型的好处包括用户的接受率更高，然后输入更多数据供人工智能处理。LLM拥有的数据越多，其功能就越强大。此外，开源模型使研究人员和开发人员能够发现和解决漏洞，同时提高技术和安全性。

目前，AI大模型竞争日趋激烈，微软支持的OpenAI 和谷歌的非开源平台在这场竞赛中暂时领先，但随着Meta和智谱AI&清华KEG开源模型开启商用，人工智能的竞争格局正在发生改变。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。