微软准备推出新款自研AI模型硬刚谷歌、Anthropic以及OpenAI

硬AI

2024/05/07 01:14

知情人士称，这款内部被称为MAI-1的模型将拥有约5000亿个参数。分析认为，这意味着微软现在正采取双轨路线，旨在开发既能用于应用程序并可在移动设备上运行的“小型语言模型”，同时又能开发更大、最先进的AI模型。该模型可能会在本月晚些时候的Build开发者大会上提前展示，具体取决于接下来几周的开发进展。

作者：赵雨荷

本文来源：硬AI

媒体报道，微软公司目前正在开发自家的人工智能模型，与谷歌、Anthropic以及OpenAI竞争。

据了解，这是自从微软向OpenAI投资超过100亿美元以重新获得后者人工智能模型的使用权以来，微软首次开始训练一个规模足够大的内部AI模型。这个新模型在内部被称为MAI-1，由Mustafa Suleyman负责，他曾是谷歌AI的负责人，此前也担任AI初创公司Inflection的首席执行官，之后微软收购了这家初创公司的大部分员工，并在3月份支付了6.5亿美元获取其知识产权。

不过内部人士透露，这个模型完全是微软自己的，而非来自Inflection，但可能基于来自该Inflection的训练数据和其他技术。据两位知情的微软员工表示，MAI-1与Inflection之前发布的Pi模型是独立的。

知情人士还说，MAI-1将比微软之前训练过的任何小型开源模型都大，这意味着它需要更多的计算能力和训练数据，因此成本更高。MAI-1将拥有约5000亿个参数，或者也可以根据训练期间模型的学习内容来调整参数环境。相比之下，OpenAI的GPT-4拥有超过1万亿个参数，而像Meta Platforms和Mistral等公司发布的小型开源模型则拥有700亿个参数。

分析认为，这意味着微软现在正采取双轨路线，旨在开发既能用于应用程序并可在移动设备上运行的“小型语言模型”，同时又能开发更大、最先进的AI模型。知情人士之一表示，新模型的确切用途尚未确定，将取决于它的表现。

这也表明微软愿意在AI领域开辟一条与OpenAI技术不同的新路，目前微软的所有“Copilot”人工智能聊天机器人都基于OpenAI的技术，它们可以自动生成电子邮件或快速总结文件。截至目前，微软现在已经在OpenAI上投资了超过130亿美元，并将其模型添加到Office应用程序、其Bing搜索引擎、Edge，甚至其Windows操作系统中。

同时，为了训练这个新模型，微软已经为其配备了大量搭载英伟达显卡的服务器，并一直在编译一系列训练数据来提高模型的性能，其中包括从以前用于训练小型模型的各种数据集中提取的数据，包括由OpenAI的GPT-4生成的文本，以及其他来源的信息，如互联网上的公共数据。

知情人士之一表示，微软可能会在本月晚些时候的Build开发者大会上提前展示这个新模型，具体取决于接下来几周的开发进展。

微软股价周一美股盘中上涨0.79%，报409.88美元。该公司股价今年迄今已经上涨超过10%。

有网友对微软的决策表示肯定：

“任何拥有计算和数据能力的大型科技公司如果没能加入这场战局，那就是失职，即便水平不在第一梯队也应该加入。毕竟，如果一直旁观，并且将整个AI能力外包，未来将很难预测。”

但也有网友表示不看好，

“虽然一个智能的模型很重要，但围绕它构建一个代理框架的能力是提供价值的唯一途径（尤其是在企业规模来看）。而微软在这方面拥有最糟糕的框架……他们臃肿的生态系统永远不会像Abacus、CrewAI或一些特定平台那样精简和易于创建。”

有网友说这是消费者的福音：

“很高兴看到所有人都在AI聊天机器人方面疯狂砸钱，这样他们除了免费提供产品之外别无选择。”

还有网友说，认为微软之所以要自研AI，是因为现在在Copilot里内置GPT-4的成本已经太高，快负担不起了。

有网友说，

“希望微软能做正确的事，将模型开源。”

是AGI吗？与OpenAI关系成谜

还有网友认为微软推出自研AI模型后，和OpenAI之间的关系将变得微妙：

“这是一个很有趣的进展，因为OpenAI历来依靠微软Azure的算力来训练他们的模型。”

有博主评论，这个模型显然要从OpenAI拿走很多数据，意味着虽然OpenAI严禁分发通用人工智能（AGI），但微软正在利用OpenAI的力量来研发通用人工智能。

下面有网友跟帖称，

“所以GPT5推迟发布是因为它是AGI，但由于马斯克的诉讼，OpenAI现在暂时不能发布。所以这是OpenAI这是在花时间削弱GPT-5然后和微软‘咨询’如何打造一个‘有竞争力’的赚钱机器？“

但贴主表示，

“我不这么认为。我认为他们已经拥有AGI，但还未成规模。GPT-5还不是AGI，但它具备了基本元素，在一般使用中表现得非常好，以至于你会感受到AGI的雏形。但OpenAI的准则禁止分发AGI。所以微软可能别无选择，只能从OpenAI那里窃取并复制以创建自己的模型。当然，我们不清楚OpenAI和微软之间的协议详细内容，但毫无疑问，微软不会在没有预期回报的情况下向一家公司投资800亿美元。因此，这很可能是问题所在。”

OpenAI首席执行官Altman此前则表示，GPT-5的性能远超GPT-4，而且OpenAI不怕copy。

华尔街见闻此前报道，Altman上月底在斯坦福大学的一次演讲中说，他不知道AGI何时到来，GPT-5性能将远超GPT-4，GPT-6会比GPT-5更加厉害。

奥特曼认为，现在很多组织、个人开发者都能轻松复现GPT-4的能力，甚至在个别单元测试中超过它。但OpenAI的核心能力是技术变革，可以真正定义AI能力的下一个范式转变，就像苹果的iPhone对移动领域带来的颠覆性影响。

在谈到如何实现AGI时，奥特曼认为开源不是最佳途径。开源意味着放弃对技术的专有控制，对于OpenAI来说，他们投入大量的人力和算力资源开发的产品，需要有商业回报。

本文来自微信公众号“硬AI”，关注更多AI前沿资讯请移步这里

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。