微软准备推出新款自研AI模型 硬刚谷歌、Anthropic以及OpenAI

硬AI
知情人士称,这款内部被称为MAI-1的模型将拥有约5000亿个参数。分析认为,这意味着微软现在正采取双轨路线,旨在开发既能用于应用程序并可在移动设备上运行的“小型语言模型”,同时又能开发更大、最先进的AI模型。该模型可能会在本月晚些时候的Build开发者大会上提前展示,具体取决于接下来几周的开发进展。

作者:赵雨荷

本文来源:硬AI

媒体报道,微软公司目前正在开发自家的人工智能模型,与谷歌、Anthropic以及OpenAI竞争。

据了解,这是自从微软向OpenAI投资超过100亿美元以重新获得后者人工智能模型的使用权以来,微软首次开始训练一个规模足够大的内部AI模型。这个新模型在内部被称为MAI-1,由Mustafa Suleyman负责,他曾是谷歌AI的负责人,此前也担任AI初创公司Inflection的首席执行官,之后微软收购了这家初创公司的大部分员工,并在3月份支付了6.5亿美元获取其知识产权。

不过内部人士透露,这个模型完全是微软自己的,而非来自Inflection,但可能基于来自该Inflection的训练数据和其他技术。据两位知情的微软员工表示,MAI-1与Inflection之前发布的Pi模型是独立的。

知情人士还说,MAI-1将比微软之前训练过的任何小型开源模型都大,这意味着它需要更多的计算能力和训练数据,因此成本更高。MAI-1将拥有约5000亿个参数,或者也可以根据训练期间模型的学习内容来调整参数环境。相比之下,OpenAI的GPT-4拥有超过1万亿个参数,而像Meta Platforms和Mistral等公司发布的小型开源模型则拥有700亿个参数。

分析认为,这意味着微软现在正采取双轨路线,旨在开发既能用于应用程序并可在移动设备上运行的“小型语言模型”,同时又能开发更大、最先进的AI模型。知情人士之一表示,新模型的确切用途尚未确定,将取决于它的表现。

这也表明微软愿意在AI领域开辟一条与OpenAI技术不同的新路,目前微软的所有“Copilot”人工智能聊天机器人都基于OpenAI的技术,它们可以自动生成电子邮件或快速总结文件。截至目前,微软现在已经在OpenAI上投资了超过130亿美元,并将其模型添加到Office应用程序、其Bing搜索引擎、Edge,甚至其Windows操作系统中。

同时,为了训练这个新模型,微软已经为其配备了大量搭载英伟达显卡的服务器,并一直在编译一系列训练数据来提高模型的性能,其中包括从以前用于训练小型模型的各种数据集中提取的数据,包括由OpenAI的GPT-4生成的文本,以及其他来源的信息,如互联网上的公共数据。

知情人士之一表示,微软可能会在本月晚些时候的Build开发者大会上提前展示这个新模型,具体取决于接下来几周的开发进展。

微软股价周一美股盘中上涨0.79%,报409.88美元。该公司股价今年迄今已经上涨超过10%。

有网友对微软的决策表示肯定:

“任何拥有计算和数据能力的大型科技公司如果没能加入这场战局,那就是失职,即便水平不在第一梯队也应该加入。毕竟,如果一直旁观,并且将整个AI能力外包,未来将很难预测。”

但也有网友表示不看好,

“虽然一个智能的模型很重要,但围绕它构建一个代理框架的能力是提供价值的唯一途径(尤其是在企业规模来看)。而微软在这方面拥有最糟糕的框架……他们臃肿的生态系统永远不会像Abacus、CrewAI或一些特定平台那样精简和易于创建。”

有网友说这是消费者的福音:

“很高兴看到所有人都在AI聊天机器人方面疯狂砸钱,这样他们除了免费提供产品之外别无选择。”

还有网友说,认为微软之所以要自研AI,是因为现在在Copilot里内置GPT-4的成本已经太高,快负担不起了。

有网友说,

“希望微软能做正确的事,将模型开源。”

是AGI吗?与OpenAI关系成谜

还有网友认为微软推出自研AI模型后,和OpenAI之间的关系将变得微妙:

“这是一个很有趣的进展,因为OpenAI历来依靠微软Azure的算力来训练他们的模型。”

有博主评论,这个模型显然要从OpenAI拿走很多数据,意味着虽然OpenAI严禁分发通用人工智能(AGI),但微软正在利用OpenAI的力量来研发通用人工智能。

下面有网友跟帖称,

“所以GPT5推迟发布是因为它是AGI,但由于马斯克的诉讼,OpenAI现在暂时不能发布。所以这是OpenAI这是在花时间削弱GPT-5然后和微软‘咨询’如何打造一个‘有竞争力’的赚钱机器?“

但贴主表示,

“我不这么认为。我认为他们已经拥有AGI,但还未成规模。GPT-5还不是AGI,但它具备了基本元素,在一般使用中表现得非常好,以至于你会感受到AGI的雏形。但OpenAI的准则禁止分发AGI。所以微软可能别无选择,只能从OpenAI那里窃取并复制以创建自己的模型。当然,我们不清楚OpenAI和微软之间的协议详细内容,但毫无疑问,微软不会在没有预期回报的情况下向一家公司投资800亿美元。因此,这很可能是问题所在。”

OpenAI首席执行官Altman此前则表示,GPT-5的性能远超GPT-4,而且OpenAI不怕copy。

华尔街见闻此前报道,Altman上月底在斯坦福大学的一次演讲中说,他不知道AGI何时到来,GPT-5性能将远超GPT-4,GPT-6会比GPT-5更加厉害。

奥特曼认为,现在很多组织、个人开发者都能轻松复现GPT-4的能力,甚至在个别单元测试中超过它。但OpenAI的核心能力是技术变革,可以真正定义AI能力的下一个范式转变,就像苹果的iPhone对移动领域带来的颠覆性影响。

在谈到如何实现AGI时,奥特曼认为开源不是最佳途径。开源意味着放弃对技术的专有控制,对于OpenAI来说,他们投入大量的人力和算力资源开发的产品,需要有商业回报。

本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章