Altman：AI Agent就像高级同事，将根据计算量而不是数量来定价

2024/11/01 14:08

Altman表示，Agent可以很好地完成一个两天或两周的任务，并在必要时提问，然后反馈一个出色的重要产品，且不是按Agent数量来付费，而是根据问题需要的计算量来定价。GPT4可以轻易复制成功，即使不知道别人是如何做到的。

近日，OpenAI CEO Sam Altman在一次互动访谈中分享了自己对AI Agent的看法，涉及AI Agent的潜力，定价与商业模式。他认为，Agent能够像一个聪明的同事一样，与用户一起合作完成项目。他还强调了推理是当前OpenAI模型最重要的关注领域，将解锁更大的价值。

以下为访谈要点：

Agent可以很好地完成一个两天或两周的任务，并在必要时向您提问，然后反馈一个出色的重要产品。

AI Agent不是按每个Agent来付费，而是根据问题需要的计算量来定价。

我们可以通过模型实现收入，我认为证明了投资是合理的。

可能有太多人在训练非常相似的模型，如果您稍微落后了，或者如果您没有一个带有自然商业规则的产品，使得该产品具有粘性和价值，那么也许可能很难获得投资回报。我们非常幸运拥有ChatGPT和成千上万的人使用我们的模型。

我们的独特之处，很容易复制已经成功的东西。所以在研究实验室做了一些事情之后，即使您不知道他们是如何做到的，复制它也是可行的。

真正困难的事情，也最让我自豪的文化是不断重复地去做一些新的、完全未经验证的事情。

以下为访谈原文，部分内容略有删减：

AI Agent就像高级同事，能高效反馈出色成果

提问：

对于人们对AI Agent的看法，您认为他们有什么误解吗？

Sam Altman：

我认为没有人能猜到这将变成什么样子。就像您所说的，我们都在描绘一些看似重要的东西，也许我可以举个例子，当人们谈论AI Agent代表他们行事时，他们给出的主要例子似乎相当一致。

比如，您可以让Agent为您预订餐厅，无论是通过OpenAI GPT进行交互，还是直接打电话给餐厅。当然，这是一件很麻烦的事情，也必须去做，也许就像做某些工作一样。

我认为有趣的是，在全球范围内，您可以做一些不会或不能做的事情。例如，如果我的Agent不是打电话给一家餐厅来预订，而是拨打300家，找出哪家的饭菜最适合我或者有什么特别之处呢？

您可能会说，如果Agent一直在给餐厅打电话，那真是太烦人了，但如果是一个自动化系统来处理这300个餐厅，那么没问题，这就变成了一种大规模并行的操作，人类无法做到。这只是一个简单的例子。

但这也揭示了人类带宽的限制，这些限制可能会被Agent打破。我认为更有趣的类别不是人们通常谈论的，而是您有一个为您服务的东西，但更像是一个真正聪明的高级同事，您可以和他合作一个项目。Agent可以很好地完成一个两天或两周的任务，并在必要时向您提问，然后反馈一个出色的重要产品。

AI Agent以计算量付费

提问：

这是否从根本上改变了定价的方式，您如何看待未来的定价？它将如何定价？

Sam Altman：

我是一个风险投资者，以投资为生，所以我们预计会随时间而有所收获。可以想象一个世界，在那里您可以说，我想要一个GPU，或10个GPU，或100个GPU来解决我的问题。这不是说按个数或每个Agent来付费，而是根据问题需要的计算量来定价。

提问：

我们是否需要为特定用途构建专用模型，或者我们不需要？您如何看待这个问题？

Sam Altman：

确实需要大量的基础设施和东西要建立，但我认为o1指向了一个能够执行出色任务的模型。这确实是某种值得继续思考的事情。

模型是贬值资产，但ChatGPT的投资有意义

提问：

在模型方面，大家都说模型是贬值资产，模型商品化是如此普遍，您如何回应和思考这个问题？当您考虑到训练模型的资本强度越来越高，我们是否实际上正在看到这种趋势的逆转，需要如此多的资金以至于实际上很少有人能够做到？

Sam Altman：

确实，模型是贬值资产，但说它们的价值不如训练成本，这似乎完全错误。更不用说，随着您学习训练这些模型，会更好地训练下一个模型，并从中获得正反馈。我们可以通过模型实现收入，我认为证明了投资是合理的。

但公平地说，我不认为这对每个人都适用，可能有太多人在训练非常相似的模型，如果您稍微落后了，或者如果您没有一个带有自然商业规则的产品，使得该产品具有粘性和价值，那么也许可能很难获得投资回报。我们非常幸运拥有ChatGPT和成千上万的人使用我们的模型。

推理是当前OpenAI模型最重要的关注领域

提问：

您如何看待OpenAI模型随着时间的推移继续进行差异化，以及你最想专注于哪个方面的差异化?

Sam Altman：

推理是我们当前最重要的关注领域，我认为这是解锁下一个巨大进步和价值的关键。因此，我们将在很多方面改进它们。我们将进行多模态工作，将在模型中加入我们认为非常重要的其他功能，以满足人们使用这些工具的方式。

提问：

您如何看待多模态工作中的推理及其所面临的挑战，以及您希望实现的目标？

Sam Altman：

多模态工作中的推理，这显然需要一些努力，但是就像人们在他们还是婴儿和蹒跚学步时，虽然语言能力不强，但仍能进行相当复杂的视觉推理，所以显然这是可能的。

提问：

视觉能力将如何随着由 o1设置的的推理时间范式进行扩展呢？

Sam Altman：

在不透露过多细节的情况下，我们会取得快速进展。

提问：

GPT 的输出是生成式的。我不认为我们在很多 GPT 的输出中有接近英式风格。GPT 的输出通常在拼写和语气上是美式的。你如何看待模型的国际化，不同的文化，不同的语言，以及这一点的重要性。

Sam Altman：

我不使用英式英语，我没有尝试过，但我会猜测它在英式英语方面表现得很好。我们可以看看，我们可以做到。

OpenAI很容易复制已经成功的东西

提问：

OpenAI 如何在推理能力方面取得突破？我们是否需要开始将强化学习作为路径推进，或新的技术？除了 Transformer 之外，还有其他方法吗？

Sam Altman：

这一点是我们的独特之处，很容易复制已经成功的东西。所以在研究实验室做了一些事情之后，即使您不知道他们是如何做到的，复制它也是可行的。您可以在GPT-4的复制中看到这一点，我相信您会在o1的复制中看到这一点。

真正困难的事情，也最让我自豪的文化是是不断重复地去做一些新的、完全未经验证的事情。很多组织，无论是在任何领域，都声称拥有这种能力，但实际上做到的很少。在某种意义上，我认为这是人类进步最重要的投入之一。

所以我曾幻想在退休后写一本书，总结我所学到的一切，关于如何建立一个组织和文化，去做这种事情，而不是仅仅模仿其他人已经做过的事情。

因为我认为世界上可以有更多这样的组织，这受到人类才能的限制，但人类才能的浪费却很多，因为这不是我们擅长建立的组织风格或文化，无论您想怎么称呼它。因此，我希望能有更多这样的事情，我认为这是我们最特别的地方。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。