全面超越GPT4！Anthropic推出旗下最快、最强AI模型Claude 3，归纳15万单词

硬AI

2024-03-05 00:54

999+

获得谷歌支持的AI初创公司Anthropic首次推出Claude 3 AI模型，可总结15万单词，超越ChatGPT的3000单词能力。此外，该模型首次支持多模态功能，允许用户上传图像和文件。

作者：房家瑶

来源：硬AI

ChatGPT4和Gemini Ultra被Claude 3 AI模型超越了？

3月4日周一，人工智能公司Anthropic推出了Claude 3系列AI模型和新型聊天机器人，其中包括Opus、Sonnet和Haiku三种模型，该公司声称，这是迄今为止它们开发的最快速、最强大的产品。

Anthropic公司由前OpenAI的研究高管创立。在过去一年里，该公司成功完成了五轮融资，总额达73亿美元，并推出了与OpenAI的ChatGPT直接竞争的产品，获得了谷歌、Salesforce和亚马逊等大型企业的支持，从一个有前景的初创公司成长为在AI领域受到业界广泛关注和支持的热门企业。

值得一提的是，Claude 3模型具备处理和总结大量文本数据的强大能力，能够总结高达15万个英文单词，相当于长篇大作《白鲸记》或《哈利波特与死亡圣器》的长度。相比之下，OpenAI的ChatGPT只能总结归纳大约3000个单词。此外，Anthropic还首次允许上传图像和文件。

Claude 3长文本处理能力远胜ChatGPT

该公司表示，Claude 3 Opus是三个模型中最强大的一个，它在处理复杂问题和逻辑推理方面表现卓越，超越了OpenAI的GPT-4和Google的Gemini Ultra。

其他模型Sonnet和Haiku在处理能力或功能方面相对有限，但同时也更经济实惠，因而比Opus更便宜，适合那些不需要Opus高级功能的用户或企业。

根据Anthropic联合创始人Daniela Amodei及Anthropic公司的说法，Claude 3模型存在以下特点：

1）多模态支持和文本处理能力：

Claude 3是Anthropic首次加入了多模态功能的模型，能够处理照片和文档、图像等多种数据类型，允许用户上传图像和文件，极大地扩展了模型的应用范围和实用性，使其成为行业内最受关注的应用之一。
Claude 3模型能够总结高达15万个英文单词，远超过OpenAI的ChatGPT的3000个单词，此外，Claude 3还能够根据用户的需求提供不同格式的输出，如备忘录、信件或故事等，这一能力使得Claude 3在处理长篇文本方面远超过OpenAI的ChatGPT。
Claude 3对用户意图和上下文的理解更加细腻，它能通过深入分析语言的语义、语境和情感等方面，提供更准确和相关的回应。

2）风险理解能力的提升：

Anthropic联合创始人Daniela Amodei表示，新推出的Claude 3模型在理解敏感或争议话题的风险方面较前一版本有所提升，能更准确地判断何时回应或保持谨慎。以往的Claude 2模型在处理敏感话题时过于保守，有时会过度拒绝回应敏感或有争议的话题，而Claude 3在保持安全和谨慎的同时，致力于减少不必要的回应限制，使模型更灵活实用。

具体发布时间方面，Anthropic称，Sonnet和Opus已从周一起在159个国家/地区推出，而Haiku也将很快推出。

团队方面，Amodei透露，公司在开发核心AI模型时采用了分层的团队结构。核心开发团队由60到80人组成，负责模型的算法和架构设计。技术支持团队则有120到150人，负责编程、数据处理、测试和部署等工作。

在模型的最后迭代中，直接参与开发的人数为30到35人，但整体支持团队达到了约150人。虽然直接参与核心开发的团队规模相对较小，但整个项目的支持团队规模较大，这种团队配置确保了模型开发的高效协作和优化。

仅文本不够，AI模型需多模态功能

在过去一年中，生成式AI成为商业和技术界的焦点话题，并迅速渗透到多个领域，包括教育、在线旅游、医疗行业和在线广告等，各大企业财报电话会议中也反复出现AI话题。

根据PitchBook数据，2023年AI领域的投资额达到了创纪录的291亿美元，交易量同比增长超过260%，显示出投资者对AI发展潜力的强烈信心。

AI迅速发展的同时，OpenAI首席运营官Brad Lightcap指出，仅将文本和代码作为AI模型的输入和输出是不够的，AI应该更接近于人类的自然感知和交互方式，他说道：

“世界是多模态的，人类的日常体验不仅包括文本，还涉及图像、声音等多种感觉输入。因此，仅将文本和代码作为人工智能模型的输入和输出是不够的。”

“为了让AI模型更好地模仿人类的感知和交互方式，它们需要能够处理和生成多种类型的数据。通过整合多种模态，人工智能模型可以提供更丰富、更真实的体验和应用，更接近于人类的自然感知和交互方式。”

然而，随着AI模型日益复杂化，尤其是在引入多模态功能如图像生成后，新的风险和挑战也随之而来。例如，谷歌最近因用户发现其AI图像生成器（Gemini聊天机器人的一部分）的历史不准确和有问题的回应而将其下线，这一事件在社交媒体上引起了广泛关注。

与Google的Gemini不同，Anthropic的Claude 3不具备生成图像的能力，它只允许用户上传图像和其他文档进行分析，从而在一定程度上减少了由自动生成内容引发的风险和争议。

Amodei也承认：

“当然，没有任何模型是完美的，我认为提前说清楚这一点非常重要。在开发模型时，我们不仅追求模型的性能和功能，也同样重视模型的安全性和可靠性。当然，尽管进行了严格的开发和测试，模型偶尔会犯错，并在某些情况下产生不准确或不可预测的输出。”

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。