OpenAI被全面超越：Claude高歌猛进，新的功能又来了

AI寒武纪

2024/07/10 13:38

新功能包括自动生成测试用例和并排比较输出，让用户能够优化提示并生成最佳响应。Claude 3.5 Sonnet驱动的提示生成器使提示编写变得简单，只需描述任务即可生成高质量的提示。

在构建AI驱动的应用程序时，提示（prompt）的质量对结果有重大影响。然而，编写高质量的提示具有挑战性，需要深入了解应用程序需求以及大语言模型（LLM）。为了加快开发速度并提升结果，Claude简化了这个过程，使用户能够更轻松地创建高质量提示。

现在，你可以在Anthropic Console中生成、测试和评估你的提示。Claude增加了新功能，包括自动生成测试用例和比较输出的功能，让你能够利用Claude生成最佳响应。

生成提示

编写一个好的提示就像向Claude描述任务一样简单。Console内置了一个提示生成器，由Claude 3.5 Sonnet驱动。你只需描述任务（例如“分类处理客户支持请求”），Claude就会为你生成一个高质量的提示。

你可以使用Claude的新功能生成测试用例，为提示提供输入变量，例如客户支持消息，并运行提示查看Claude的响应。或者，你也可以手动输入测试用例。

通过将提示与一系列真实世界的输入进行测试，你可以在将提示部署到生产环境之前，对其质量有更高的信心。使用新的评估功能，你可以直接在Console中进行此操作，而无需手动在电子表格或代码中管理测试。

手动添加或从CSV文件导入新的测试用例，或者使用“生成测试用例”功能让Claude自动生成。根据需要修改测试用例，然后一键运行所有测试。查看并调整Claude对每个变量生成要求的理解，以便更精细地控制生成的测试用例。

现在，优化提示变得更加简便，你可以创建提示的新版本并重新运行测试套件，以快速迭代和改进结果。Claude还增加了并排比较多个提示输出的功能。

你甚至可以让专家对响应质量进行5分制评分，以评估更改是否提高了响应质量。这些功能使改进模型性能的过程更加快捷和易于访问。

测试用例生成和输出比较功能对所有Anthropic Console用户开放。

除此而外，Claude另外一个重磅功能也来了

真正的技术平权，每个人都可以用 AI 编写代码生成和发布自己的内容，也可以在别人的基础上修改，现在你可以分享Claude 的 Artifacts了（分享你的作品），别人也可以修改 Artifacts。

本文作者：AI寒武纪，来源：AI寒武纪，原文标题：《OpenAI被全面超越：Claude高歌猛进，新的功能又来了》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。