AI编程竞赛：OpenAI Codex赶超Anthropic Claude？

10/10 09:25

最新数据显示，OpenAI的编程助手在关键性能指标上已微弱领先其主要竞争对手Anthropic。这一性能提升主要归功于OpenAI上月发布的GPT-5-Codex模型，该模型将Codex此前的代码成功率从69%大幅拉升。不过，尽管性能占优，Codex在用户采纳率上仍明显落后于Claude Code。

在人工智能编程助手这一赛道，一场激烈的排位赛正在上演。最新数据显示，OpenAI的编程助手Codex在部分核心能力上已超越Anthropic的Claude Code。

10月9日，据初创公司Modu收集的超过30万个代码拉取请求的数据显示，开发者对Codex生成的代码批准率达到了74.3%，略高于Claude Code的73.7%。

这一数据得到了市场的侧面印证，过去一个月，在X和Reddit等社交平台上，已有开发者注意到Codex性能的显著改善。

分析认为，这一逆转主要归功于OpenAI上月发布的GPT-5-Codex模型。据Modu联合创始人Brexton Pham透露，在该模型发布前，OpenAI旧版Codex的代码成功率仅为69%。新模型的推出，成为OpenAI在此次竞赛中扳回一城的关键。

对于Anthropic而言，赢得编码竞赛似乎是意义重大的。据《The Information》报道，该公司的收入主要来自通过API向微软等客户销售其AI模型，而编码技术是其收入的驱动核心。

相比之下，拥有ChatGPT这一商业巨擘的OpenAI对编码业务的收入依赖较小，但其领导层将编码视为开发通用人工智能（AGI）的“关键齿轮”，并于去年加倍投入以提升其模型的编码能力。

性能领先，但用户习惯仍是挑战

尽管在代码生成质量上取得了微弱优势，但Codex在吸引开发者使用方面仍面临巨大挑战。数据显示，在开发者最终合并的代码请求中，使用Codex创建的比例为24.9%，而Claude Code则为32.1%。

不过，Brexton Pham指出，相较于新模型发布前，Codex的市场份额已提升了五个百分点，显示出增长势头。

然而，从另一个维度看，差距依然悬殊。根据软件注册表NPM的数据，Claude Code目前的周下载量超过500万次，而Codex仅为19万次。

这表明，要将性能优势转化为市场主导地位，OpenAI仍有很长的路要走，改变开发者的使用习惯将是其面临的主要障碍。

市场竞争激烈，成本非决定因素

有趣的是，成本似乎并未成为开发者选择工具的首要因素。Brexton Pham表示，尽管Codex比Claude Code更便宜，但开发者目前愿意为高性能产品支付更高价格，因为他们普遍预计长期来看成本会下降。对于企业决策者而言，投资AI编程助手以提升现有工程师效率，远比招聘更多人力工程师的成本要低。

此外，AI编码市场并非只有两家巨头。Modu的数据揭示了一些“黑马”的存在。例如，Sourcegraph公司的Amp agent以76.8%的批准率成为代码最受开发者认可的助手。Brexton Pham将其形容为市场上的“精品奢侈”产品，即价格更高但性能更优。

与此同时，谷歌的Gemini CLI则凭借其一贯的低价策略，成为目前最便宜的编码助手。值得注意的是，Modu的基准测试尚未包含GitHub Copilot和谷歌的Jules agent等重要产品，这意味着整个市场的竞争版图仍有待完整呈现。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

AI编程竞赛：OpenAI Codex赶超Anthropic Claude？

性能领先，但用户习惯仍是挑战

市场竞争激烈，成本非决定因素

剑指Anthropic十亿美元级市场！谷歌杀入AI编码大战，与Replit达成多年合作

首次收购直指OpenAI腹地！Anthropic斥资数亿美元购入编程工具Bun，捍卫AI编程业务

推出“向人类学习后，可自主编程数天”的Kiro，亚马逊云副总裁：AI Agent将是“云计算诞生以来”最大的技术变革

Anthropic发布Claude Opus 4.5，编程性能全面提升

“性价比”好得多！M2和K2“广受欢迎”，中国开源大模型冲击“AI编程”