AI编程竞赛:OpenAI Codex赶超Anthropic Claude?

最新数据显示,OpenAI的编程助手在关键性能指标上已微弱领先其主要竞争对手Anthropic。这一性能提升主要归功于OpenAI上月发布的GPT-5-Codex模型,该模型将Codex此前的代码成功率从69%大幅拉升。不过,尽管性能占优,Codex在用户采纳率上仍明显落后于Claude Code。

在人工智能编程助手这一赛道,一场激烈的排位赛正在上演。最新数据显示,OpenAI的编程助手Codex在部分核心能力上已超越Anthropic的Claude Code。

10月9日,据初创公司Modu收集的超过30万个代码拉取请求的数据显示,开发者对Codex生成的代码批准率达到了74.3%,略高于Claude Code的73.7%。

这一数据得到了市场的侧面印证,过去一个月,在X和Reddit等社交平台上,已有开发者注意到Codex性能的显著改善。

分析认为,这一逆转主要归功于OpenAI上月发布的GPT-5-Codex模型。据Modu联合创始人Brexton Pham透露,在该模型发布前,OpenAI旧版Codex的代码成功率仅为69%。新模型的推出,成为OpenAI在此次竞赛中扳回一城的关键。

对于Anthropic而言,赢得编码竞赛似乎是意义重大的。据《The Information》报道,该公司的收入主要来自通过API向微软等客户销售其AI模型,而编码技术是其收入的驱动核心。

相比之下,拥有ChatGPT这一商业巨擘的OpenAI对编码业务的收入依赖较小,但其领导层将编码视为开发通用人工智能(AGI)的“关键齿轮”,并于去年加倍投入以提升其模型的编码能力。

性能领先,但用户习惯仍是挑战

尽管在代码生成质量上取得了微弱优势,但Codex在吸引开发者使用方面仍面临巨大挑战。数据显示,在开发者最终合并的代码请求中,使用Codex创建的比例为24.9%,而Claude Code则为32.1%。

不过,Brexton Pham指出,相较于新模型发布前,Codex的市场份额已提升了五个百分点,显示出增长势头。

然而,从另一个维度看,差距依然悬殊。根据软件注册表NPM的数据,Claude Code目前的周下载量超过500万次,而Codex仅为19万次。

这表明,要将性能优势转化为市场主导地位,OpenAI仍有很长的路要走,改变开发者的使用习惯将是其面临的主要障碍。

市场竞争激烈,成本非决定因素

有趣的是,成本似乎并未成为开发者选择工具的首要因素。Brexton Pham表示,尽管Codex比Claude Code更便宜,但开发者目前愿意为高性能产品支付更高价格,因为他们普遍预计长期来看成本会下降。对于企业决策者而言,投资AI编程助手以提升现有工程师效率,远比招聘更多人力工程师的成本要低。

此外,AI编码市场并非只有两家巨头。Modu的数据揭示了一些“黑马”的存在。例如,Sourcegraph公司的Amp agent以76.8%的批准率成为代码最受开发者认可的助手。Brexton Pham将其形容为市场上的“精品奢侈”产品,即价格更高但性能更优。

与此同时,谷歌的Gemini CLI则凭借其一贯的低价策略,成为目前最便宜的编码助手。值得注意的是,Modu的基准测试尚未包含GitHub Copilot和谷歌的Jules agent等重要产品,这意味着整个市场的竞争版图仍有待完整呈现。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章