给AI大模型做排名的LMArena最新估值17亿美元，半年翻三倍

01/07 19:10

来源：华尔街见闻（Wallstreetcn）

发布： 2026年1月7日 19:10（北京时间）

核心要点

在AI模型竞争日趋激烈的背景下，评测平台LMArena以17亿美元的估值完成1.5亿美元融资，成为行业关键的基础设施
其独特的“背靠背”众包评测模式，通过数百万用户匿名比较模型输出，生成被广泛引用的排行榜，直接影响了OpenAI、Google等巨头的技术声誉与市场地位

在AI模型竞争日趋激烈的背景下，评测平台LMArena以17亿美元的估值完成1.5亿美元融资，成为行业关键的基础设施。其独特的“背靠背”众包评测模式，通过数百万用户匿名比较模型输出，生成被广泛引用的排行榜，直接影响了OpenAI、Google等巨头的技术声誉与市场地位。

在人工智能竞争日益白热化的背景下，一家专注于大模型性能评估与排名的初创公司LMArena正迅速崛起，成为行业内的关键基础设施。

根据公司最新披露，LMArena已完成新一轮1.5亿美元融资，投后估值达到17亿美元。这一数字较其2025年5月宣布种子轮融资时的估值增长了近三倍，凸显了市场对独立第三方AI评估平台的强烈需求。

本轮融资由现有投资者Felicis和加州大学投资部门共同领投。所筹资金将主要用于支付算力成本，以支持其为OpenAI、Google、xAI和Microsoft等客户评估AI模型，同时用于扩充技术团队。作为行业内被广泛引用的基准，LMArena通过“背靠背”比较的方式，利用数百万用户的反馈生成模型排名，直接影响着各大科技巨头在AI领域的声誉与竞争格局。

LMArena CEO兼联合创始人Anastasios Angelopoulos指出，领先的实验室正在使用该平台，因为它们面临着难以客观评估自身模型优劣的挑战。这种评估机制不仅帮助开发者在公开发布前获得早期反馈，也成为AI模型开发商对外宣传其技术实力的核心依据。随着AI模型间的性能差异日益缩小，LMArena的排行榜已成为衡量行业技术进步的重要标尺。

尽管LMArena依靠无偿互联网用户反馈的模式引发了部分关于数据准确性和专业性的争议，但这并未阻碍其商业化进程的加速。公司披露，上个月其“年化消费运行率”已达到3000万美元，表明其基于客户使用量的收入潜力正在快速释放。

独特的评估机制与行业影响力

LMArena的核心竞争力在于其独特的众包评估模式。该公司网站邀请全球互联网用户提问或使用模型进行图像等内容创作。用户在不知晓模型具体名称的情况下，从两个选项中挑选出最佳答案，随后系统才会揭晓生成该输出的模型身份。LMArena将这些结果汇总成不同类别的排行榜，涵盖AI编程、图像及视频生成等多个领域。

这种机制使得LMArena成为了AI行业的“竞技场”。甚至在模型正式向公众发布前，该初创公司有时也会托管这些模型，为开发公司提供早期的市场反馈渠道。随着各家AI模型的性能差距逐渐缩小，开发商们越来越依赖LMArena的排名来证明其技术优势。Anastasios Angelopoulos强调，对于那些试图在激烈的市场竞争中确立地位的实验室而言，这种外部验证至关重要。

商业化进展与用户规模

在财务表现方面，LMArena展现出强劲的增长势头。尽管公司未透露最近具体的营收增速，但在去年9月，其年化收入规模已达数百万美元。而根据其对上个月客户使用量的推算，目前的年化消费运行率已激增至3000万美元。

用户基础方面，LMArena表示目前在150个国家拥有超过500万月度用户。这一数字既包括访问网站查看排名的访客，也可能包括实际参与模型评分的用户。这一庞大的用户群构成了LMArena数据护城河的基础，为其排名的广泛性和实时性提供了支撑。

面临的争议与竞争挑战

尽管增长迅速，LMArena的模式并非没有争议。

一些模型制造商批评称，依靠无偿的互联网用户进行反馈存在缺陷，可能面临被刷榜的风险，且无法反映专家的深度意见。

这一批评指出了大众评审与专业评审之间的张力。相比之下，Scale AI等竞争对手采取了截然不同的路径，通过聘请律师或教授等专家为模型提供付费反馈，以强调评估的专业性和严谨性。LMArena未来如何在保持规模效应的同时提升评估的权威性，将是其持续获得市场信任的关键。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

给AI大模型做排名的LMArena最新估值17亿美元，半年翻三倍

核心要点

独特的评估机制与行业影响力

商业化进展与用户规模

面临的争议与竞争挑战

银联推出AI智算卡：银行卡开始「外挂」大模型

创业板跌逾3%，算力硬件、有色金属重挫，创新药、大金融拉升，港股“大模型双雄”大跌

谁降价谁更弱势！摩根大通：智谱和Minimax做了同样的实验，但结果相反

亚马逊之后，Meta也限制AI使用量了！当大厂都用不起Token，大模型巨头该“控制利润率”了？

伯恩斯坦：中国大模型将成为全球市场的“性价比之王”