聊天机器人竞技场集团从学术项目蜕变为价值6亿美元的初创企业——彭博社

Rachel Metz, Katie Roof

2025-05-21

顶尖人工智能公司和开源新秀都使用该网站来测试他们的新模型。

摄影师：Jaque Silva/NurPhoto/Getty Images

Chatbot竞技场最初是一个学术项目，加州大学伯克利分校的研究人员和学生致力于评估人工智能工具的能力。现在，该团队已分拆为一家名为LMArena的新公司，并从一系列顶级投资者那里筹集了1亿美元的种子资金。

Andreessen Horowitz和负责管理加州大学投资组合的UC Investments领投了这轮融资，公司计划于周三宣布这一消息。该公司表示，此轮融资还包括Lightspeed Venture Partners、Felicis Ventures和Kleiner Perkins等机构的支持。

据不愿透露姓名的知情人士透露，此轮融资对LMArena的估值为6亿美元。这使得这家成立于4月、不到两个月的公司获得了可观的估值。LMArena拒绝对其估值发表评论。

“我们认为评估现在比我们开始时更重要，”LMArena联合创始人兼董事长Ion Stoica说。Stoica是加州大学伯克利分校的教授，同时也是Databricks Inc.和Anyscale Inc.等科技公司的联合创始人。

LMArena网站让人们能够测试一系列尖端AI模型，并观察它们的直接对决表现。用户随后在网站排行榜上为他们偏好的模型投票，这些排行榜受到科技界的密切关注。

该测试平台创建于2023年初，即OpenAI发布ChatGPT并引发热潮几个月后，由加州大学伯克利分校的Sky Computing实验室作为研究项目开发。它很快成为早期采用者的热门场所，并在快速发展的AI基准测试领域成为领先指标，每月访问量达百万次。早期担任该项目导师的Stoica与Anastasios Angelopoulos和Wei-Lin Chiang共同创立了这家公司——两人都是该研究项目的负责人，现在分别担任公司的首席执行官和首席技术官。

该公司表示，迄今为止，人们已在LMArena平台上为400多个AI模型投出了总计超过300万张选票。顶级AI公司和开源新秀都使用该网站测试他们的新模型，包括Google、OpenAI、Anthropic、xAI和DeepSeek。一些公司甚至在公开发布前就在平台上发布模型，如OpenAI去年春天对其GPT-4o模型所做的那样。在DeepSeek于1月下旬引起全球关注之前，它已在Chatbot Arena排行榜上悄然攀升。

安德森·霍洛维茨基金的合伙人安杰尼·米达表示，这家初创公司尤其让构建开源AI模型的实验室更容易看清自家技术与专有模型的对比情况。他指出，随着AI应用日益普及，测试对于帮助判断AI工具是否可靠变得愈发关键。

“从持续测试平台的角度来确保AI可靠性这一理念至关重要，已成为整个领域的核心所在，“他说道。

斯托伊卡透露，即便作为研究项目，该平台每年运营成本也高达数百万美元。融资将用于扩展LMArena平台、增聘人员，以及支付在平台上运行AI模型所需的算力等费用。安杰洛普洛斯表示，公司还计划为平台添加更多功能并开展研究。他补充说，LMArena希望提升平台用户的多样性——目前约60%用户来自科技行业。

“现实情况是，它已超越学术项目的范畴，“安杰洛普洛斯指出，“因此我们需要建立一个组织来运营这个平台，支持其发展，将其打造成能更好服务社区、反映用户偏好，并帮助生态系统从这些人类偏好中学习，从而构建出色可靠模型的平台。”