埃隆·马斯克与萨姆·奥特曼在棋盘上对决——彭博社

Giles Turner

2025-08-08

在这场争夺最佳人工智能国际象棋模型的较量中，决赛最终在埃隆·马斯克与萨姆·奥特曼之间展开——这两位科技领袖曾多次就人工智能的未来发展产生冲突。

这场由谷歌主办的淘汰赛本周举行，来自美国和中国的团队让大型语言模型同台竞技。除了马斯克的Grok 4和奥特曼的OpenAI，深度求索、谷歌、Anthropic和月之暗面也携模型参赛。

尽管赛事看似高智商博弈，但其国际象棋水平远不及专业棋类程序——尤其是DeepMind的AlphaZero，该程序通过自我学习达到了前所未有的国际象棋、将棋和围棋水平。

包括决赛选手Grok 4和OpenAI o3在内的参赛模型，都是以写作、编程和帮助大学生赶作业闻名的通用大语言模型。

鉴于54岁的马斯克与40岁的奥特曼之间的敌意，胜者将获得绝佳的炫耀资本。十年前这两位科技领袖共同创立了OpenAI。后来马斯克成立竞争性AI初创公司，并发起诉讼阻止OpenAI重组为营利实体。今年二月，他集结富豪盟友向ChatGPT母公司提出970亿美元未邀约收购案但遭拒。奥特曼则回击称其报价是霸凌行为，并嘲讽马斯克的AI产品。

“顺便说一句，这只是个副作用。@xAI在象棋上几乎没投入任何精力，”马斯克在X上发文称。同样的逻辑也适用于参加锦标赛的所有模型。

谷歌举办此次活动是为了纪念Kaggle游戏竞技场的推出，届时各类AI模型将在多种游戏中展开角逐——本质上是一场AI奥林匹克。这些模型将根据适应性和复杂推理能力等因素进行排名，并解释比赛中的推理过程。

目前的结论是，这些模型在象棋上表现糟糕，最终会忘记如何下棋并错误使用棋子。如果模型连续尝试四次非法移动，就会输掉比赛。第一轮比赛中这种情况频频发生。由中国月之暗面公司开发的Kimi K2因无法找到合法移动，在所有对局中均未超过八步。

半决赛中，Grok 4在加时赛中击败了谷歌的Gemini 2.5 Pro，而OpenAI o3以4:0碾压了OpenAI o4-mini（据称是o3的更轻量敏捷版本）。