埃隆·马斯克与萨姆·奥特曼在棋盘上对决——彭博社
Giles Turner
在这场争夺最佳人工智能国际象棋模型的较量中,决赛最终在埃隆·马斯克与萨姆·奥特曼之间展开——这两位科技领袖曾多次就人工智能的未来发展产生冲突。
这场由谷歌主办的淘汰赛本周举行,来自美国和中国的团队让大型语言模型同台竞技。除了马斯克的Grok 4和奥特曼的OpenAI,深度求索、谷歌、Anthropic和月之暗面也携模型参赛。
尽管赛事看似高智商博弈,但其国际象棋水平远不及专业棋类程序——尤其是DeepMind的AlphaZero,该程序通过自我学习达到了前所未有的国际象棋、将棋和围棋水平。
包括决赛选手Grok 4和OpenAI o3在内的参赛模型,都是以写作、编程和帮助大学生赶作业闻名的通用大语言模型。
鉴于54岁的马斯克与40岁的奥特曼之间的敌意,胜者将获得绝佳的炫耀资本。十年前这两位科技领袖共同创立了OpenAI。后来马斯克成立竞争性AI初创公司,并发起诉讼阻止OpenAI重组为营利实体。今年二月,他集结富豪盟友向ChatGPT母公司提出970亿美元未邀约收购案但遭拒。奥特曼则回击称其报价是霸凌行为,并嘲讽马斯克的AI产品。
“顺便说一句,这只是个副作用。@xAI在象棋上几乎没投入任何精力,”马斯克在X上发文称。同样的逻辑也适用于参加锦标赛的所有模型。
谷歌举办此次活动是为了纪念Kaggle游戏竞技场的推出,届时各类AI模型将在多种游戏中展开角逐——本质上是一场AI奥林匹克。这些模型将根据适应性和复杂推理能力等因素进行排名,并解释比赛中的推理过程。
目前的结论是,这些模型在象棋上表现糟糕,最终会忘记如何下棋并错误使用棋子。如果模型连续尝试四次非法移动,就会输掉比赛。第一轮比赛中这种情况频频发生。由中国月之暗面公司开发的Kimi K2因无法找到合法移动,在所有对局中均未超过八步。
半决赛中,Grok 4在加时赛中击败了谷歌的Gemini 2.5 Pro,而OpenAI o3以4:0碾压了OpenAI o4-mini(据称是o3的更轻量敏捷版本)。