谷歌在全球数学竞赛中斩获里程碑式金牌，OpenAI亦宣布获胜 | 路透社

Kenrick Cai,Jaspreet Singh

2025-07-22

2025年5月13日，美国加州山景城某公司研究设施内拍摄到的谷歌标志。路透社/Carlos Barria/档案照片购买授权许可，打开新标签页7月21日（路透社）——Alphabet旗下(GOOGL.O)，打开新标签页谷歌与OpenAI宣布，其人工智能模型在全球数学竞赛中获得金牌，标志着在构建媲美人类智能系统的竞赛中，数学能力取得重大突破。这一成果意味着AI系统首次在国际中学生数学奥林匹克竞赛（IMO）中突破金牌分数线。

路透每日简报为您提供开启一天所需的全部新闻。立即注册。

广告·继续阅读两家公司的模型成功解答了六道题目中的五道，通过通用型"推理“模型（该模型使用自然语言处理数学概念）实现这一成绩，与AI公司此前采用的技术路径形成鲜明对比。虽然谷歌DeepMind与国际数学奥林匹克委员会合作，让其模型接受该委员会的评分和认证，但OpenAI并未正式参赛。这家初创公司周六透露，根据三位外部IMO奖牌得主的评分，他们的模型在今年试题上取得了金牌级别的成绩。

布朗大学数学教授、谷歌DeepMind人工智能部门访问研究员Junehyuk Jung表示，这一成就表明人工智能距离被数学家用于破解该领域前沿未解研究问题已不足一年时间。

广告·继续滚动"我认为当我们能够用自然语言解决复杂推理问题时，就将开启AI与数学家合作的潜力，“Jung对路透社表示。

OpenAI的突破是通过一个以大规模扩展"测试时计算"为核心的新实验模型实现的。OpenAI研究员Noam Brown表示，这既通过让模型"思考"更长时间，也通过部署并行计算能力同时运行大量推理线来实现。Brown拒绝透露OpenAI为此投入了多少计算资源，但称其"非常昂贵”。

对OpenAI研究人员而言，这再次明确表明AI模型可以掌握广泛的推理能力，这些能力可能扩展到数学以外的其他领域。

谷歌研究人员也持同样乐观态度，曾于2003年以学生身份获得IMO金牌的Jung表示，他们相信AI模型的能力可以应用于物理等其他领域的研究难题。

在澳大利亚昆士兰州阳光海岸举行的第66届国际数学奥林匹克竞赛(IMO)中，630名参赛学生中有67人（约11%）获得了金牌分数。

谷歌旗下DeepMind人工智能部门去年使用专门针对数学的AI系统获得了银牌分数。今年谷歌采用了名为Gemini Deep Think的通用模型，其早期版本已于5月在年度开发者大会上首次亮相。该公司在博客中表示，与以往依赖形式化语言和冗长计算的AI尝试不同，谷歌今年的方法完全采用自然语言处理，并在官方规定的4.5小时时限内完成了试题解答。

据研究员Alexander Wei在社交平台X上发文，拥有自主推理模型体系的OpenAI同样为本次竞赛构建了实验版本。他指出公司未来数月内暂不计划发布具备此等数学能力的成果。今年是该竞赛首次与部分AI开发商开展官方合作。多年来，开发者们一直以IMO等顶尖数学赛事作为模型能力测试平台。IMO评委对包括谷歌在内的企业成果进行了认证，并要求它们于7月28日公布结果。

“我们尊重IMO组委会最初的要求——所有AI实验室需在独立专家验证官方成绩，且参赛学生获得应得荣誉后，方可分享其成果。“DeepMind首席执行官Demis Hassabis周一在X平台表示。

OpenAI于周六公布了其成果并首次宣称获得金牌地位，该公司在一次采访中表示，已获得国际数学奥林匹克（IMO）董事会成员许可，在周六闭幕式后发布这一消息。

IMO董事会主席Gregor Dolinar向路透社表示，周一的比赛允许合作企业公布结果。

推荐主题：
中断