人工智能:为何AI在数学金牌上的胜利至关重要 | 路透社
Krystal Hu
2017年6月7日,瑞士日内瓦国际电信联盟(ITU)举办的"AI向善"全球峰会上,屏幕投影的插图显示一只机械手与人类的手正相互靠近。路透社/Denis Balibouse7月24日(路透社) - 本文原载于每周三发布的《人工智能通讯》。点击此处注册了解AI与科技领域最新突破。在路透社Momentum人工智能大会(新窗口打开)上,上周硅谷的《财富》500强高管们反复提及两个短语:“人在回路"和"扁平即新增长”。通过路透社《人工智能通讯》了解AI与科技领域最新突破。立即注册
这反映出谨慎而雄心勃勃的战略:尽管几乎所有企业仍让人工与AI协同工作,但早期成效已表明企业正在不增加人力的情况下实现收入增长。
广告·继续滚动变化何在?企业内部的劳动本质。首轮裁员已冲击外包劳动力。员工正转向更高价值的工作,例如处理复杂任务和审核AI输出。人均收入正在上升,或如某些人所说:“人员编制持平即是新增长”。
尽管有观点认为2025年将成为AI智能体元年,但真正自主的工作流在复杂应用场景中似乎仍遥不可及。事实上,部分高管仍将AI模型视为模式匹配工具而非真正的推理引擎。
在与谷歌和OpenAI研究人员交流后(这两家实验室刚在今年国际数学奥林匹克竞赛中斩获金牌),我发现他们的看法截然不同。相信这是AI模型正在推进的推理范式发展中一个激动人心的里程碑。向下滚动了解其重要意义。
广告·继续阅读欢迎通过邮件[email protected](新标签页打开)或领英(新标签页打开)联系我分享反馈意见,以及您想了解的AI领域下期选题。科技与AI领域最新报道
独家-黑石集团退出TikTok美国业务竞购白宫将公布推动美国AI出海计划,收紧本土AI监管特朗普政府寻求美国企业出口AI芯片的合规路径英伟达CEO中国魅力攻势凸显其关键市场巨星地位欧盟AI监管新规为存在系统性风险的AI模型提供合规指引台积电受益AI需求创季度利润纪录,但对关税政策保持警惕AI如何赢得数学金牌
AI跨越了一个连顶尖研究者都感到惊讶的门槛。谷歌DeepMind的AI首次在国际数学奥林匹克竞赛——全球最顶尖的高中数学竞赛中斩获金牌。
未正式参加今年IMO的OpenAI表示,根据外部专家按照IMO标准评分的解题结果,其模型同样达到了金牌水平。
虽然人们很容易将此视为AI高歌猛进中的又一则新闻,但我深入采访了这些模型背后的智囊团——其中不少人本身就是前IMO奖牌得主——试图理解这一突破的历程,以及这些胜利揭示了AI前沿发展哪些奥秘。
关键启示是什么?DeepMind的Gemini Pro和OpenAI的o1系列模型展现的推理能力具有无限可能。这次胜利也印证了模型提升的经典配方:高质量数据与海量算力。
尽管两家实验室都未完全公开方法细节,但它们都展示了"延长思考时间"的威力。自去年起,顶级AI实验室已从扩大预训练规模转向利用测试阶段算力为模型提供更多"思考时间"。OpenAI阐释了其模型如何同时尝试数十次每个题目,通过共识机制与多智能体策略整合最佳解法。而DeepMind则运用"深度思考"技术,使Gemini能并行探索多条解题路径,综合思路后生成严谨且人类可读的证明过程。
研究人员称之为“范式转变”的是,DeepMind的AI从一年前还需要专家人工翻译,到本周已能用自然语言解决六道国际数学奥林匹克(IMO)问题中的五道。
这一突破直接挑战了长期以来的怀疑论,即AI模型只是预测下一个词的巧妙模仿者。需要多步骤创造性证明的数学已成为真正推理能力的终极试金石,而AI刚刚通过了这项测试。
我们尚不清楚解决每道题目具体消耗了多少并行计算资源,但OpenAI表示这“极其昂贵”。毕竟,这些模型和人类选手一样被给予约4.5小时来完成每组题目。
这凸显了当今最智能的AI模型需要巨大的计算资源,也解释了为何AI实验室对英伟达GPU等芯片有着永不满足的需求。随着这些方法扩展到编码、科学、创意写作等其他领域,计算需求将持续增长。两家实验室都将突破归功于高质量数据:逐步标注的证明过程,而非最终答案。DeepMind特别指出,其新型强化学习技术不仅奖励正确性,还注重证明过程的优雅与清晰。
这对未来意味着什么?“AI能否推理?”的争论或许已有定论——至少在奥林匹克数学这样高难度的领域。随着研究人员破解数学密码并转向新前沿,AI模型中不断涌现的真正思维能力或将改变多个领域。
DeepMind正致力于将其系统推广给数学家使用,并很快将面向更广泛的公众。OpenAI表示正利用从该模型中学到的经验训练其他系统,但这一特定功能不会包含在今年夏季即将发布的GPT-5中。
本周图表
您阅读这份AI简报很可能已是AI使用者,这意味着您属于61%将AI融入生活的美国人群。根据门罗风投报告(新标签页打开),其余39%人群仍持怀疑态度。最大阻力?传统的人际互动需求。约80%非使用者表示更倾向与人而非机器打交道,尤其在重要决策时。事实上,53%受访者要求由人类进行责任监督,而非仅依赖即时响应的数字助手。
其他主要障碍包括数据隐私担忧(71%)、对AI实用性的怀疑(63%),以及对AI提供信息保持合理不信任(58%)。可见当技术准备就绪时,人们仍在期待更多信任、透明度,以及更关键的一点——人性化元素。
消费者拒绝使用AI原因的条形图
- 推荐主题:
- 科技