AI情报员:人工智能如何赢得数学金牌 | 路透社
Krystal Hu
2017年6月7日,瑞士日内瓦国际电信联盟(ITU)举办的"AI向善"全球峰会上,屏幕投影展示了一只机器人手与人类手相互靠近的示意图。路透社/Denis Balibouse7月24日(路透社) - 本文原载于每周三发布的《人工智能通讯》。点击此处注册了解AI与科技领域最新突破。在路透社Momentum人工智能大会(新窗口打开)上,上周硅谷的《财富》500强高管们反复提及两个短语:“人在回路"和"扁平即是新增长”。通过路透社《人工智能通讯》了解AI与科技领域最新突破。立即注册
这反映出谨慎而雄心勃勃的战略:尽管几乎所有公司仍让人工与AI协同工作,但早期成效已显示企业正在不增加人力的情况下实现收入增长。
广告·继续滚动变化何在?组织内部的工作本质。首轮裁员已波及外包劳动力。员工正转向更高价值的工作,例如处理复杂任务和审核AI输出。人均收入正在上升,或如某些人所说:“人员编制持平即是新增长”。
尽管有观点认为2025年将成为AI智能体元年,但针对复杂场景的真正自主工作流似乎仍遥不可及。事实上,部分企业高管仍将AI模型视为模式匹配工具而非真正的推理引擎。
在与谷歌和OpenAI研究人员交流后(这两家实验室刚在今年国际数学奥林匹克竞赛中斩获金牌),我发现他们的观点截然不同。相信这是AI模型正在推进的推理范式发展历程中激动人心的里程碑。继续阅读了解其重要意义。
广告·继续滚动欢迎通过邮件[email protected](新窗口打开)或领英(新窗口打开)联系我分享反馈意见,以及您想了解的AI领域下期选题。 ### 科技与AI领域最新报道
独家-黑石集团退出TikTok美国业务竞购团白宫将公布推动美国AI出海计划,收紧本土AI监管特朗普政府寻求美国企业出口AI芯片的合规路径英伟达CEO中国魅力攻势凸显其关键市场巨星地位欧盟AI新规指南:存在系统性风险的AI模型合规要点台积电受益AI需求创季度利润纪录,但对关税政策保持警惕### AI如何斩获数学金牌
人工智能跨越了一个令顶尖研究者都感到惊讶的门槛。谷歌DeepMind的AI首次在国际数学奥林匹克竞赛——全球最顶尖的高中数学赛事中夺得金牌。
未正式参加本届IMO的OpenAI表示,根据外部专家按IMO标准评分的解题结果,其模型同样展现出金牌级表现。
虽然这很容易被视为AI势不可挡进程中的又一则新闻,但我深入采访了这些模型背后的智囊团——其中不少人本身就是前IMO奖牌得主——试图理解这一突破的意义及其揭示的AI前沿发展。
关键启示?DeepMind的Gemini Pro和OpenAI的o1系列模型展现的推理能力具有无限可能。这次胜利也印证了模型提升的经典配方:高质量数据与海量算力。
尽管两家实验室都未完全公开方法细节,但都展示了"延长思考时间"的威力。自去年起,顶尖AI实验室已从规模扩张预训练和增大模型规模,转向利用测试时算力为模型提供更多"思考时间"。OpenAI阐释了其模型如何同步尝试每个问题数十次,通过共识机制和多智能体策略整合最佳解法;DeepMind则采用"深度思考"技术,使Gemini能同时探索多条解题路径,综合思路后生成严谨的人类可读证明。
研究人员称之为“范式转变”的是,DeepMind的人工智能从一年前还需要专家人工翻译,到本周已能用自然语言解决六道国际数学奥林匹克(IMO)问题中的五道。
这一突破直接挑战了长期以来的怀疑论,即AI模型只是聪明的模仿者,只会预测下一个单词。数学需要多步骤、创造性的证明,已成为真正推理能力的终极测试,而AI刚刚通过了这一考验。
我们尚不清楚解决每道题目消耗了多少并行计算资源,但OpenAI透露其成本“非常高昂”。毕竟,这些模型和人类选手一样,每套题仅有约4.5小时的解题时间。
这凸显了当今最智能模型对庞大计算资源的需求,也解释了为何AI实验室对英伟达GPU等芯片有着永不满足的渴求。随着这些方法扩展到编码、科学、创意写作等其他领域,计算需求将持续增长。两家实验室都将突破归功于高质量数据:逐步标注的证明过程,而非最终答案。DeepMind特别指出,其新型强化学习技术不仅奖励答案正确性,还注重证明过程的优雅与清晰度。
这对未来意味着什么?“AI能否推理”的争论或许已有定论——至少在奥林匹克数学这般挑战性的领域。随着研究人员破解数学密码并转向新前沿,AI模型中不断涌现的真正思维能力或将彻底改变多个领域。
DeepMind正致力于将其系统交付数学家使用,并很快向更广泛的公众开放。OpenAI表示正利用从该模型中学到的知识训练其他系统,但这一特定功能不会包含在今年夏季即将发布的GPT-5中。
本周图表
您阅读这份AI简报很可能已是AI使用者,这意味着您属于61%将AI融入生活的美国人群。根据门罗风投报告(新标签页打开),其余39%人群仍持怀疑态度。最大障碍?传统的人际互动需求。约80%非使用者表示更倾向与人而非机器打交道,尤其在重要决策时。事实上,53%受访者要求由人类进行监督追责,而非仅依赖即时响应的数字助手。
其他主要障碍包括数据隐私担忧(71%)、对AI实用性的怀疑(63%),以及对AI提供信息保持合理不信任(58%)。可见虽然机器人已准备就绪,人类仍在等待更高的可信度、透明度,以及——坦白说——更多人性化元素。
消费者未使用AI原因的条形图
- 推荐主题:
- 科技