OpenAI发布o1模型，具备推理能力 - 彭博社

Rachel Metz

2024-09-13

在智能手机上代表OpenAI的一个符号。

摄影师：安德烈·鲁达科夫/彭博社OpenAI正在发布一个新的人工智能模型，内部称为“草莓”，它可以执行一些类人推理任务，因为它希望在竞争激烈的市场中保持领先。新模型名为o1，旨在在回应用户查询之前花更多时间计算答案，该公司在一篇博客文章中表示。通过该模型，OpenAI的工具应该能够解决多步骤问题，包括复杂的数学和编码问题。“作为一个早期模型，它还没有许多使ChatGPT有用的功能，比如浏览网络获取信息和上传文件和图像，”该公司表示。“但对于复杂的推理任务，这是一个重要的进步，代表了人工智能能力的新水平。鉴于此，我们将计数器重置为1，并将这一系列命名为OpenAI o1。”该模型的预览版本将于周四通过OpenAI的热门聊天机器人ChatGPT向付费Plus和Team用户提供。彭博社此前报道，该公司可能会在本周尽快发布新模型。该模型的发布恰逢总部位于旧金山的OpenAI正在寻求数十亿美元的资金，并面临在开发越来越复杂的人工智能系统的竞争中加剧的竞争。OpenAI并不是唯一一家致力于此类能力的公司；竞争对手Anthropic和谷歌也宣传其先进AI模型的“推理”技能。在其博客文章中，OpenAI给出了AI模型对包括编码、英语和数学等主题问题的回答示例，并要求它解决一个简单的填字游戏。在一系列X上的帖子中，OpenAI的研究科学家诺亚·布朗表示，该公司现在发布该模型的预览部分是为了了解人们如何使用它，以及需要改进的地方。

使用OpenAI更新的AI系统的体验将与人们对该公司的聊天机器人ChatGPT的期望有所不同。在回应用户的提示之前，新软件会暂停几秒钟，同时在后台（用户看不见的地方）考虑多个相关提示，然后总结出看似最佳的回应。这种技术有时被称为“思维链”提示。OpenAI一直在努力让计算机执行多步骤的操作。例如，在2023年5月，该公司发布了一篇博客文章及其附带的研究论文，介绍其改善AI系统解决数学问题能力的努力。根据论文，该公司通过奖励模型在解决问题过程中每一步的正确性来训练模型，而不仅仅是通过奖励生成准确答案来进行训练。