OpenAI发布o1模型,具备推理能力 - 彭博社
Rachel Metz
在智能手机上代表OpenAI的一个符号。
摄影师:安德烈·鲁达科夫/彭博社OpenAI正在发布一个新的人工智能模型,内部称为“草莓”,它可以执行一些类人推理任务,因为它希望在竞争激烈的市场中保持领先。新模型名为o1,旨在在回应用户查询之前花更多时间计算答案,该公司在一篇博客文章中表示。通过该模型,OpenAI的工具应该能够解决多步骤问题,包括复杂的数学和编码问题。“作为一个早期模型,它还没有许多使ChatGPT有用的功能,比如浏览网络获取信息和上传文件和图像,”该公司表示。“但对于复杂的推理任务,这是一个重要的进步,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为1,并将这一系列命名为OpenAI o1。”该模型的预览版本将于周四通过OpenAI的热门聊天机器人ChatGPT向付费Plus和Team用户提供。彭博社此前报道,该公司可能会在本周尽快发布新模型。该模型的发布恰逢总部位于旧金山的OpenAI正在寻求数十亿美元的资金,并面临在开发越来越复杂的人工智能系统的竞争中加剧的竞争。OpenAI并不是唯一一家致力于此类能力的公司;竞争对手Anthropic和谷歌也宣传其先进AI模型的“推理”技能。在其博客文章中,OpenAI给出了AI模型对包括编码、英语和数学等主题问题的回答示例,并要求它解决一个简单的填字游戏。在一系列X上的帖子中,OpenAI的研究科学家诺亚·布朗表示,该公司现在发布该模型的预览部分是为了了解人们如何使用它,以及需要改进的地方。
使用OpenAI更新的AI系统的体验将与人们对该公司的聊天机器人ChatGPT的期望有所不同。在回应用户的提示之前,新软件会暂停几秒钟,同时在后台(用户看不见的地方)考虑多个相关提示,然后总结出看似最佳的回应。这种技术有时被称为“思维链”提示。OpenAI一直在努力让计算机执行多步骤的操作。例如,在2023年5月,该公司发布了一篇 博客文章及其附带的 研究论文,介绍其改善AI系统解决数学问题能力的努力。根据论文,该公司通过奖励模型在解决问题过程中每一步的正确性来训练模型,而不仅仅是通过奖励生成准确答案来进行训练。