OpenAI发布针对编程与视觉任务的新推理模型 - 彭博社
Rachel Metz
OpenAI于2022年底推出ChatGPT引发生成式AI热潮,该产品最初由GPT-3.5模型驱动。
摄影师:安德烈·鲁达科夫/彭博社OpenAI正在推出两款新型人工智能模型,通过模拟人类推理过程来处理更复杂的编程问题与视觉任务,这是该公司为抵御中美市场新竞争而密集发布的最新成果。
周三公司宣布,首个名为o3的模型会在响应用户指令前进行更长时间的计算,旨在解决涉及科学、数学和编程的复杂多步骤问题。同期发布的o4-mini模型在同类任务中表现优异,但设计更为轻量化。两款模型现已面向付费用户开放。
OpenAI表示o3和o4-mini是其首批能调用ChatGPT全系列工具(包括网页浏览、图像生成与分析)的推理模型,也是首个将视觉信息整合到推理流程的系统,可处理模糊图像并在执行任务时实现照片旋转与缩放。
自2022年底以GPT-3.5驱动的ChatGPT引爆生成式AI狂潮以来,OpenAI已陆续发布包括多款推理模型在内的进阶系统。但该公司正面临来自中国新锐DeepSeek、Anthropic及马斯克旗下xAI的持续压力,这些竞争者接连推出具备同类尖端能力的AI模型。
编程,尤其是生成式AI快速崛起的应用领域——也成为了OpenAI的关键战场。Anthropic和Alphabet旗下的谷歌都大力宣传了其新一代AI系统的编程能力。其他初创公司,如Cursor制造商Anysphere,也凭借面向程序员的AI工具获得了关注。
为了在这个竞争激烈的市场中更好地竞争,OpenAI宣布发布Codex CLI,这是一款旨在与o3等模型配合使用、帮助人们完成编码任务的AI代理。该产品是开源的,意味着用户可以免费使用。它还能直接在用户电脑上运行,通过设备的终端软件进行操作。
OpenAI首席执行官萨姆·奥尔特曼此前表示,在DeepSeek的开源系统R1取得病毒式成功后,公司正在开发一款开源推理模型,将在未来几个月内发布。奥尔特曼还提到,OpenAI将在"几个月内"发布备受期待的GPT-5新模型。