OpenAI发布针对编程与视觉任务的新推理模型 - 彭博社

Rachel Metz

2025-04-17

OpenAI于2022年底推出ChatGPT引发生成式AI热潮，该产品最初由GPT-3.5模型驱动。

摄影师：安德烈·鲁达科夫/彭博社OpenAI正在推出两款新型人工智能模型，通过模拟人类推理过程来处理更复杂的编程问题与视觉任务，这是该公司为抵御中美市场新竞争而密集发布的最新成果。

周三公司宣布，首个名为o3的模型会在响应用户指令前进行更长时间的计算，旨在解决涉及科学、数学和编程的复杂多步骤问题。同期发布的o4-mini模型在同类任务中表现优异，但设计更为轻量化。两款模型现已面向付费用户开放。

OpenAI表示o3和o4-mini是其首批能调用ChatGPT全系列工具（包括网页浏览、图像生成与分析）的推理模型，也是首个将视觉信息整合到推理流程的系统，可处理模糊图像并在执行任务时实现照片旋转与缩放。

自2022年底以GPT-3.5驱动的ChatGPT引爆生成式AI狂潮以来，OpenAI已陆续发布包括多款推理模型在内的进阶系统。但该公司正面临来自中国新锐DeepSeek、Anthropic及马斯克旗下xAI的持续压力，这些竞争者接连推出具备同类尖端能力的AI模型。

编程，尤其是生成式AI快速崛起的应用领域——也成为了OpenAI的关键战场。Anthropic和Alphabet旗下的谷歌都大力宣传了其新一代AI系统的编程能力。其他初创公司，如Cursor制造商Anysphere，也凭借面向程序员的AI工具获得了关注。

为了在这个竞争激烈的市场中更好地竞争，OpenAI宣布发布Codex CLI，这是一款旨在与o3等模型配合使用、帮助人们完成编码任务的AI代理。该产品是开源的，意味着用户可以免费使用。它还能直接在用户电脑上运行，通过设备的终端软件进行操作。

OpenAI首席执行官萨姆·奥尔特曼此前表示，在DeepSeek的开源系统R1取得病毒式成功后，公司正在开发一款开源推理模型，将在未来几个月内发布。奥尔特曼还提到，OpenAI将在"几个月内"发布备受期待的GPT-5新模型。