OpenAI在DeepSeek取得成功后发布开源模型——彭博社

Rachel Metz

2025-08-06

OpenAI首席执行官萨姆·奥尔特曼此前表示，公司需要"探索不同的开源策略"。

摄影师：Nathan Laine/彭博社在中国深度求索公司凭借其开源AI软件引发全球关注数月后，OpenAI发布了两款可模拟人类推理过程的开放免费人工智能模型。

OpenAI周二宣布，名为GPT-oss-120b和GPT-oss-20b的两款模型将在AI软件托管平台Hugging Face上线，能根据用户指令生成文本（但不含图像或视频）。该公司表示，这些模型还能执行编写代码、代用户在线查询信息等复杂任务。

关键在于，这两款模型与Meta Platforms Inc.的Llama类似，均采用开放权重系统。“权重"指AI模型中的参数。OpenAI公开了模型在训练过程中获取并调整的大量数值，方便开发者进行定制化改进。但该公司未公开训练数据，因此不符合真正开源AI模型的完整定义。

尽管名为"开放”，OpenAI多数模型实为封闭系统——这类软件由开发者控制，用户无法修改，技术细节透明度较低。与美国许多同行类似，OpenAI严格保护训练数据，并通过对其最强模型收取更高费用来抵消巨额开发成本。自2019年发布聊天机器人ChatGPT前身GPT-2以来，这是OpenAI首次推出开放模型。

在DeepSeek于1月发布其开源R1系统后不久，OpenAI首席执行官萨姆·奥尔特曼表示公司正在讨论公开部分模型权重。他承认OpenAI需要"制定不同的开源战略"。近期，特朗普总统的《人工智能行动计划》鼓励开发开源模型，认为其有望在商业和学术研究中"成为全球标准"。

然而开源软件的批评者长期认为其安全性较低。7月，奥尔特曼在社交平台X上发文称，公司原计划当月中旬发布开源权重模型，但为了"进行额外安全测试和审查高风险领域"而暂缓。

“虽然我们相信社区会用这个模型创造伟大成果，但权重一旦公开就无法撤回，“奥尔特曼当时表示。他补充说这种发布"对我们来说是新的”，公司希望"妥善处理”。OpenAI计划让希望自行调整并在本地硬件和服务上运行AI系统的个人、企业和政府使用新开源模型。该公司表示，Orange SA和软件公司Snowflake Inc.等企业已开始测试这些模型。

两款新模型都相对紧凑高效。公司表示，性能更强的120b版本可在单个80GB显存的图形处理器上运行。与此同时，OpenAI称20b模型能在配备16GB内存的笔记本电脑上运作。

OpenAI本周向记者介绍时表示，希望通过收集用户反馈来评估未来应发布何种开源模型。