OpenAI在DeepSeek取得成功后发布开源模型——彭博社
Rachel Metz
OpenAI首席执行官萨姆·奥尔特曼此前表示,公司需要"探索不同的开源策略"。
摄影师:Nathan Laine/彭博社在中国深度求索公司凭借其开源AI软件引发全球关注数月后,OpenAI发布了两款可模拟人类推理过程的开放免费人工智能模型。
OpenAI周二宣布,名为GPT-oss-120b和GPT-oss-20b的两款模型将在AI软件托管平台Hugging Face上线,能根据用户指令生成文本(但不含图像或视频)。该公司表示,这些模型还能执行编写代码、代用户在线查询信息等复杂任务。
关键在于,这两款模型与Meta Platforms Inc.的Llama类似,均采用开放权重系统。“权重"指AI模型中的参数。OpenAI公开了模型在训练过程中获取并调整的大量数值,方便开发者进行定制化改进。但该公司未公开训练数据,因此不符合真正开源AI模型的完整定义。
尽管名为"开放”,OpenAI多数模型实为封闭系统——这类软件由开发者控制,用户无法修改,技术细节透明度较低。与美国许多同行类似,OpenAI严格保护训练数据,并通过对其最强模型收取更高费用来抵消巨额开发成本。自2019年发布聊天机器人ChatGPT前身GPT-2以来,这是OpenAI首次推出开放模型。
在DeepSeek于1月发布其开源R1系统后不久,OpenAI首席执行官萨姆·奥尔特曼表示公司正在讨论公开部分模型权重。他承认OpenAI需要"制定不同的开源战略"。近期,特朗普总统的《人工智能行动计划》鼓励开发开源模型,认为其有望在商业和学术研究中"成为全球标准"。
然而开源软件的批评者长期认为其安全性较低。7月,奥尔特曼在社交平台X上发文称,公司原计划当月中旬发布开源权重模型,但为了"进行额外安全测试和审查高风险领域"而暂缓。
“虽然我们相信社区会用这个模型创造伟大成果,但权重一旦公开就无法撤回,“奥尔特曼当时表示。他补充说这种发布"对我们来说是新的”,公司希望"妥善处理”。OpenAI计划让希望自行调整并在本地硬件和服务上运行AI系统的个人、企业和政府使用新开源模型。该公司表示,Orange SA和软件公司Snowflake Inc.等企业已开始测试这些模型。
两款新模型都相对紧凑高效。公司表示,性能更强的120b版本可在单个80GB显存的图形处理器上运行。与此同时,OpenAI称20b模型能在配备16GB内存的笔记本电脑上运作。
OpenAI本周向记者介绍时表示,希望通过收集用户反馈来评估未来应发布何种开源模型。