OpenAI推出两款“gpt-oss”推理模型,向开发者免费开放

OpenAI
OpenAI

OpenAI日前宣布推出两款开源AI推理模型gpt-oss-120b与轻量级gpt-oss-20b,标志着该公司自五年前发布GPT-2以来首次重新开放语言模型。现已可通过在线平台Hugging Face免费下载,适用于高性能服务器与普通消费级笔电。

OpenAI称,这两款模型在多个开放模型评测基准中表现“业界领先”,其发布旨在提升美国AI生态在开源领域的影响力,同时回应来自开发者群体与政策层面对“民主价值导向AI”的期待。

OpenAI介绍,gpt-oss-120b模型共拥有1170亿参数,但在执行任务时仅激活约5.1亿参数,实现高效运行,支持在单张NVIDIA高端GPU上部署。而gpt-oss-20b模型则面向轻量级需求,可在16GB内存的笔记本上运行。

尽管性能与OpenAI的封闭系列如o3、o4-mini模型尚有差距,gpt-oss在多个测评中仍优于DeepSeek、Qwen等中国公司推出的开源模型,展现出强劲竞争力。

在Codeforces编程测试中,gpt-oss-120b与gpt-oss-20b分别得分2622与2516,超过DeepSeek R1模型。在“Humanity’s Last Exam”跨学科推理测试中,两款模型得分分别为19%与17.3%,虽不及o3模型,但领先于DeepSeek和Qwen等主流开源模型。

不过,gpt-oss模型在“幻觉率”(AI生成虚假或错误内容的频率)方面表现逊色。在OpenAI内部基准PersonQA测试中,gpt-oss-120b和20b的幻觉率分别高达49%与53%,远高于o1模型的16%和o4-mini的36%。OpenAI解释称,小模型由于世界知识储备不足,产生幻觉的概率更高。

OpenAI表示,gpt-oss模型使用与封闭模型相同的强化学习流程进行后期训练,并具备“链式思维”推理能力。这使得模型在应对复杂任务时能调用搜索、Python执行等外部工具,适用于构建AI智能体。

尽管如此,gpt-oss系列目前为纯文本模型,不支持图像或音频的生成与处理。

gpt-oss模型采用 Apache 2.0许可协议,允许企业自由使用与商业化而无需额外许可或费用。相比之下,OpenAI并未公开模型训练所用的数据,理由是当前AI领域存在多起与版权相关的法律诉讼,公司希望规避潜在风险。

为确保安全,OpenAI还特别就模型可能被用于生化武器或网络攻击场景进行了内部及第三方安全测试。公司表示,未发现gpt-oss模型在这些领域构成“高危能力”风险。

长期以来,OpenAI更倾向于发展闭源商业模型,通过API向企业和开发者提供服务,构建盈利路径。然而,面对中国AI公司在开源领域的快速进展,如DeepSeek、阿里Qwen与Moonshot AI的崛起,以及美国政府近期对“开源符合价值观的AI”的政策推动,OpenAI重新评估了战略方向。

OpenAI首席执行官Sam Altman表示:“回顾2015年创立之初,我们的使命就是确保AGI服务全人类。今天我们很高兴,能够为世界提供一套基于美国民主价值、自由开放的AI技术栈。”

此次发布的gpt-oss模型被认为是OpenAI在中美AI竞争格局与政策压力下的一次关键转向。外界普遍关注,Meta与DeepSeek即将发布的新一代开源模型,或将为开源AI竞赛再添变数。