硅基流动 09月11日
OpenAI开源大模型gpt-oss,专为智能Agent工作流设计
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI首次开源其大模型gpt-oss系列,包含gpt-oss-120B和gpt-oss-20B两款轻量级MoE模型,专为智能Agent工作流设计。这两款模型具备强大的指令执行、工具调用、少样本函数调用、结构化输出及完整思维链(CoT)能力,支持根据任务灵活调整逻辑推理强度,实现性能、成本与延迟的最佳平衡。在多项评测中,gpt-oss-120B表现与OpenAI o4-mini持平甚至超越,gpt-oss-20B也达到或优于o3-mini水平。硅基流动国际站已上线这两款模型,并提供在线体验和开发者API文档。

🔧 gpt-oss系列模型由OpenAI开源,包含gpt-oss-120B和gpt-oss-20B两款轻量级MoE模型,专为智能Agent工作流设计。

🧠 这两款模型具备强大的指令执行、工具调用、少样本函数调用、结构化输出及完整思维链(CoT)能力,支持根据任务灵活调整逻辑推理强度。

💡 在多项评测中,gpt-oss-120B表现与OpenAI o4-mini持平甚至超越,gpt-oss-20B也达到或优于o3-mini水平,展现出卓越的性能。

💰 硅基流动国际站已上线gpt-oss系列模型,并提供在线体验和开发者API文档,价格为输入0.04-0.09美元/M Tokens,输出0.18-0.45美元/M Tokens。

🌐 硅基流动国际站致力于为全球开发者提供极速响应、价格亲民、品类齐全、稳定丝滑的大模型API,除了gpt-oss,还上架了FLUX.1 Kontext [dev]、GLM-4.5V等多种模型。

原创 SiliconFlow 2025-08-19 11:04 北京

OpenAI 首次对外开源的大模型,专为智能 Agent 工作流设计。

硅基流动国际站已上线由 OpenAI 开源的两款轻量级 MoE 模型 gpt-oss-120B(117B 参数,5.1B 激活参数)和 gpt-oss-20B(21B 参数,3.6B 激活参数)。

这是 OpenAI 首次对外开源的大模型。两款模型专为智能 Agent 工作流设计,均具备强大的指令执行、工具调用、少样本函数调用、结构化输出及完整思维链(CoT)能力,支持根据任务灵活调整逻辑推理强度,实现性能、成本与延迟的最佳平衡。在多项评测中,gpt-oss-120B 表现与 OpenAI o4-mini 持平甚至超越,即使规模更小 gpt-oss-20B 仍达到或优于 o3-mini 水平。

国际站上的 gpt-oss 支持 131K 最大上下文长度。其中,gpt-oss-120B 的价格为输入 0.09 元 / M Tokens,输出为 0.45 元 / M Tokens;gpt-oss-20B 的价格为输入 0.04 美元 / M Tokens,输出为 0.18 美元 / M Tokens。

欢迎通过以下方式使用 gpt-oss,国际站新用户可自动获取 1 美元赠金体验。

在线体验

https://cloud.siliconflow.com/models

开发者 API 文档

https://docs.siliconflow.com/en/api-reference/completion/create-completion

模型特点及性能

gpt-oss 模型采用 OpenAI 最先进的预训练与后训练优化技术,借鉴了包括 o3 等模型的前沿方法,特别强调逻辑推理能力、效率以及在多样化部署环境中的实际可用性。

两款模型均为 Transformer 架构,采用 MoE 以减少处理输入所需的活跃参数量。这些模型交替使用密集注意力与局部带状稀疏注意力模式,类似于 GPT‑3。为提升推理与内存效率,模型还使用分组多查询注意力机制(组大小为 8),并采用旋转位置编码(RoPE)进行位置表征,原生支持长达 128K 的上下文长度。

这些模型采用了与 o4-mini 相似的后训练流程,包括监督微调阶段和高计算量的强化学习阶段。通过采用与专有推理模型相同的技术,这些模型在后训练后展现出卓越性能。

OpenAI 团队对 gpt-oss-120B 和 gpt-oss-20B 进行了系统评测,重点考察它们在编程、竞赛数学、医疗及智能体工具调用等关键任务上的表现,并将其与主流 OpenAI 推理模型(包括 o3、o3‑mini 和 o4-mini)做了深入比较。

结果显示,gpt-oss-120B 在竞赛编程(Codeforces)、通用问题解决(MMLU 和 HLE)以及工具调用(TauBench)等多项任务中均优于 OpenAI o3‑mini,在多个维度上实现了与 OpenAI o4-mini 持平甚至更优。特别是在健康查询(HealthBench)与竞赛数学(AIME 2024 和 2025)方面其表现甚至超过了 o4-mini。尽管 gpt-oss-20B 规模较小,但在同样的测试中也实现了与 o3‑mini 持平甚至更优的成绩,尤其在竞赛数学和医疗应用方面表现不俗。

硅基流动国际站

全球开发者的“Token 工厂”

作为一站式大模型云服务平台,硅基流动国际站依然致力于为全球开发者提供极速响应、价格亲民、品类齐全、稳定丝滑的大模型 API。

除了 gpt-oss,国际站已上架包括 FLUX.1 Kontext [dev]、GLM-4.5V、Step3、Qwen3-Coder、Qwen3-30B-A3B、GLM-4.5、Qwen3-235B-A22B、Kimi K2 Instruct、Qwen3-Embedding & Reranker、DeepSeek-R1-0528、Wan2.2 等在内的数十款模型。

开发者可在平台自由组合各类大模型,只需在开发应用时轻松调用易用、高效的 API,为你的生成式 AI 应用选择最佳实践。

近期更新

语音合成模型MOSS-TTSD上线

SiliconCloud上线阿里Wan2.2

SiliconCloud上线智谱GLM-4.5V

SiliconCloud上线阿里Qwen3-Coder

Kimi K2 API升级:Pro版TPM升至100万

硅基流动上线DeepSeek-R1 & V3企业服务

提效300%,大模型一体机加速药企报告撰写

扫码加入用户交流群

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

gpt-oss OpenAI 大模型 智能Agent 硅基流动
相关文章