DeepSeek-R1模型发布：开源、API上线、性能对标OpenAI

DeepSeek 09月25日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

DeepSeek-R1模型今日正式发布并开源，遵循MIT License，允许用户通过蒸馏技术训练其他模型。该模型上线API，提供思维链输出，性能在数学、代码、自然语言推理等任务上可与OpenAI o1正式版比肩。同时，DeepSeek-R1还蒸馏出多个小模型，其中32B和70B模型在多项能力上对标OpenAI o1-mini。此次更新还统一了模型License为MIT，并明确允许模型蒸馏。用户可通过官网、App或API调用DeepSeek-R1。

✨ **模型全面开源与API上线**：DeepSeek-R1模型今日正式发布，模型权重遵循MIT License完全开源，不限制商用，并支持通过蒸馏技术训练其他模型。同时，模型已上线API，用户可直接调用，体验思维链输出能力。

🚀 **性能对标顶尖水平**：通过在后训练阶段大规模使用强化学习技术，DeepSeek-R1在数学、代码、自然语言推理等任务上的性能已能与OpenAI o1正式版相媲美，展现了强大的推理能力。

💡 **蒸馏小模型赋能社区**：除了660B的大模型，DeepSeek-R1还通过蒸馏技术生成了6个更小的模型，其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果，为社区提供了更多选择。

⚖️ **标准化License与用户协议**：为简化开发者使用，所有开源模型权重统一采用MIT License。用户协议也已更新，明确支持并允许用户利用模型输出进行模型蒸馏，进一步促进技术共享。

💰 **API定价与使用指南**：DeepSeek-R1 API服务定价为每百万输入 tokens 1元（缓存命中）/ 4元（缓存未命中），每百万输出 tokens 16元。详细的API调用指南已在官方文档中提供。

深度求索 2025-01-20 20:10 北京

更新遵循 MIT License 开放API，训练技术同步公开

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。

对用户开放思维链输出

性能对齐OpenAI-o1正式版DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

在此，我们将 DeepSeek-R1 训练技术全部公开，以期促进技术社区的充分交流与创新协作。

论文链接：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸馏小模型超越 OpenAI o1-mini我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

HuggingFace链接：https://huggingface.co/deepseek-ai

开放的许可证和用户协议为了推动和鼓励开源社区以及行业生态的发展，在发布并开源 R1 的同时，我们同步在协议授权层面也进行了如下调整：

模型开源 License 统一使用 MIT

产品协议明确可“模型蒸馏”

App与网页端登录DeepSeek官网或官方App，打开“深度思考”模式，即可调用最新版 DeepSeek-R1 完成各类推理任务。

API 及定价DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元（缓存命中）/ 4 元（缓存未命中），每百万输出 tokens 16 元。

详细的 API 调用指南请参考官方文档：

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model