韭研公社 09月30日

DeepSeek-V3.2-Exp模型发布，API价格下调

Deepseek官方发布DeepSeek-V3.2-Exp模型，引入稀疏注意力机制优化长文本处理，API价格下调50%以上。

事件催化，9月29日Deepseek官方正式发布DeepSeek-V3.2-Exp模型，作为迈向新一代架构的中间步骤，V3.2-Exp在上一代的基础上引入了DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。得益于新模型服务成本的大幅降低，DS官方API价格也相应下调，开发者调用DeepSeek API的成本将降低50%以上。 #寒武纪与昇腾均快速实现Day0适配。寒武纪实现对DS新模型的适配，并开源大模型推理引擎vLL

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek 模型发布 API价格下调稀疏注意力机制长文本处理

相关文章

Gradient AI Introduces Llama-3 8B Gradient Instruct 1048k: Setting New Standards in Long-Context AI

知情人士：商汤大模型开“卷”长文本，支持100万字处理

OpenAI 封禁大陆开发者? 别慌，正好试试国产大模型

GraphReader: A Graph-based AI Agent System Designed to Handle Long Texts by Structuring them into a Graph and Employing an Agent to Explore this Graph Autonomously

MInference (Milliontokens Inference): A Training-Free Efficient Method for the Pre-Filling Stage of Long-Context LLMs Based on Dynamic Sparse Attention

InternLM2.5-7B-Chat: Open Sourcing Large Language Models with Unmatched Reasoning, Long-Context Handling, and Enhanced Tool Use

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

对话幻方梁文峰：AI界的拼多多——揭秘DeepSeek！

NeedleBench: A Customizable Dataset Framework that Includes Tasks for Evaluating the Bilingual Long-Context Capabilities of LLMs Across Multiple Length Intervals

DeepSeek-V2-0628 Released: An Improved Open-Source Version of DeepSeek-V2