9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。
该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。
目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。
随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
每日经济新闻综合公开消息
上一篇:第四次递交招股书,京东工业再次冲击IPO 京东招股书 第二次提交招股书
下一篇:丽人丽妆实控人黄韬遭前妻起诉,要求过户名下1674.75万股给子女 丽人丽妆公司黄韬离任 丽人丽妆董事长总经理黄韬视频