当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新版本模型:优化推理效率,API降价超50%

1个月前 (09-30)Deepseek最新资讯143

  值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

  据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

  据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

  在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

  DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

  除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前deepseek,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

  此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

  《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

  DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。原文出处:DeepSeek发布新版本模型:优化推理效率,API降价超50%,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新版本模型:优化推理效率,API降价超50%” 的相关文章

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

  据了解,2025年伊始,来自中国的AI大模型DeepSeek凭借其突破性进展迅速走红,各行各业都在积极拥抱DeepSeek。   1月27日,Deepseek应用登顶...

西工大学子抗战精神研学,沪杭宁探寻低空经济新生态

西工大学子抗战精神研学,沪杭宁探寻低空经济新生态

  2025年7月1日,实践队在上海中国共产党第一次全国代表大会纪念馆举行实践出征仪式。师生重温建党初心,在党旗前庄严合影,由此开启上海3天、杭州2天、南京1天的抗战精神探访与低空经济调研...

DeepSeek预测:里尔VS巴黎圣日耳曼!姆巴佩领衔大巴黎能否延续连胜?

DeepSeek预测:里尔VS巴黎圣日耳曼!姆巴佩领衔大巴黎能否延续连胜?

  法甲第7轮将迎来一场焦点战,里尔将在主场迎战领头羊巴黎圣日耳曼。目前巴黎圣日耳曼以5胜0平1负积15分排名榜首,而里尔则以3胜1平2负积10分排名第6。这场比赛对于双方来说都至关重要,...

DeepSeek预测:西汉姆联vs热刺!铁锤帮主场恐遭血洗,约翰逊+库杜斯双星闪

DeepSeek预测:西汉姆联vs热刺!铁锤帮主场恐遭血洗,约翰逊+库杜斯双星闪

  英超第4轮即将迎来一场伦敦德比,西汉姆联将在主场迎战热刺。目前,西汉姆联排名第16,积3分,而热刺排名第4,积6分。这场比赛对于双方来说都至关重要,尤其是西汉姆联,他们需要在主场止住颓...

太初元碁参与超节点智算应用“北京方案”,全国产技术加速“人工智能+”落地

太初元碁参与超节点智算应用“北京方案”,全国产技术加速“人工智能+”落地

  9月26日,2025人工智能计算大会(AICC 2025)在京举办,中国移动、浪潮信息、北京盛科、智源、壁仞、沐曦、昆仑芯、智谱、摩尔线程、面壁智能、太初元碁等30多家企业在北京市科委...

10月23日DeepSeek预测:篮网vs黄蜂,布里奇斯率队捍卫主场

10月23日DeepSeek预测:篮网vs黄蜂,布里奇斯率队捍卫主场

  北京时间10月23日07:00,NBA常规赛将迎来东部内战,夏洛特黄蜂坐镇光谱中心迎战布鲁克林篮网。作为东部传统劲旅,黄蜂在拉梅洛-鲍尔和迈尔斯-布里奇斯带领下期待新赛季首胜,而篮网则...