当前位置:首页 > Deepseek最新资讯 > 正文内容

国产算力火速适配DeepSeek新版本

7个月前 (09-30)Deepseek最新资讯313

  9月29日,国内AI企业深度求索(DeepSeek)正式推出实验性(Experimental)模型DeepSeek-V3.2-Exp,在V3.1-Terminus的基础上首次引入自研稀疏注意力机制(DSA),在保持模型性能的同时大幅降低长文本处理成本。

  与此同时,华为云、寒武纪(688256.SH)、海光信息(688041.SH)等国产算力厂商第一时间宣布完成适配,凸显国产AI软硬件生态协同加速趋势。

  DeepSeek-V3.2-Exp作为V3系列的实验性版本,核心突破在于采用稀疏注意力架构(DSA)。

  DSA是一种针对Transformer架构的优化技术。在大语言模型的技术机制中,注意力机制是一个核心组件,决定了模型如何在文本序列中聚焦关键信息,实现语义理解与生成。

  因为实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,可以实现长文本训练和推理效率的大幅提升。

  同时,为方便用户进行对比测试,DeepSeek为此前发布的V3.1-Terminus临时保留额外的API访问接口,将开放至10月15日deepseek,调用价格与V3.2-Exp一致;为支持社区研究,DeepSeek还开源新模型研究中设计和实现的GPU算子,包括TileLang和CUDA两种版本。团队建议社区在进行研究性实验时,优先使用基于TileLang的版本,以便于调试和快速迭代。

  华为昇腾快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。

  华为云第一时间完成对DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。目前该模型已正式上架华为云大模型即服务平台MaaS,为企业及开发者提供模型体验和API服务。

  华为云方面称,ModelArts推理平台基于CloudMatrix384超节点,为DeepSeek-V3.2-Exp模型提供稳定、可靠的推理服务。ModelArts推理平台能够根据实际负载需求,按需供给和分配模型推理算力资源,实现资源分时复用与灵活扩缩容。

  针对DeepSeek-V3.2-Exp模型,此次沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

  寒武纪(688256.SH)亦同步适配DeepSeek-V3.2-Exp,并开源vLLM-MLU推理引擎源代码,依托自研BangC融合算子与Triton框架达成“计算与通信并行”的极致性能优化。

  海光信息(688041.SH)同日宣布其DCU实现无缝适配+深度调优,做到大模型算力“零等待”部署。海光信息表示,基于GPGPU架构强大的生态优势,与编程开发软件栈DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

  这一协同效率背后是国产算力生态的成熟。华为昇腾、寒武纪等企业近期持续优化软硬件协同设计,而互联网厂商如腾讯云、阿里云亦积极拥抱国产芯片适配。原文出处:国产算力火速适配DeepSeek新版本,感谢原作者,侵权必删!

标签: deepseek

“国产算力火速适配DeepSeek新版本” 的相关文章

12月13日DeepSeek预测骑士vs奇才:米切尔率队延续碾压,奇才难逃连败

12月13日DeepSeek预测骑士vs奇才:米切尔率队延续碾压,奇才难逃连败

  华盛顿奇才(3胜19负,东部第15)将在主场迎来克利夫兰骑士(14胜11负,东部第7)的挑战。作为联盟知名老牌球队,奇才本赛季场均失分高达128.3分联盟垫底,而骑士则保持着56%的胜...

英伟达「抛弃」游戏玩家,黄仁勋却夸 DeepSeek「让全世界大吃一惊」

英伟达「抛弃」游戏玩家,黄仁勋却夸 DeepSeek「让全世界大吃一惊」

  准确地说,5 年来首次在 CES 大会不发消费级显卡。没有 RTX 6090,没有游戏性能提升,没有光追演示。   他发布了下一代 AI 超算,发布了会「思考」的自动...

12月6日DeepSeek预测:掘金vs老鹰,约基奇率队延续碾压,穆雷或再爆发

12月6日DeepSeek预测:掘金vs老鹰,约基奇率队延续碾压,穆雷或再爆发

  西部豪强掘金将客场挑战东部中游球队老鹰,这场看似实力悬殊的对决却因伤病因素埋下变数。目前掘金以15胜6负高居西部第五,而老鹰13胜10负暂列东部第九。对于志在冲击季后赛的老鹰而言,此役...

DeepSeek预测:切尔西VS富勒姆!蓝军火力全开,内托领衔冲击三连胜!

DeepSeek预测:切尔西VS富勒姆!蓝军火力全开,内托领衔冲击三连胜!

  英超第3轮焦点战即将在斯坦福桥打响!切尔西目前以4分排名第4,而富勒姆2轮平局积2分位列第13。蓝军上轮5-1血洗西汉姆联展现恐怖火力(场均进球2.5),而富勒姆两场1-1暴露锋无力(...

DeepSeek预测:AC米兰VS博洛尼亚!红黑军团主场碾压?莱奥伤缺成X因素

DeepSeek预测:AC米兰VS博洛尼亚!红黑军团主场碾压?莱奥伤缺成X因素

  意甲第3轮焦点战,AC米兰将在圣西罗迎战博洛尼亚。目前米兰1胜1负积3分排名第8,而博洛尼亚同样1胜1负积3分排名第10。两队都急需一场胜利来冲击欧战区。   近5次...

11月9日DeepSeek预测:独行侠vs奇才,戴维斯缺阵恐难阻奇才触底反弹

11月9日DeepSeek预测:独行侠vs奇才,戴维斯缺阵恐难阻奇才触底反弹

  北京时间11月9日早8点,NBA常规赛将迎来一场西部垫底与东部垫底的对话——达拉斯独行侠(2胜7负)客场挑战华盛顿奇才(1胜8负)。两支球队本赛季均陷入泥沼,但历史交锋中独行侠近5战4...