当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek与国产芯片的“双向奔赴”

1个月前 (10-01)Deepseek最新资讯152

  9月29日晚间,深度求索公司发布了DeepSeek-V3.2-Exp模型deepseek,其宛如再次向国产芯片江湖投入一枚巨石。

  官方公告显示,新版本模型实验性地引入了DeepSeek Sparse Attention(一种稀疏注意力机制),其显著降低计算资源消耗并提升推理效率。

  而得益于这一技术创新,深度求索宣布其官方App、网页端、小程序均已同步更新为新模型,并全面下调API价格,降幅在50%到75%不等。

  值得注意的是,不同于上次发布DeepSeek-V3.1版本时“犹抱琵琶半遮面”的状态,此次V3.2 EXP版本的发布,几乎零时差引发数个国产芯片厂商——华为、寒武纪、海光等的“认领”。

  就在DeepSeek新版放出之后仅仅4分钟,寒武纪就对新模型适配的国产芯片进行“率先认领”。

  该公司宣布,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。

  紧随其后的则是华为昇腾,其表示,基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp的0day支持,并向开发者开源所有推理代码和算子实现。

  海光信息随后也表示,其DCU已实现对DeepSeek-V3.2-Exp的无缝适配+深度调优,新模型在海光DCU上展现出优异性能,同时验证了海光DCU高通用性、高生态兼容度及自主可控的技术优势。

  业内人士认为,随着DeepSeek新版本模型的逐步释出,或将有越来越多国产厂商宣布推出对DeepSeek模型的适配。

  “DeepSeek几乎已经获得了国产推理模型的大部分份额,成为了国产开源模型的标杆。因此由深度求索公司来定义国产芯片,或者组建国产芯片生态,其实是更为合适的做法。”国内某计算机企业算力部门高管告诉21世纪经济报道记者。

  过去二十年,英伟达建立的CUDA平台,通过构建的一系列深度绑定的软硬件与工具链,还有高资本投入带来的成本壁垒,建立起一个覆盖所有计算场景的庞大技术体系和应用帝国。

  然而,若撇开国内暂时存在短板的晶圆制造环节,“Fabless模式”为主的国产芯片行业,本质其实是一个“Know-How(懂得即能产出)”的行业。这也意味着,只要业界形成共识,那么芯片与算力生态围绕一定标准去发展,其进度将会异常快捷。

  许多专家认为,2025年之所以能见到国产芯片发展如此迅速,无疑归功于DeepSeek的横空出世。

  “我认为顺序应该是:DeepSeek先去定义国产芯片的标准,让国产芯片厂商去跟进,让DeepSeek去定义行业,而非DeepSeek的模型去适配国产芯片”,前述高管向记者解释DeepSeek-V3.1发布的意义。

  8月下旬,深度求索公司发布DeepSeek-V3.1版本。该更新版本除了让模型合并逻辑推理与快计算,更明确DeepSeek模型将适配下一个版本的“UE8M0”浮点格式的国产芯片,为国产芯片的发展指明方向。

  根据深度求索公司的官方发布,此次V3.2-Exp版本,在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

  值得注意的是,虽然稀疏注意力是行业通用的加速训练推理效率优化手段,但新版DeepSeek所采用的机制,疑似为深度求索公司刚刚在今年2月份才发表的论文中提到的原创机制。

  无独有偶,深度求索在官方发布中还提到,其模型在兼容CUDA的基础上,使用了高级语言“TileLang”进行快速原型开发,以及令TileLang作为精度基线,逐步使用底层语言实现更高效的版本等。

  而据公开资料,TileLang是一种专为AI算子开发设计的编程语言,由北京大学计算机学院杨智团队主导开发,TileAI社区发起人王磊博士团队于2025年1月开源。

  另一方面,在应用端,国产AI软硬件生态的协同效应正在扩大。在云计算领域,腾讯、阿里巴巴等互联网大厂也积极适配国产芯片。如9月16日,腾讯云宣布已全面适配主流国产芯片,并积极参与开源社区建设;而阿里在云栖大会则表示推动“一云多芯”战略,验证并深度适配多家国产AI芯片,将其纳入自身算力底座。

  这意味着,相比英伟达用二十年建立生态,DeepSeek几乎用了不到一年的时间,飞速完成了初步的生态追赶。原文出处:DeepSeek与国产芯片的“双向奔赴”,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek与国产芯片的“双向奔赴”” 的相关文章

DeepSeek预测:法兰克福vs拜仁慕尼黑!凯恩10球屠杀or尤尊5球逆袭?

DeepSeek预测:法兰克福vs拜仁慕尼黑!凯恩10球屠杀or尤尊5球逆袭?

  德甲第6轮焦点战即将打响!拜仁慕尼黑带着赛季全胜战绩(5场22球)客场挑战近期状态飘忽的法兰克福(2胜3负)。凯恩以10球领跑射手榜,而法兰克福的土耳其中场尤尊以5球3助攻成为最大惊喜...

Deepseek推荐全国旅游百强区第38名:江苏常州市武进区

Deepseek推荐全国旅游百强区第38名:江苏常州市武进区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

扇贝单词2026届考研用户学习行为报告

扇贝单词2026届考研用户学习行为报告

  (专利号: ZL 2024 1 1008490.X),能够根据词汇量测试结果deepseek,智能识别和过滤已经掌握的单词,真正把时间花在刀刃上。原文出处:扇贝单词2026届考研用户学...

DeepSeek预测:都灵vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

DeepSeek预测:都灵vs那不勒斯!德布劳内领衔火力全开,那不勒斯客场碾压?

  都灵目前排名联赛第16位,仅领先降级区2分,6轮过后1胜2平3负,进5球丢13球,场均进球0.83个(联赛第15),场均丢球高达2.17个(联赛第20)。反观那不勒斯,以5胜1负积15...

山东博兴:DeepSeek赋能项目周期管理,引领工程建设高质发展

山东博兴:DeepSeek赋能项目周期管理,引领工程建设高质发展

  山东省博兴县行政审批服务局通过将数字化管理平台成功接入DeepSeek大模型,借助其强大的数据分析和自然语言处理能力,为平台增势赋能deepseek,实现了从项目立项到运维的全流程智能...

斯基拉:切尔西签下哈维-西蒙斯,双方签约7+1年

斯基拉:切尔西签下哈维-西蒙斯,双方签约7+1年

  北京时间7月31日,记者斯基拉报道,切尔西签下荷兰中场哈维-西蒙斯。斯基拉表示这是独家消息:交易已经达成,莱比锡中场哈维-西蒙斯加盟切尔西,双方签约至2032年,附带一年续约选项。哈维...