当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

4个月前 (02-26)Deepseek最新资讯235

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

DeepSeek赋能潮起

DeepSeek赋能潮起

新华社北京3月21日电 3月21日,《新华每日电讯》发表题为《DeepSeek赋能潮起》的报道。2025年开年,DeepSeek彻底突破技术圈层,直抵社会大众,成为热议高频词。刚刚结束的全国两会上,人...

腾讯与DeepSeek合作背后:一场中国开发者开源的胜利

腾讯与DeepSeek合作背后:一场中国开发者开源的胜利

几乎在马化腾与梁文锋同框引起关注的同时,DeepSeek与腾讯悄悄进行了一次技术合作。用腾讯工程师的话来说,此次合作的成果,相当于实现了AI落地“最后一公里”的突破。近日,DeepSeek工程师在Gi...

全国首创!重庆“产业大脑”深度融合DeepSeek大模型

全国首创!重庆“产业大脑”深度融合DeepSeek大模型

在人工智能技术加速与实体经济深度融合的背景下,重庆市创新打造的“产业大脑”近日取得突破性进展。2月23日,上游新闻记者从市经济信息委获悉,“产业大脑”通过深度集成国产大模型DeepSeek,正逐渐构建...

世界读书日|请DeepSeek推荐最受关注的10本书,它的回答是……

世界读书日|请DeepSeek推荐最受关注的10本书,它的回答是……

当DeepSeek能“替你思考”时阅读还有意义吗?答案显然是:阅读依旧无可替代阅读的意义远不止于获取信息,而是一场深度的思维之旅,不同的人能够从中获得体验各异的情感共鸣和文化滋养。而AI可以帮助我们提...

钉钉宣布全面接入DeepSeek系列模型

钉钉宣布全面接入DeepSeek系列模型

  2025年2月17日,钉钉正式启动第八届开工节,宣布全面接入DeepSeek系列模型,并推出四大AI礼包,为企业提供“开箱即用”的智能化解决方案,覆盖协同办公、数据处理、应用开发及专属模型定制等领...

西宁市12345热线搭载DeepSeek大模型应用

西宁市12345热线搭载DeepSeek大模型应用

3月1日,记者从中国移动通信集团青海有限公司西宁分公司(以下简称西宁移动)获悉,西宁市12345热线平台正式搭载DeepSeek大模型应用后,通过一周测试数据分析,预计接通率和准确率将分别提升7%、1...