当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯188

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

北京市监局通过百度智能云千帆接入DeepSeek

北京市监局通过百度智能云千帆接入DeepSeek

3月5日,据百度智能云消息,北京市市场监管局企业登记注册场景近日通过百度智能云千帆大模型平台接入DeepSeek大模型,实现企业登记注册业务24小时在线“智能咨询”服务。...

合肥数据集群建设已接入DeepSeek

合肥数据集群建设已接入DeepSeek

2月14日,据合肥市大数据资产运营有限公司消息,市大数据公司开展“巢湖明月”合肥新一代算力集群针对DeepSeek模型的适配调优工作,完成了DeepSeek全系列在全国产算力底座上的适配。“巢湖明月”...

Deepseek成赶作业“神器”?老师们有话说→

Deepseek成赶作业“神器”?老师们有话说→

寒假接近尾声不少中小学生正抓紧时间“赶作业”与往年不同的是曾经忙碌代写寒假作业的“枪手”们因为DeepSeek等AI的横空出世而开始感受到“失业”的压力许多孩子不再埋头“啃”作业而是熟练地给DeepS...

DeepSeek怎么提问才能让它回答的更全?

DeepSeek怎么提问才能让它回答的更全?

万能句式:是什么+为什么+怎么做+提要求(如果问题太多,可以拆分成多个小问题提问,打开“深度思考”提问问题会有逻辑连贯) 据说AI是未来发展的趋势,那我肯定得好好学一下DeepSeek。作为刚上...

阿木尔林业局举办DeepSeek交流培训会

阿木尔林业局举办DeepSeek交流培训会

近日,阿木尔林业局举办DeepSeek交流培训会,进一步探索人工智能技术赋能林业局高质量发展的新路径,全面提升干部职工人工智能应用水平,全局60余名相关工作人员参加培训。此次培训由3名业务骨干分别就如...

百度的后DeepSeek时代,一切为了应用

百度的后DeepSeek时代,一切为了应用

“模型有很多,但统治这个世界的是应用”,百度创始人李彦宏更直白地表达了对应用的重视。近日召开的Create2025百度AI开发者大会上,百度一口气发布了从模型到应用、生态的“九件套”,包括性能提升价格...