当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-24)Deepseek最新资讯125

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型

近日,中信消金基于自主研发的“信智”一站式大模型服务平台接入DeepSeek大模型,并率先应用于智能质检与知识库检索两大业务场景,成为首批接入前沿领先AI大模型的消费金融公司。  在智能质检方面,借助...

西工大满血版DeepSeek,上线了!

西工大满血版DeepSeek,上线了!

智慧校园再添利器我校AI服务平台—“翱翔挚友”搭载满血版DeepSeek正式上线啦!01 平台有哪些模型?本地化部署DeepSeek R1资源专享、隐私保护公有云接入DeepSeek R1数据共享、智...

最新!DeepSeek在肇庆部署上线

最新!DeepSeek在肇庆部署上线

近日,从肇庆市政务服务和数据管理局获悉,国产大模型DeepSeek-R1正式在肇庆市政务云部署上线将全面支持肇庆市全域数字化转型工作目标,标志着肇庆市在人工智能产业发展中迈出了坚实的一步。近年来,肇庆...

通达海已经接入DeepSeek-R1并持续进行模型优化

通达海已经接入DeepSeek-R1并持续进行模型优化

每经AI快讯,有投资者在投资者互动平台提问:董秘你好:2025年2月11日投资者关系活动记录表中说:公司已经接入DeepSeek大模型进行相关产品测试和适配,也取得一定效果。到目前是否已经成功接入了。...

北京大学联合华为发布全栈开源DeepSeek推理方案

北京大学联合华为发布全栈开源DeepSeek推理方案

据北京大学网站消息,近日,北京大学联合华为发布DeepSeek全栈开源推理方案。该方案基于北京大学自主研发的SCOW算力平台系统与鹤思调度系统,整合了DeepSeek、openEuler、MindSp...

联想智能云全面拥抱DeepSeek,开启AI模型服务新纪元

联想智能云全面拥抱DeepSeek,开启AI模型服务新纪元

近日,联想集团宣布其智能云(xCloud)解决方案已全面集成DeepSeek R1及其蒸馏系列大模型,为企业智能化转型注入了新动能。联想智能云(xCloud)解决方案通过深度集成DeepSeek大模型...