当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

8个月前 (02-24)Deepseek最新资讯439

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

怎么查看 Deepseek的搜索历史记录?

怎么查看 Deepseek的搜索历史记录?

怎么查看 Deepseek 的搜索历史记录?要查看deepseek的搜索历史记录,您可以按照以下步骤操作:手机版本打开deepseek应用。点击左上角的时钟图标,进入历史记录页面。在这里,您可以查看所...

富途正式接入DeepSeek

富途正式接入DeepSeek

3月21日,富途在香港湾仔会议展览中心举办的“富途投资展”上宣布,将正式接入DeepSeek-R1,并介绍多个人工智能(“AI”)升级的产品功能,以顶尖投资工具赋能零售投资者,进一步实现普惠金融的愿景...

DeepSeek赋能潮起

DeepSeek赋能潮起

新华社北京3月21日电 3月21日,《新华每日电讯》发表题为《DeepSeek赋能潮起》的报道。2025年开年,DeepSeek彻底突破技术圈层,直抵社会大众,成为热议高频词。刚刚结束的全国两会上,人...

美国将禁用中国企业深度求索DeepSeek?中方回应

美国将禁用中国企业深度求索DeepSeek?中方回应

路透社当地时间3月7日引述知情人士称,出于所谓“国家安全”考虑,美国特朗普政府正在考虑禁止中国企业深度求索(DeepSeek)的人工智能(AI)工具在美国政府设备上使用。在3月10日举行的中国外交部例...

DeepSeek炒股,靠不靠谱?

DeepSeek炒股,靠不靠谱?

“当没有足够信息的时候,大模型会根据用户要求,自己‘脑补’信息,作出回答,并非基于真实世界的逻辑和事实。”文 / 巴九灵最近小巴在后台看到一条留言:“我今年60多岁了,想用DeepSeek来帮我炒股,...

中原消金:用DeepSeek解锁消费金融新机遇

中原消金:用DeepSeek解锁消费金融新机遇

近日,国产大模型深度求索(DeepSeek)凭借卓越的性能表现,迅速赢得了金融机构的青睐,在金融业内掀起了一股应用人工智能的新热潮。金融机构纷纷接入DeepSeek,期望在实际业务中开拓新的增长点。截...