当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

1年前 (2025-02-25)Deepseek最新资讯576

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek接入上海医院发生了什么?建立知识库还将升级人文服务

DeepSeek接入上海医院发生了什么?建立知识库还将升级人文服务

大热的DeepSeek人工智能大模型,接入医院将会迸发出怎样的创新火花?记者了解到,迄今全国有近10家医疗机构已接入大模型,在上海,复旦大学附属中山医院、上海第四人民医院、和睦家医疗等已于近日接入De...

法律服务平台+DeepSeek!AI引领法律服务全面升级——大安市司法局打造智慧司法新标杆

法律服务平台+DeepSeek!AI引领法律服务全面升级——大安市司法局打造智慧司法新标杆

为满足群众日益增长的法治服务需求,大安市司法局率先引入DeepSeek人工智能技术,全面革新公共法律服务、普法宣传、人民调解等核心业务,推出公共法律服务掌上平台覆盖线上、公共法律服务智能终端覆盖线下,...

吴通控股新增“DeepSeek概念”

吴通控股新增“DeepSeek概念”

025年4月29日,吴通控股(300292)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:根据2025年4月28日互动易:子公司国都互联5G消息平台——5G 101平台已接入DeepSe...

“效率神器”已接入!赣州市国投集团“争先”让DeepSeek赋能发展

“效率神器”已接入!赣州市国投集团“争先”让DeepSeek赋能发展

  大江网/大江新闻客户端讯 (通讯员 陈肖屹、张声宁、魏玲娇)DeepSeek凭借其先进的模型设计、训练算法和开源生态,引发全球人工智能领域关注,并快速进入人们的日常生活,在各行各业中发挥...

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

原创 赵晋杰 字母榜短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧...

卓创资讯:完成DeepSeek系列大模型的本地化部署

卓创资讯:完成DeepSeek系列大模型的本地化部署

每经快讯,卓创资讯官微2月18日消息,近日,卓创资讯完成DeepSeek系列大模型的本地化部署,成功实现从技术引入到落地应用。卓创资讯通过DeepSeek系列大模型与公司已应用大模型的深度融合,形成协...