当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-25)Deepseek最新资讯262

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

OPPO发布首台“直播手机”,深度整合DeepSeek

OPPO发布首台“直播手机”,深度整合DeepSeek

5月15日,OPPO在广东珠海正式推出备受瞩目的Reno14系列手机,搭载更AI的ColorOS 15,深度整合DeepSeek大模型,支持全新小布记忆和升级的AI灵感成片。此次OPPO Reno14...

全市首个!大兴人才服务平台用上DeepSeek大模型

全市首个!大兴人才服务平台用上DeepSeek大模型

4月14日,记者从北京电信获悉,公司在大兴区上线了全市首个基于DeepSeek大模型的人工智能人才服务AI助手,开创“AI+政务”服务新模式。只需输入关键词,用户就能与AI助手展开对话,找政策、办手续...

DeepSeek提示词编写技巧(高质量典藏版)

DeepSeek提示词编写技巧(高质量典藏版)

“为什么别人用DeepSeek 2分钟搞定周报,你却折腾半小时?为什么别人用DeepSeek分分钟生成精美图表,你还在手动调格式?为什么DeepSeek在别人手里是‘外挂’,到你这就成‘人工智障’?”...

中新天津生态城“城市大脑”全面接入DeepSeek

中新天津生态城“城市大脑”全面接入DeepSeek

人民网天津3月27日电 (记者孙翼飞)近日,中新天津生态城(下简称“生态城”)“城市大脑”完成DeepSeek(深度求索)大模型的私有化部署,实现与城市大脑的初步集成,标志着城市大脑智慧服务能力正式迈...

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

只有小米手机、苹果国行还没宣布外接大模型计划。蛇年春节以来,一场名为DeepSeek的大模型“飓风”开始席卷科技界,手机公司堪称其中反映最迅速的行业之一。 2月10日,中兴通讯终端事业部总裁...

当虹科技“DeepSeek+BlackEye”大模型一体机首发

当虹科技“DeepSeek+BlackEye”大模型一体机首发

当虹科技2月21日发布全新一代“DeepSeek+BlackEye”多模态大模型一体机,为传媒行业发展再次注入新活力。当虹科技副总裁、传媒事业部总经理叶建华表示,DeepSeek+BlackEye多模...