当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯261

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

广东江门:举办DeepSeek大模型专题培训

广东江门:举办DeepSeek大模型专题培训

为帮助干部职工及时掌握前沿人工智能技术,提升数字化办公能力,近日,广东省江门市退役军人事务局举办DeepSeek大模型专题培训。培训会上,老师从DeepSeek简介、如何使用DeepSeek、Deep...

DeepSeek“五一礼包”来了!新开源模型数学推理能力大提升|附实测细节

DeepSeek“五一礼包”来了!新开源模型数学推理能力大提升|附实测细节

赶在五一假期前夕,DeepSeek给我们送出一份惊喜大礼。延续一贯的开源节奏,DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2,并同步上线模型卡及示例代码。此次共...

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

IT之家 3 月 10 日消息,据证券日报昨日晚间报道,格力董明珠透露:“格力电器已成功将自有的多模型框架与 DeepSeek R1 满血版大模型深度融合。”“例如,这一合作成果已经体现在格力电器的语...

加速保险服务智能化升级 国华人寿宣布接入DeepSeek

加速保险服务智能化升级 国华人寿宣布接入DeepSeek

上证报中国证券网讯(记者 何奎)记者近日获悉,国华人寿正式宣布接入国产开源大模型DeepSeek,旨在应用前沿人工智能技术,全面提升公司保险服务的智能化水平,为客户提供更优质、高效、个性化的服务体验。...

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

 职场社区平台脉脉宣布已接入DeepSeek-R1模型,旨在进一步优化人岗匹配,提升招聘效率。据悉,今年2月初,脉脉便已经接入DeepSeek-R1模型,并安排了测试部署工作。据悉,目前脉脉已拥有1....

床垫界也有“DEEPSEEK”?慕思床垫AI升级引发全球科技圈关注

床垫界也有“DEEPSEEK”?慕思床垫AI升级引发全球科技圈关注

在DEEPSEEK爆火,各式各样的AI技术被嵌入生活中各种场景的当下,一场关于“睡眠”的智能化革命悄然升温。近日,在全球消费电子领域的“风向标”CES 2025展会上,慕思床垫凭借最新发布的...