当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯136

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

东方国信推出新一代满血版“幕僚DeepSeek一体机”

东方国信推出新一代满血版“幕僚DeepSeek一体机”

人民财讯3月10日电,东方国信发文称,公司充分发挥自身在算力基础设施、行业大数据积累及垂直大模型领域的核心优势,重磅推出新一代满血版“幕僚DeepSeek一体机”。...

DeepSeek月访问量超ChatGPT成为全球增长最快的AI工具

DeepSeek月访问量超ChatGPT成为全球增长最快的AI工具

【DeepSeek月访问量超ChatGPT】财联社3月31日电,据AI分析平台aitools.xyz,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的Chat...

上海交通大学鲲鹏昇腾科教创新卓越中心特训营DeepSeek专场圆满举办

上海交通大学鲲鹏昇腾科教创新卓越中心特训营DeepSeek专场圆满举办

央广网北京3月28日消息 3月26日下午,上海交通大学鲲鹏昇腾科教创新卓越中心特训营-DeepSeek专场在上海交通大学闵行校区图书信息楼成功举办。活动旨在基于昇腾技术的DeepSeek本地化部署实践...

上线上线!“高新造”算力“AI”上DeepSeek!

上线上线!“高新造”算力“AI”上DeepSeek!

              DeepSeek自发布以来以高性能、低成本及开源等显著优势迅速吸引全球关注14日获悉无锡高新区智算中心...

黑龙江省进行DeepSeek大模型本地化部署

黑龙江省进行DeepSeek大模型本地化部署

原标题:我省进行DeepSeek大模型本地化部署近日,黑龙江省哈尔滨数字龙江智算中心成功部署国内领先的DeepSeek大模型,此次部署标志着黑龙江省在人工智能技术自主创新与产业应用领域迈出关键一步,为...

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

ST易联众:公司“智鼎云帆大模型平台”已接入DeepSeek,与DeepSeek已完成适配

每经AI快讯,有投资者在投资者互动平台提问:请问公司和deepseek的合作需要付费给deepseek嘛还是单纯的调用免费的资源?ST易联众(300096.SZ)3月4日在投资者互动平台表示,公司继2...