当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

8个月前 (02-25)Deepseek最新资讯411

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek大模型席卷金融业,银行、券商、基金、保险竞相接入

DeepSeek大模型席卷金融业,银行、券商、基金、保险竞相接入

近期,DeepSeek大模型在金融业掀起一股热潮,多家金融机构纷纷宣布接入或部署该模型。据不完全统计,目前已有16家券商、10余家公募基金公司以及多家银行和保险机构宣布接入或部署DeepSeek大模型...

Deepseek是什么?能干什么用?为什么突然这么火?

Deepseek是什么?能干什么用?为什么突然这么火?

1.DeepSeek能帮我们查资料、写文章、做计划,陪聊天,解决我们的各种疑问。 学生题目不会,用它搜答案,它还能提供解题思路。 学习路径不会规划,它直接帮你设计学习路线,推荐书籍,视频,和老师。...

每日互动:已接入DeepSeek相关版本,用于业务垂直场景及研发提效

每日互动:已接入DeepSeek相关版本,用于业务垂直场景及研发提效

金融界3月17日消息,有投资者在互动平台向每日互动提问:请问公司有没有考虑向deepseek一体机方向发展。公司回答表示:公司在2024年上半年就接入DeepSeek相关版本,目前主要用于业务垂直场景...

政务服务“牵手”DeepSeek,AI数字人提升政务服务智能化水平

政务服务“牵手”DeepSeek,AI数字人提升政务服务智能化水平

当前,科技革命和产业变革深入发展,deepseek等人工智能大模型迅速在各行业各领域应用,知识迭代更新速度加快。借助deepseek赋能潮起,青浦区数据局积极抢搭人工智能时代顺风车,加强专业知识储备,...

《DeepSeek实战指南:从数据到财富》出版发行

《DeepSeek实战指南:从数据到财富》出版发行

近日,新华出版社推出人工智能领域新作《DeepSeek实战指南:从数据到财富》,该书深度解析中国大语言模型领域的“破局者”DeepSeek,指导读者在数据洪流中捕捉财富机遇,现已面向全国发行。该书深入...

开箱即用AI力!华为云MaaS解锁DeepSeek-R1-0528超能推理

开箱即用AI力!华为云MaaS解锁DeepSeek-R1-0528超能推理

小更新,大智慧,新版DeepSeek-R1-0528模型正式开源,该模型在数学推理、代码生成等关键能力上实现显著突破,已成为开源领域高性能推理模型的新标杆。目前华为云已针对该模型完成了基于昇腾AI云服...