当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-24)Deepseek最新资讯180

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

证监会主席谈DeepSeek:带动中国资产价值重估

证监会主席谈DeepSeek:带动中国资产价值重估

3月6日下午,十四届全国人大三次会议举行经济主题记者会。今年以来,以DeepSeek为代表的科技企业受到市场广泛关注,不少国际投资机构认为DeepSeek热将推动对中国科技企业价值重估。会上,中国证券...

AI成年报高频词,DeepSeek赋能中小金融机构智能化潮起

AI成年报高频词,DeepSeek赋能中小金融机构智能化潮起

近日,多家A股上市金融机构发布2024年度报告。《华夏时报》记者注意到,AI(人工智能)成年报高频词。多家大型金融机构在年报或业绩发布会上披露了大模型的应用进展,并表示将继续积极探索AI在金融领域的数...

DeepSeek谈艺 | 笔底山河:论梁益君风景油画的精神建构

DeepSeek谈艺 | 笔底山河:论梁益君风景油画的精神建构

新春以来,DeepSeek成为各个行业所聚焦的热点话题。这个融合了人工智能与大数据分析的前沿平台,正逐步揭开其神秘面纱,展现出对各行各业颠覆性的潜力。随着DeepSeek技术的不断成熟与普及,我们正站...

电信运营商接入DeepSeek影响几何?

电信运营商接入DeepSeek影响几何?

中新网北京2月28日电 (记者 刘育英)中国三家电信运营商已全面接入DeepSeek,给运营商充分利用自身算力,加快赋能千行百业数智化转型,改善自身业绩带来机遇。至2月初,中国电信旗下天翼云“息壤”已...

百度首页上线DeepSeek入口链接-AI搜索DeepSeek满血版”即可体验

百度首页上线DeepSeek入口链接-AI搜索DeepSeek满血版”即可体验

记者获悉,百度搜索目前已全量上线DeepSeek满血版并提供联网服务,其中PC端开放1小时超千万人使用。对比其它接入DeepSeek产品,百度搜索在首页搜索框下方点击“AI搜索DeepSeek满血版”...

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

DeepSeek到底有多火?连老人家都超爱!老年大学首个DeepSeek班学位一分钟被抢光!不久前广州市老年干部大学(广州老年大学)开设了全国首个老年大学DeepSeek班“同学”们超级热情学位一分钟...