当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

4个月前 (02-25)Deepseek最新资讯205

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

5月21日下午,麒麟信安召开2024年年度股东大会,包括公司总经理、董秘等在内的高管参加并与投资者现场交流。据悉,麒麟信安2024年实现企稳回升,全年实现营业收入2.86亿元,同比增长75.24%;归...

DeepSeek7小时攻克缅甸救灾语言关

DeepSeek7小时攻克缅甸救灾语言关

缅甸发生中部地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队,利用DeepSeek在仅...

争夺DeepSeek溢出流量!大厂应用端迅速接入 用户抱怨:搜的是抖音推的是视频号

争夺DeepSeek溢出流量!大厂应用端迅速接入 用户抱怨:搜的是抖音推的是视频号

《科创板日报》2月28日讯(记者 黄心怡)开源和低成本的优势,让DeepSeek打破了科技巨头用算力构建起的高墙,也让国内大模型企业感受到了新的竞争压力。目前,国内的互联网巨头正纷纷借势DeepSee...

DeepSeek回应焦虑:最危险的从来不是技术,而是…

DeepSeek回应焦虑:最危险的从来不是技术,而是…

随着DeepSeek一夜爆红,人工智能正逐步渗透到生活工作的方方面面。最近,一张各职业被AI取代难易程度图在金融圈引起讨论,根据图解,AI率先取代的是高机械性、缺乏创意、弱社交的职业,其中,证券分析行...

DeepSeek开源第二弹:EP通信库来了,有望再次降低计算消耗

DeepSeek开源第二弹:EP通信库来了,有望再次降低计算消耗

2月25日,DeepSeek在“开源周”的第二日开源了DeepEP通信库。DeepSeek表示,这是第一个用于MoE(专家)模型训练和推理的开源EP通信库。“高效、优化的全员沟通;节点内和节点间均支持...

群邑Choreograph接入DeepSeek,让品牌更快找到对的消费者

群邑Choreograph接入DeepSeek,让品牌更快找到对的消费者

Choreograph已将DeepSeek R1 全面整合到其自主研发的媒体平台标签翻译产品Audience Translator中,以帮助品牌在中国市场更好地找到对的消费者。Audience Tra...