当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

1年前 (2025-02-25)Deepseek最新资讯581

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

汇丰:DeepSeek成功或使全球重新评估中国创新能力

汇丰:DeepSeek成功或使全球重新评估中国创新能力

汇丰环球私人银行及财富管理中国首席投资总监匡正近日表示,人工智能初创公司DeepSeek的技术突破体现了中国大语言模型已迈向深度推理阶段,其创新能力引起市场高度关注,或将影响全球AI行业格局。匡正表示...

每日互动:携手DeepSeek打造专属垂直模型

每日互动:携手DeepSeek打造专属垂直模型

金融界4月29日消息,有投资者在互动平台向每日互动提问:董秘,DS"即 DeepSeek(深度求索),Data Space(可信数据空间),Data Station(发数站)。基于我们强大的数据智能能...

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

没想到,DeepSeek走红之后,第一个搭上这股东风的产业竟然是充气娃娃。不过这次,不再靠充气和皮肤,而是靠AI了。最近,来自广东中山的成人玩偶制造公司金三玩美(WMdoll)一下子火了。去年12月,...

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

时间是人生最宝贵的资源,浪费时间等同于慢性自杀。DeepSeek通过大数据分析,揭示了生活中最严重的7大时间杀手,帮助我们深刻反思,重新掌控生活节奏。第一,垃圾娱乐如游戏和短视频虽然短暂放松,但长期沉...

神州数码郭为:DeepSeek最大贡献在于通过开源推动AI惠普

神州数码郭为:DeepSeek最大贡献在于通过开源推动AI惠普

人民财讯4月3日电,在近日举行的神州数码2024年度业绩说明会上,神州数码董事长郭为表示,DeepSeek最大的贡献和价值在于通过开源,推动了AI的普惠,AI的开源和普惠,给各行各业带来了非常大的机会...

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

西风 发自 凹非寺量子位 | 公众号 QbitAI斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而...