当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

1年前 (2025-02-25)Deepseek最新资讯582

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

DeepSeek回应焦虑:最危险的从来不是技术,而是…

DeepSeek回应焦虑:最危险的从来不是技术,而是…

随着DeepSeek一夜爆红,人工智能正逐步渗透到生活工作的方方面面。最近,一张各职业被AI取代难易程度图在金融圈引起讨论,根据图解,AI率先取代的是高机械性、缺乏创意、弱社交的职业,其中,证券分析行...

汾西矿业南关煤业引入DeepSeek助力安全生产

汾西矿业南关煤业引入DeepSeek助力安全生产

近日,汾西矿业南关煤业将DeepSeek人工智能融入岗位“五述”安全管理平台,成功上线智能问答助手、智能合规审查、智能隐患排查、设备故障诊断等六大功能模块,为矿山安全生产与高效运营注入了强大的科技动力...

DeepSeek:如何把留学花的300万赚回来

DeepSeek:如何把留学花的300万赚回来

在当今全球化的时代,越来越多的中国家庭选择将孩子送出国留学,希望通过优质的教育资源为孩子铺就一条通往成功的道路。然而,留学费用动辄数百万元,尤其是对于普通家庭来说,这无疑是一笔巨大的投资。面对300万...

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

3月7日,在贵阳贵安DeepSeek部署应用新闻发布会上,贵阳市大数据局局长、贵安新区大数据和科创局局长张雪蓉介绍,在运用DeepSeek赋能方面,贵阳贵安始终以“技术落地、服务见效”为目标,在企业和...

美图WHEE接入DeepSeek R1,高精度描述重塑创意生产

美图WHEE接入DeepSeek R1,高精度描述重塑创意生产

36氪获悉,近日,美图公司旗下高品质AI素材生成器WHEE宣布接入DeepSeek R1满血版,将DeepSeek的专业性与WHEE的易用性相结合,零基础用户输入简单词汇,AI一键生成专业提示词,降低...

DeepSeek预测2025年高考十大热门填报专业,结果让人意外

DeepSeek预测2025年高考十大热门填报专业,结果让人意外

今天,我们一同探讨DeepSeek对2025年高考热门专业的预测,剖析这些专业是否真的具备吸引力,值得广大学子的关注。一、智能科技与大数据——数字经济的支柱智能科技与大数据,作为数字经济的核心领域,正...