当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

1年前 (2025-04-11)Deepseek应用场景535

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

智汇政务 创享未来——白银市广大干部集中专题学习DeepSeek人工智能大模型应用探索

智汇政务 创享未来——白银市广大干部集中专题学习DeepSeek人工智能大模型应用探索

在数字化浪潮中,人工智能、大数据等技术的应用场景不断拓展,作为一款先进的人工智能辅助决策系统,DeepSeek在政务服务、公共管理等多个领域展现出巨大的应用潜力。为学习探讨如何运用DeepSeek提升...

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

3月24日,DeepSeek悄悄上线了新版V3开源大模型——DeepSeek-V3-0324。专业AI模型评测机构Artificial Analysis最新排名显示,新版DeepSeek-V3在基准测...

DeepSeek,重磅突发!DeepSeek官宣,今日开源代码库为DeepEP

DeepSeek,重磅突发!DeepSeek官宣,今日开源代码库为DeepEP

2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推...

证监会主席谈DeepSeek:带动中国资产价值重估

证监会主席谈DeepSeek:带动中国资产价值重估

3月6日下午,十四届全国人大三次会议举行经济主题记者会。今年以来,以DeepSeek为代表的科技企业受到市场广泛关注,不少国际投资机构认为DeepSeek热将推动对中国科技企业价值重估。会上,中国证券...

跟DeepSeek聊人体解剖学是一种什么体验?

跟DeepSeek聊人体解剖学是一种什么体验?

人工智能发展飞速,在专业医学课堂教学领域有什么新动向?广东有高校已率先在多个专业课程采用DeepSeek辅助。记者从广东药科大学获悉,日前,该校在智能医学工程、数字媒体技术、临床医学、预防医学四个专业...

100个经常用的DeepSeek提示词

100个经常用的DeepSeek提示词

写作与内容生产1. 写一篇关于人工智能伦理的议论文大纲。  2. 生成一段科幻小说的开头,主题是时间旅行。  3. 为环保产品写一段吸引人的广告文案。  4. 将以下技术...