当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

1年前 (2025-03-03)Deepseek最新资讯619

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

联想百应智能体正式官宣引入DeepSeek

联想百应智能体正式官宣引入DeepSeek

近日,联想百应智能体正式官宣引入DeepSeek,二者的结合,将催生出前所未有的创新机遇。DeepSeek以领先的大模型技术实力和超低的训练成本火爆全球,而联想凭借在AI领域的深厚积累,迅速将联想百应...

外媒:DeepSeek启发全球AI公司创建更便宜模型

外媒:DeepSeek启发全球AI公司创建更便宜模型

据英国《金融时报》2日消息,包括OpenAI、微软和Meta在内的全球领先人工智能(AI)公司正在转向利用“蒸馏”技术,以创建对消费者和企业来说更便宜的人工智能模型。报道称,中国的DeepSeek运用...

美图WHEE接入DeepSeek R1,高精度描述重塑创意生产

美图WHEE接入DeepSeek R1,高精度描述重塑创意生产

36氪获悉,近日,美图公司旗下高品质AI素材生成器WHEE宣布接入DeepSeek R1满血版,将DeepSeek的专业性与WHEE的易用性相结合,零基础用户输入简单词汇,AI一键生成专业提示词,降低...

荣耀AI搜索官宣接入DeepSeek联网版

荣耀AI搜索官宣接入DeepSeek联网版

2月21日晚间,荣耀终端宣布,荣耀AI搜索接入DeepSeek联网版,将陆续覆盖更多手机机型。荣耀方面介绍,即日起,DeepSeek-R1联网版将覆盖荣耀手机MagicOS 8.0及以上,以及YOYO...

DeepSeek说:520到了,不同mbti的理想爱情是什么样的?

DeepSeek说:520到了,不同mbti的理想爱情是什么样的?

MBTI作为人格分类工具,常被用来探讨爱情中的互动模式。不同人格类型对理想关系的期待确实存在差异,但需注意:个体差异远大于类型标签,以下仅为基于认知功能(如主导/辅助功能)的常见倾向总结:理性分析组(...

梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案

梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案

DeepSeek刚刚发表了一篇名为《深入解读 DeepSeek-V3:AI 架构的扩展挑战与硬件思考》(Insights into DeepSeek-V3: Scaling Challenges an...