当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

8个月前 (03-03)Deepseek最新资讯474

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

中国电信助力泗县人民医院接入DeepSeek 智慧医疗扬帆起航

中国电信助力泗县人民医院接入DeepSeek 智慧医疗扬帆起航

3月1日,中国电信安徽泗县分公司携手泗县人民医院,将DeepSeek本地化部署智能医疗系统正式接入该医院,标志着该医院在智慧医疗领域迈出了重要一步。DeepSeek的引入将全面提升医院的诊疗效率、患者...

钉钉接入DeepSeek系列模型有哪些重要的意义?

钉钉接入DeepSeek系列模型有哪些重要的意义?

钉钉接入DeepSeek系列模型具有多方面的重要意义,以下是对这些意义的详细阐述:一、技术层面的提升增强AI助理功能:通过接入DeepSeek系列模型,钉钉AI助理获得了深度思考和联网查询的强大能力。...

DeepSeek走红三个月,第一批想靠它赚钱的怎么样了?

DeepSeek走红三个月,第一批想靠它赚钱的怎么样了?

文 | 螺旋实验室,作者丨安晓,编辑丨坚果 如果你在2023年躲过了Chatgpt,在2024年又躲过了Sora,那么2025年你也很有可能成为DeepSeek的潜在受众,逃不出它天罗密布织...

兰州大学上线DeepSeek本地服务

兰州大学上线DeepSeek本地服务

近日,兰州大学成功部署了由国产大模型公司深度求索(DeepSeek)推出的推理大模型DeepSeek-R1,目前已完成了数十款主流模型的部署工作,校内师生可通过高性能计算服务平台(https://hp...

DeepSeek创作诗词首次亮相联合国中文日活动

DeepSeek创作诗词首次亮相联合国中文日活动

4月20日是联合国中文日。连日来,联合国举办了一系列以“诗意中国·浪漫风华”为主题的活动。多个不同国家、不同肤色的联合国职员用中文朗诵了中国古典诗词,来自中国的外交官还朗诵一首由深度求索(DeepSe...

DeepSeek如何重塑中国大模型产业生态|海斌访谈

DeepSeek如何重塑中国大模型产业生态|海斌访谈

中国互联网大厂在为DeepSeek作出巨大改变。2月14日,百度宣布将于6月30开源文心大模型。2月15日,部分微信用户发现已经可以在搜索功能中调用DeepSeek模型了。百度和腾讯有自己的大模型产品...