当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

4个月前 (02-27)Deepseek最新资讯53

  2月27日消息,依旧没等到DeepSeek V4,今天DeepSeek与北京大学、清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。据了解,该框架旨在解决智能体在长文本推理场景下面临的I/O瓶颈问题,通过优化存储读取路径,显著提升了大规模模型的推理吞吐量deepseek

  据论文介绍,DualPath的核心创新在于改变了传统的“存储至预填充引擎”(Storage-to-Prefill)单路径加载模式,引入了“存储至解码引擎”(Storage-to-Decode)的第二条路径。在现有的预填充-解码分离架构中,存储I/O压力往往集中在预填充引擎上,导致解码引擎的存储带宽闲置,这种不平衡成为了限制系统吞吐量的障碍。DualPath通过利用解码引擎闲置的存储网卡带宽读取缓存,并配合高速计算网络(RDMA)将其传输至预填充引擎,实现了集群存储带宽的全局池化与动态负载均衡。

  在技术实现上,DualPath采用了以计算网卡为中心的流量管理和自适应请求调度机制。系统将所有GPU相关流量统一管理,利用服务质量(QoS)机制确保推理通信的高优先级,保证大规模数据传输不干扰延迟敏感型任务。同时,调度器能实时监控各引擎负载,动态决定最优路径,减少GPU执行过程中的闲置时间。

  数据显示,研究团队在包含1152个GPU的大规模生产集群上,使用660B规模的模型进行了实测。结果表明,DualPath在离线推理场景下的吞吐量提高了1.87倍,在线服务场景下的吞吐量平均提升了1.96倍。此外,在高负载环境下,首字延迟(TTFT)得到大幅优化,而Token间的生成速度几乎未受干扰。(袁宁)原文出处:DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍” 的相关文章

10月28日DeepSeek预测:篮网vs火箭,杜兰特率队终结连败,托马斯难救主

10月28日DeepSeek预测:篮网vs火箭,杜兰特率队终结连败,托马斯难救主

  北京时间10月28日早8点,NBA常规赛将迎来一场焦点战,休斯顿火箭坐镇主场迎战布鲁克林篮网。两支球队新赛季均未尝胜绩,火箭0胜2负西部垫底,篮网0胜3负东部倒数第一。此役对于双方而言...

9月22日,中国电信新一代财司数智金融系统品牌即将在京发布

9月22日,中国电信新一代财司数智金融系统品牌即将在京发布

  随着企业数字化转型加速,传统财务管理系统面临着智能化水平不足、外部技术依赖性强等突出瓶颈,亟需突破创新。日前,由中国电信翼支付与中国电信财务公司联合打造的新一代财司数智金融系统已正式上...

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

  习近平总书记高度重视文化建设,早在二十多年前,他在浙江工作时对文化就有着深刻的思考与实践,他将“加快建设文化大省”列为“八八战略”重要内容,部署实施了文化大省建设“八项工程”,为浙江文...

外交学院成功举办第二届“国际政治语言学”学术论坛

外交学院成功举办第二届“国际政治语言学”学术论坛

  2025年12月27日,外交学院成功主办第二届“国际政治语言学:中国话语与中国叙事体系构建”学术论坛。本届论坛聚焦人类命运共同体理念的研究与阐释,汇集了中国外文局、中国社会科学院、清华...

AI预测U23决赛:豆包KIMI看好中国点球胜,Deepseek倾向日本

AI预测U23决赛:豆包KIMI看好中国点球胜,Deepseek倾向日本

  今晚的U23亚洲杯决赛将迎来中国U23与日本U23的巅峰对决,这场焦点战吸引了众多人工智能模型的关注。各AI平台基于历史数据和实时分析,对比赛结果进行了详细预测,呈现出多样化的观点。D...

DeepSeek预测:佛罗伦萨vs罗马!苏莱2球领衔,红狼客场1球险胜紫百合?

DeepSeek预测:佛罗伦萨vs罗马!苏莱2球领衔,红狼客场1球险胜紫百合?

  意甲第6轮焦点战,排名第16的佛罗伦萨将在弗兰基球场迎战高居第3的罗马。紫百合本赛季尚未尝胜绩(0胜3平2负),而红狼则与榜首同积12分仅因净胜球劣势屈居第三。这场「攻防效率悬殊」的对...