当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

2个月前 (02-27)Deepseek最新资讯48

  2月27日消息,依旧没等到DeepSeek V4,今天DeepSeek与北京大学、清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。据了解,该框架旨在解决智能体在长文本推理场景下面临的I/O瓶颈问题,通过优化存储读取路径,显著提升了大规模模型的推理吞吐量deepseek

  据论文介绍,DualPath的核心创新在于改变了传统的“存储至预填充引擎”(Storage-to-Prefill)单路径加载模式,引入了“存储至解码引擎”(Storage-to-Decode)的第二条路径。在现有的预填充-解码分离架构中,存储I/O压力往往集中在预填充引擎上,导致解码引擎的存储带宽闲置,这种不平衡成为了限制系统吞吐量的障碍。DualPath通过利用解码引擎闲置的存储网卡带宽读取缓存,并配合高速计算网络(RDMA)将其传输至预填充引擎,实现了集群存储带宽的全局池化与动态负载均衡。

  在技术实现上,DualPath采用了以计算网卡为中心的流量管理和自适应请求调度机制。系统将所有GPU相关流量统一管理,利用服务质量(QoS)机制确保推理通信的高优先级,保证大规模数据传输不干扰延迟敏感型任务。同时,调度器能实时监控各引擎负载,动态决定最优路径,减少GPU执行过程中的闲置时间。

  数据显示,研究团队在包含1152个GPU的大规模生产集群上,使用660B规模的模型进行了实测。结果表明,DualPath在离线推理场景下的吞吐量提高了1.87倍,在线服务场景下的吞吐量平均提升了1.96倍。此外,在高负载环境下,首字延迟(TTFT)得到大幅优化,而Token间的生成速度几乎未受干扰。(袁宁)原文出处:DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍” 的相关文章

DeepSeek-R1大模型训练方法在《自然》杂志发表

DeepSeek-R1大模型训练方法在《自然》杂志发表

  开源人工智能(AI)模型DeepSeek-R1采用的大规模推理模型训练方法,本周发表在了《自然》 杂志上。作者是DeepSeek-AI团队梁文锋及其同事。   研究表...

张骏吐槽DeepSeek过度思考致回答延迟

张骏吐槽DeepSeek过度思考致回答延迟

  #DeepSeek是很内耗的人工智能# 张骏又开启神吐槽模式!半决赛这轮他说在每次问Deepseek一些问题它都要自己盘问一番,比如你问它1+1等于几,它会先说:用户现在问我1+1等于...

助力中国马拉松力压日本,中国跑鞋迎来“DeepSeek时刻”?

助力中国马拉松力压日本,中国跑鞋迎来“DeepSeek时刻”?

  在32公里这一跑者最恐惧的撞墙期,中国选手丰配友持续提速,赶超日本选手桥本龙一,位列亚洲选手第一。   最后500米,日本选手大迫杰突然追了上来。丰配友知道,这是位劲...

DeepSeek上新mHC,R2还远吗?

DeepSeek上新mHC,R2还远吗?

  去年1月,春节前夕,“DeepSeek冲击波”席卷业界,中美同时“破圈”,成为年度现象级事件。而2026年一开年,DeepSeek又惊喜时刻进一步提前。   1月1日...

1月8日DeepSeek预测:雄鹿vs勇士,字母哥对决库里,勇士主场险胜

1月8日DeepSeek预测:雄鹿vs勇士,字母哥对决库里,勇士主场险胜

  北京时间1月8日11:00,NBA常规赛将迎来一场东西部焦点对决,密尔沃基雄鹿(客)挑战金州勇士(主)。尽管雄鹿近期状态火热,但勇士坐拥主场之利,且历史交锋稍占上风,本场比赛或将上演一...

DeepSeek研究员陈德里提出AI三阶段预测模型

DeepSeek研究员陈德里提出AI三阶段预测模型

  DeepSeek(深度求索)资深研究员陈德里在2025年世界互联网大会乌镇峰会上,首次公开提出AI发展的三阶段预测模型,强调这是基于“AI正从工具转变为智慧主体”的根本性变革。他的核心...