当前位置:首页 > Deepseek应用场景 > 正文内容

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

5个月前 (06-13)Deepseek应用场景528

机器之心报道

机器之心编辑部

开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤其是内存),同时兼容 Hugging Face 等流行模型库。

简单来说,vLLM 能让 GPT、Mistral、LLaMA 等主流模型系列跑得更快、消耗更少资源,取得这些效果的关键是其创新的注意力机制实现方案 ——PagedAttention。

近日,DeepSeek AI 研究者、深度学习系统工程师俞星凯从零开始构建了一个轻量级 vLLM 实现 ——Nano-vLLM,将代码简化到了 1200 行。

目前,该项目在 GitHub 上收获了 200 多的 Star。

GitHub 地址:https://github.com/GeeeekExplorer/nano-vllm/tree/main

具体来讲,Nano-vLLM 具有以下三个核心功能:

一是,Fase 离线推理。推理速度与 vLLM 相当。

二是,易读代码库。实现非常简洁,Python 代码减少到了 1200 行以下。

三是,优化套件。提供 Prefix 缓存、Torch 编译、CUDA 计算图等功能。

俞星凯在基准测试中采用了以下测试配置:

硬件:RTX 4070

模型:Qwen3-0.6B

总请求:256 个序列

输入长度:100–1024 tokens 之间随机采样

输出长度:100–1024 tokens 之间随机采样

基准测试结果如下表所示,Nano-vLLM 与 vLLM 的输出 token 相同,时间略长,推理速度(吞吐量)稍逊一点点。整体而言,二者表现相当。

作者简介

Nano-vLLM 开发者俞星凯目前就职于 DeepSeek,参与过 DeepSeek-V3 和 DeepSeek-R1 的开发工作。

有意思的是,根据其 GitHub 主页,他还曾开发过一个植物大战僵尸 Qt 版,该项目也已经收获了 270 多星。此外,由于毕业于南京大学,他还曾参与了不少南京大学的计算机项目,包括南京大学计算机图形学绘图系统、南京大学分布式系统 Raft 算法最简实现、南京大学操作系统 OSLab 等。

而根据其 LinkedIn 页面可知,他曾先后在腾讯、幻方(DeepSeek 母公司)和字节跳动实习过。2023 年后入职 DeepSeek 成为深度学习系统工程师。

你是 vLLM 用户吗?会考虑尝试 Nano-vLLM 吗?


“1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版” 的相关文章

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

国际投行集体唱多A股DeepSeek不仅震撼了硅谷,还震撼了华尔街。最近一周以来,高盛、美银、德银等国际知名投行轮番发布研报,看好中国科技股,建议做多中国股市。华尔街唱多中国股市的声音正如潮水般涌来。...

智汇政务 创享未来——白银市广大干部集中专题学习DeepSeek人工智能大模型应用探索

智汇政务 创享未来——白银市广大干部集中专题学习DeepSeek人工智能大模型应用探索

在数字化浪潮中,人工智能、大数据等技术的应用场景不断拓展,作为一款先进的人工智能辅助决策系统,DeepSeek在政务服务、公共管理等多个领域展现出巨大的应用潜力。为学习探讨如何运用DeepSeek提升...

达实智能:深入交流AIoT与DeepSeek应用

达实智能:深入交流AIoT与DeepSeek应用

5月23日,达实智能(002421)发布公告,近期公司举行了投资者关系活动,时间为2025年5月22日,参与方包括公司副总经理吕枫和证券事务代表管小芬,以及来自广发证券、金鹰基金等29位机构及个人投资...

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

自DeepSeek全新开源模型掀起AI浪潮以来,中国电信舟山分公司作为数字舟山建设的主力军,凭借强大的技术实力和创新能力,迅速行动、深度探索DeepSeek大模型融合各行各业,为舟山市民政局率先实现D...

中华保险接入Deepseek大模型 实现技术新突破

中华保险接入Deepseek大模型 实现技术新突破

近日,中华保险旗下中华财险宣布已完成基于国产大模型DeepSeek的本地化部署,标志着其在保险科技领域的进一步突破。此次部署不仅是技术上的升级,更是中华保险旗下中华财险在数字化转型中的重要一步。未来,...

商贸物流领域Deepseek应用专题培训会成功举办

商贸物流领域Deepseek应用专题培训会成功举办

4月10日上午,由临沂市大数据局与临沂商城管委会联合主办,临沂市大数据中心、兰山商城管委会、临沂商贸物流科技产业研究院等单位联合承办的“DeepSeek在商贸物流领域应用”专题培训会在中国教育用品采购...