当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

1年前 (2025-03-19)Deepseek应用场景601

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

宿迁移动助力市城管局开展DeepSeek启动仪式暨知识讲座

宿迁移动助力市城管局开展DeepSeek启动仪式暨知识讲座

为深入贯彻落实市委市政府关于智慧城市建设的决策部署,推动人工智能技术在城市管理领域的创新应用,近日,宿迁移动助力市城管局开展DeepSeek启动仪式暨知识讲座。宿迁市城管局党组书记、局长,市二级巡视员...

“英伟达焦虑:若DeepSeek用中企芯片…”

“英伟达焦虑:若DeepSeek用中企芯片…”

【文/观察者网 林琛力】据路透社报道,当地时间5月1日,英伟达高管与美国众议院外交事务委员会举行闭门会议,英伟达首席执行官黄仁勋在会上表达了对中国企业AI能力不断增强的担忧。据悉,当日会议的主题包括中...

蜜度索骥升级!DeepSeek 全文检索 热搜检索

蜜度索骥升级!DeepSeek 全文检索 热搜检索

5月27日,蜜度旗下多模态与跨模态信息检索平台——蜜度索骥,深度融合DeepSeek-R1满血版,推出“深度检索”功能,该功能涵盖两大核心能力,分别为“全文检索”与“热搜检索”。DeepSeek&am...

DeepSeek,激荡AI行业的“一股清流”

DeepSeek,激荡AI行业的“一股清流”

近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在...

deepseek入局搜索混战

deepseek入局搜索混战

DeepSeek应用以史上最快速度达成3000万日活。据调研机构QuestMobile,1月28日,DeepSeek日活跃用户数首次超越豆包,随后在2月1日突破3000万大关。目前DeepSeek、字...

八旬院士陈润生:科研征程上的“预言家”与开拓者

八旬院士陈润生:科研征程上的“预言家”与开拓者

在当今科技飞速发展的时代,一位八旬院士的“神预言”引发了广泛关注,他就是DeepSeek诞生背后那位令人敬仰的“预言家”——陈润生。当被问及这一预言时,陈润生院士谦逊地表示:“真没料到会成预言家。”这...