当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

1年前 (2025-03-19)Deepseek应用场景605

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

兆芯全系列整机形态成功部署 DeepSeek R1 大模型

兆芯全系列整机形态成功部署 DeepSeek R1 大模型

IT之家 2 月 24 日消息,上海兆芯集成电路股份有限公司今日发文宣布:近日,基于兆芯高性能通用处理器的 PC 终端、工作站以及服务器成功实现 DeepSeek-R1-Distill 模型(1.5B...

Manus和DeepSeek的差别是什么 AI挑战张一一高考作文

Manus和DeepSeek的差别是什么 AI挑战张一一高考作文

Manus和DeepSeek的差别是什么 AI挑战张一一高考作文Manus创始人是中国90后肖弘 比梁文峰还年轻8岁Manus、DeepSeek将与“当代蒲松龄”“高考愚公”张一一高考作文“人机大战”...

神州泰岳:多条业务线产品已接入DeepSeek

神州泰岳:多条业务线产品已接入DeepSeek

金融界5月6日消息,在互动平台上,有投资者向神州泰岳提出疑问:“尊敬的董秘先生,据了解DeepSeek新版本R2模型即将面世。虽然官方尚未正式宣布,但当前业内普遍预计该模型会在5月发布。想请问一下,贵...

中国电信中山分公司携手DeepSeek打造智能化政务与行业服务新

中国电信中山分公司携手DeepSeek打造智能化政务与行业服务新

近日,中国电信中山分公司成功借助天翼云算力及政务云资源,助力中山市政数局完成了DeepSeek大模型的本地化部署,并在中山12345热线中率先实现了融合创新应用。此次合作通过赋能智能坐席助手,显著提升...

新书来了 │ DeepSeek+万物=王炸,打工人效率如何翻倍?这4本书给你答案

新书来了 │ DeepSeek+万物=王炸,打工人效率如何翻倍?这4本书给你答案

2025年伊始,DeepSeek以数字笔墨掀起惊澜,也呈现了人工智能时代一个深刻的命题:当技术无限逼近人类自身能力的时候,是否会替代人类?很多话题的探讨甚至引发对社会安全稳定和伦理问题的担忧。AI看似...

中公携手 DeepSeek,教资备考超轻松

中公携手 DeepSeek,教资备考超轻松

怀揣教育梦想,欲踏入教育行业,教师资格考试无疑是第一道门槛。中公教育敏锐洞察到这一需求,联合前沿的人工智能技术 DeepSeek,精心打造了一套独具创新性的备考方案,致力于为广大考生带来前所未有的备考...