当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能

7个月前 (12-04)Deepseek最新资讯149

  IT之家 12 月 4 日消息,科技媒体 Wccftech 昨日(12 月 3 日)发布博文,报道称在“混合专家”模型上,

  IT之家注:混合专家模型(MoE)是一种高效的 AI 大模型架构。它不像传统模型那样在处理每个任务时都动用全部“脑力”(参数),而是像一个专家团队,根据任务类型只激活一小部分最相关的“专家”(参数子集)来解决问题。这样做能显著降低计算成本,提高处理速度。

  就像人脑使用特定区域执行不同任务一样,混合专家模型使用路由器来选择最相关的专家来生成每个 token。

  英伟达为了解决 MoE 模型扩展时遇到的性能瓶颈,采用了“协同设计”(co-design)的策略,该方法整合了 GB200 的 72 芯片配置deepseek、高达 30TB 的快速共享内存、第二代 Transformer 引擎以及第五代 NVLink 高速互联技术。

  通过这些技术的协同工作,系统能够高效地将 Token 批次拆分并分配到各个 GPU,同时以非线性速率提升通信量,从而将专家并行计算(expert parallelism)提升至全新水平,最终实现了性能的巨大飞跃。

  除了硬件层面的协同设计,英伟达还实施了多项全栈优化措施来提升 MoE 模型的推理性能。例如,NVIDIA Dynamo 框架通过将预填充(prefill)和解码(decode)任务分配给不同的 GPU,实现了任务的解耦服务,允许解码阶段以大规模专家并行方式运行。

  同时,系统还采用了 NVFP4 格式,这种数据格式在保持计算精度的同时,进一步提高了性能和效率,确保了整个 AI 计算流程的高效稳定。

  该媒体指出,此次 GB200 NVL72 取得的性能突破,对英伟达及其合作伙伴具有重要意义。这一进展成功克服了 MoE 模型在扩展时面临的计算瓶颈,从而能够满足日益增长的 AI 算力需求,并巩固了英伟达在 AI 服务器市场的领先地位。原文出处:Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍,感谢原作者,侵权必删!

标签: deepseek

“Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能” 的相关文章

DeepSeek预测:皇家马德里VS奥萨苏纳!姆巴佩领衔银河战舰主场碾压?

DeepSeek预测:皇家马德里VS奥萨苏纳!姆巴佩领衔银河战舰主场碾压?

  2025-26赛季西甲首轮压轴大战,皇家马德里将在伯纳乌迎战奥萨苏纳。上赛季亚军皇马尚未亮相(0胜0平0负),而奥萨苏纳同样以零积分暂列第12。但银河战舰坐拥姆巴佩、贝林厄姆等巨星,主...

Deepseek被指变冷淡了 有用户下载旧版本

Deepseek被指变冷淡了 有用户下载旧版本

  核心升级之一是将上下文窗口从原先的128K Tokens大幅拓展至1M Tokens,容量提升近8倍。   伴随技术迭代,部分用户注意到模型在交互风格上也出现微妙变化...

Deepseek推荐全国旅游百强区第60名:广西南宁市江南区

Deepseek推荐全国旅游百强区第60名:广西南宁市江南区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

海因克斯:期待一名客观、公平、判罚准确的裁判,让球员决定比赛而不是裁判

海因克斯:期待一名客观、公平、判罚准确的裁判,让球员决定比赛而不是裁判

  在皇马论坛App说皇马的底裤历史,必被删,整个就一暗黑团队,能做到一直靠裁判拿成绩还垄断话语权   在皇马论坛App说皇马的底裤历史,必被删,整个就一暗黑团队,能做到...

守正出新,智驭未来:索象集团的2025“定”与“变”

守正出新,智驭未来:索象集团的2025“定”与“变”

  2025年,中国消费市场步入深度结构化调整阶段。伴随疫后经济与社会形态的变迁,行业整体从追求规模扩张转向精细化、分层化运营的新范式。消费者行为理性分化,企业组织持续重构,人才需求结构同...

1月21日DeepSeek预测:湖人vs掘金,约基奇缺阵,东契奇率队客场险胜

1月21日DeepSeek预测:湖人vs掘金,约基奇缺阵,东契奇率队客场险胜

  西部季后赛卡位战即将打响!北京时间1月21日11:00,湖人将客场挑战卫冕冠军掘金。目前湖人以25胜16负排名西部第6,掘金则以29胜14负高居西部第3。本场比赛最大看点在于约基奇、穆...