当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1

10个月前 (08-27)Deepseek最新资讯435

  IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。

  GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数deepseek,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。

  CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。原文出处:Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活,感谢原作者,侵权必删!

标签: deepseek

“Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1” 的相关文章

DeepSeek一句话,沪指重回3800

DeepSeek一句话,沪指重回3800

  8月21日,深度求索(DeepSeek)公司在官方微信公众号发文,发布DeepSeek-V3.1模型。官方账号在置顶评论表示:“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”...

阿里吴嘉:千问已超越Llama、Deepseek等 成全球性能最强开源大模型

阿里吴嘉:千问已超越Llama、Deepseek等 成全球性能最强开源大模型

  快科技11月27日消息,今天下午,夸克AI眼镜正式发布,首发提供S1、G1两个系列共六款单品。S1到手价3799元,G1到手价1899元起。   这六款AI眼镜均搭载...

具身智能的DeepSeek时刻

具身智能的DeepSeek时刻

  早期的手机只有打电话发短信功能,娱乐功能顶多能玩几个贪吃蛇游戏。所以那个时代,以千元机为主。   需要注意的是,消费一定是面向全民的。像劳斯莱斯手工打造的奢侈品,并不...

DeepSeek掷出FP8骰子

DeepSeek掷出FP8骰子

  芯片指数与AI算力指数近期持续走高背后,是AI浪潮与大模型算力需求剧增下,国产替代加速与供应链多元化路径日渐成熟的趋势。而DeepSeek掷出FP8这颗 “魔力骰子”,不仅精准切中行业...

Deepseek推荐全国旅游百强区第53名:安徽合肥市庐阳区

Deepseek推荐全国旅游百强区第53名:安徽合肥市庐阳区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价deepseek...

DeepSeek昨天开源的新模型,有点邪门。

DeepSeek昨天开源的新模型,有点邪门。

  DeepSeek 又整出新东西来了,只用到原本十分之一 token,就能存下几乎一样的文字信息,这压缩比,香农看了都要流泪,冯·诺伊曼看了都要沉默。   昨天,Dee...