当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?

8个月前 (08-24)Deepseek最新资讯489

  近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度,并明确指出该精度标准是针对即将发布的下一代国产芯片设计。这一消息迅速在资本市场引发强烈反应,

  不过,在近两日举办的2025算力大会上,据《科创板日报》记者的现场采访和观察来看,大家在聚焦国产算力时,DeepSeek的FP8精度标准虽被讨论,但业内人士的情绪显然没有资本市场那么高亢。技术派更关注FP8在模型训练、推理及生态标准化上的实际价值与挑战。

  摩尔线程AI Infra总监陈志向《科创板日报》记者称,过去,大模型训练推理普遍使用FP32(32位浮点数),随后逐步过渡到FP16(16位浮点数)混合精度,以减少存储和通信开销,FP8则进一步将数据宽度压缩至8位。

  “FP8最直接的优势是算力效率翻倍,另一个好处是降低降低训练和推理过程中网络带宽的通信量。”陈志称,比如原本传输一个FP32数值需4字节,现在仅需FP8仅需要1字节,虽然网络物理带宽本身未必扩大,但单位时间内可传输信息是增加的,同时也让存储要求降低。这意味着在相同功耗下,AI芯片可训练更大的模型或缩短训练时间。

  在2025算力大会现场,另一名不愿具名的国产芯片厂商从业人员告诉《科创板日报》记者,用类似FP8低精度训练推理虽然快,但也容易因数值范围太小导致计算出错。而且,不同计算对精度要求不同,像矩阵乘法这类操作对精度不敏感,可以用较低的精度(如FP8)计算;而像累加或某些函数则需要较高精度。因此,业内通常采用“混合精度训练”,根据计算类型动态选择不同的精度,兼顾效率与准确。

  DeepSeek-V3.1使用UE8M0 FP8 Scale 的参数精度,被视为国产AI芯片即将迈入新阶段的信号。受此刺激,寒武纪等芯片类上市公司股价大幅上涨,但产业界人士态度更为审慎。

  在业内看来,DeepSeek此举无疑给了国内算力厂商的机会,FP8代表了算力优化的正确方向,大模型训练推理不只是堆砌硬件,但它也并非“灵丹妙药”,更需要关注的是实际落地效果。此外DeepSeek的这一动作,后续是否会成为大模型训练与推理的新标准。

  在陈志看来,大模型对精度的容忍度越来越高,从FP32到FP16,再到FP8,是整个行业逐步验证过的路径。DeepSeek这次验证了FP8在大规模模型上的可行性,未来在FP8这一标准乃至更高精度上去做研究或者做训练也是一个很重要的方向deepseek

  当然,这一趋势也意味着,国产算力生态需要同步升级,包括芯片、框架、算力平台到应用层的闭环适配。

  陈志表示,精度标准一旦变化,上下游厂商也需要联动优化。摩尔线程已提前布局FP8研究,既是技术储备,也是为了在生态调整中占据主动。

  他进一步说到,大模型训练推理的核心瓶颈不仅是算力规模,还包括能耗、稳定性和集群利用,“国内万卡规模集群已有部署,但还要向大智算集群演进,解决效率与容错问题,确保集群可靠性。简单‘堆卡’并不能完全满足需求,提高单卡效率与集群调度优化同样关键”。原文出处:DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?” 的相关文章

12月27日DeepSeek预测:凯尔特人vs步行者,绿军双星闪耀客场轻取残阵对

12月27日DeepSeek预测:凯尔特人vs步行者,绿军双星闪耀客场轻取残阵对

  在圣诞大战后的首个比赛日,东部第三的波士顿凯尔特人将造访印第安纳,挑战深陷连败泥潭的步行者队(东部第14)。这场看似实力悬殊的较量,却因双方四天前的激战(103-95)和步行者主场复仇...

2月25日DeepSeek预测:独行侠vs篮网,东契奇缺阵下独行侠能否客场擒网?

2月25日DeepSeek预测:独行侠vs篮网,东契奇缺阵下独行侠能否客场擒网?

  北京时间2月25日早8:30,NBA常规赛将迎来一场西部第12的达拉斯独行侠客场挑战东部垫底的布鲁克林篮网。尽管两队本赛季胜率均不足36%,但坐拥历史交锋4胜1负优势的独行侠,在刚刚终...

DeepSeek下周发布多模态大模型V4,支持图文视频生成

DeepSeek下周发布多模态大模型V4,支持图文视频生成

  #deepseek崩了#?我刚用来着,一切正常啊。而且IT之家援引了一篇报道称,DeepSeek将于下周发布全新多模态大语言模型V4deepseek,原生支持图片、视频与文本生成功能。...

腾讯姚顺雨:中国AI需要走出榜单束缚,像DeepSeek注重坚持正确的事

腾讯姚顺雨:中国AI需要走出榜单束缚,像DeepSeek注重坚持正确的事

  1月10日,AGI-Next前沿峰会上,腾讯CEO办公室首席科学家姚顺雨连线发言,分享自己观察到中国AI大模型行业的现象。他举例DeepSeekdeepseek,表示希望大家能走出“榜...

算力觉醒,产业新生——2026中部AI算力产业建设大会与您相约郑州

算力觉醒,产业新生——2026中部AI算力产业建设大会与您相约郑州

  一边是AI应用端的迅猛爆发:AI独角兽MiniMax交出了营收翻倍的亮眼成绩,日均算力消耗激增6倍;另一边是国产硬件的集体突围,GPU厂商摩尔线程、沐曦股份业绩双双突破15亿大关。更有...

杭钢股份涨停,DeepSeek-R2刺激算力需求+东数西算概念

杭钢股份涨停,DeepSeek-R2刺激算力需求+东数西算概念

  截至9时59分,杭钢股份涨幅为9.98%,最新价9.81元,总市值331.30亿元deepseek,封板资金5.92亿元,成交额16.59亿元,换手率5.21%,所属行业为钢铁行业。...