当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

1年前 (2025-02-26)Deepseek最新资讯601

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

“DeepSeek 启智计划”把AI青年力注入青年夜校

“DeepSeek 启智计划”把AI青年力注入青年夜校

中国青年报客户端讯(中青报·中青网记者 胡春艳 通讯员 周晓曦 刘昌利)近日,在天津市河北区时代书吧,来自国网天津信通公司的青年志愿者们正在面向青年群体宣讲DeepSeek使用方法和操作技巧,助力夜校...

调用 DeepSeek 的 API 会导致数据泄露吗?

调用 DeepSeek 的 API 会导致数据泄露吗?

调用 DeepSeek 的 API 会导致数据泄露吗?调用DeepSeek的API可能会导致数据泄露。以下是主要原因和建议措施:主要原因:未授权访问:DeepSeek的服务API接口(如http://...

除了不能当女婿,DeepSeek比董宇辉差到哪了?

除了不能当女婿,DeepSeek比董宇辉差到哪了?

原创 薛亚萍 字母榜“DeepSeek推荐”正在成为年轻人新的消费决策仪式。打开购物APP之前,在北京工作的白领刘雪先去寻求DeepSeek的帮助:“我27岁,敏感肌,请你帮我推荐几款适合我的防晒霜”...

北京首个!顺义基础教育领域部署DeepSeek大模型

北京首个!顺义基础教育领域部署DeepSeek大模型

据北京顺义区消息,近日,顺义在北京市基础教育领域率先部署DeepSeek-R1人工智能大模型,以人工智能促进教育高质量发展,开启顺义智慧教育新篇章。顺义教委相关负责人表示,DeepSeek在教育领域的...

中原消费金融:用DeepSeek解锁消费金融新机遇

中原消费金融:用DeepSeek解锁消费金融新机遇

近日,国产大模型深度求索(DeepSeek)凭借卓越的性能表现,迅速赢得了金融机构的青睐,在金融业内掀起了一股应用人工智能的新热潮。金融机构纷纷接入DeepSeek,期望在实际业务中开拓新的增长点。截...

DeepSeek在企业应用:解锁高效智能新篇章

DeepSeek在企业应用:解锁高效智能新篇章

DeepSeek在企业应用:解锁高效智能新篇章一、引言在数字化浪潮的推动下,企业正面临着前所未有的挑战与机遇。如何快速响应市场变化、提升运营效率、优化决策过程,成为了企业持续发展的关键。DeepSee...