当前位置:首页 > Deepseek最新资讯 > 正文内容

商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向

2个月前 (07-29)Deepseek最新资讯219

  7月28日,在2025世界人工智能大会(WAIC)期间,商汤大装置发布基于DeepLink的异构混合调度方案,将DeepLink深度融入商汤大装置核心能力体系。该方案针对当前国产算力资源碎片化、异构芯片调度复杂、跨域训练稳定性不足等行业挑战,全面提升异构集群的协同效率与运行可靠性,加速国产AI算力从“可用”迈向“好用”,为大模型训练提供强大而高效的支撑能力。

  活动现场,商汤大装置事业群产品总经理卢国强和上海人工智能实验室DeepLink高级解决方案专家王峰在WAIC UP魔盒直播间进行解读,详细介绍了相关的技术原理与产业价值。

  DeepLink是由上海人工智能实验室(上海AI实验室)推出的人工智能开放计算体系,其目标是搭建在硬件芯片与深度学习软件框架之间进行适配的桥梁,共建开放的软硬件适配生态。DeepLink把AI芯片与基础框架连接起来,上下游厂商基于DeepLink一次适配即可接入广泛的算法生态,实现软硬件解耦,破除生态壁垒。

  当下,大规模集群建设的同时,仍然存在软硬件优化适配不足、资源利用率低、供需失衡等问题。为更好的推进问题解决,上海AI实验室率先探索并研发了DeepLink超大规模跨域混训技术方案,通过训练加速、异构通信、并行策略等核心技术,打破芯片架构差异带来的协同壁垒,重构计算资源调度体系。

  今年2月,上海AI实验室联合包括商汤在内的十余家合作伙伴,于上海建成了超大规模跨域混训集群原型,并已在千亿量级参数的自研模型上,完成20天不间断长稳训练,效率达单一芯片集群的90%。此突破成果为快速实现智算中心互联、支撑超大模型混训提供可行技术保障。其中,商汤大装置为超大规模的混训集群提供了算力调度和管理平台,从而支持了多芯集群的稳定运行。

  基于DeepLink的异构混合调度方案的发布,是商汤大装置与上海AI实验室长期协作的重要成果。商汤大装置与DeepLink的深度融合,具备以下特点:

  ·         多芯片协同调度:可实现多种国产芯片之间的协同通信与统一调度,并自动进行并行策略优化和负载均衡,真正做到“不同芯片,同一平台”的协同工作,释放异构集群的计算潜力。

  ·         高效混训,稳定可控:显著提升了异构调度与弹性算力能力,以秒级弹性伸缩、分钟级故障恢复等,保障大模型训练过程稳定、高效、可控。

  ·         支持主流模型全流程运行:方案兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,适配稠密模型与MoE架构,支持训练与推理的高效执行。

  商汤大装置事业群产品总经理卢国强表示:“通过基于DeepLink的异构混合调度方案,商汤大装置将为更多GPU适配、训练和推理场景扩展、商业化落地提供更强助力。未来,商汤大装置将与上海人工智能实验室持续深化合作,加快国产AI算力芯片的适配与优化,共筑国产AI生态底座,为智能时代的产业升级注入源源不断的技术动能。”

标签: deepseek

“商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向” 的相关文章

放弃DeepSeek的用户 都跑哪去了

放弃DeepSeek的用户 都跑哪去了

  快科技8月5日消息,作为曾受关注的AI搜索原生应用,DeepSeek的用户流失现象引发行业关注。   QuestMobile数据显示deepseek,其月活跃用户规模...

DeepSeek预测:AC米兰VS博洛尼亚!红黑军团主场碾压?莱奥伤缺成X因素

DeepSeek预测:AC米兰VS博洛尼亚!红黑军团主场碾压?莱奥伤缺成X因素

  意甲第3轮焦点战,AC米兰将在圣西罗迎战博洛尼亚。目前米兰1胜1负积3分排名第8,而博洛尼亚同样1胜1负积3分排名第10。两队都急需一场胜利来冲击欧战区。   近5次...

DeepSeek-V3.1最新8大核心龙头企业,这篇文章帮你梳理清楚

DeepSeek-V3.1最新8大核心龙头企业,这篇文章帮你梳理清楚

  DeepSeek发布了其最新的大语言模型DeepSeek-V3.1,通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。  ...

Deepseek推荐全国旅游百强区第36名:福建厦门市集美区

Deepseek推荐全国旅游百强区第36名:福建厦门市集美区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

Deepseek发布V3.1 为何火的却是官方留言?

Deepseek发布V3.1 为何火的却是官方留言?

  【环球网科技报道 记者 李文瑶】8月21日,Deepseek宣布正式推出DeepSeek-V3.1,在混合推理架构、思考效率、Agent 能力等方面进行了全面升级。不过,最值得关注的是...

DeepSeek-R1训练方法发布!

DeepSeek-R1训练方法发布!

  DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能...