当前位置:首页 > Deepseek最新资讯 > 正文内容

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

9个月前 (09-29)Deepseek最新资讯357

  光明网讯9月26日,在2025人工智能计算大会上,浪潮信息宣布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度。最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。

  随着Scaling Law持续推动模型能力跃升,以DeepSeek为代表的开源模型极大降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中,模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值deepseek,token成本决定了智能体的盈利能力。

  浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。

  浪潮信息最新公布,基于元脑SD200超节点AI服务器运行DeepSeek R1大模型,单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度率先进入“10毫秒时代”。

  元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。

  为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。

  浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。

  元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。

  未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息方面透露,将通过软硬件协同设计与深度优化,持续推动AI计算架构的创新与突破,不断实现token生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。(记者 战钊)原文出处:AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统,感谢原作者,侵权必删!

标签: deepseek

“AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统” 的相关文章

DeepSeek回答“搜巴黎奥运男乒冠军不是樊振东”:我的知识储备截止到2024

DeepSeek回答“搜巴黎奥运男乒冠军不是樊振东”:我的知识储备截止到2024

  2024年8月4日,央媒发布的《巴黎奥运会|夺金时刻:樊振东夺得乒乓球男单冠军》文中提到,巴黎奥运会乒乓球男单决赛中,樊振东击败瑞典选手莫雷高德,夺得冠军。   近日...

DeepSeek预测:诺丁汉森林vs曼联!姆贝莫天神下凡,红魔客场3-1碾压保级

DeepSeek预测:诺丁汉森林vs曼联!姆贝莫天神下凡,红魔客场3-1碾压保级

  英超第10轮即将迎来一场看似实力悬殊的对决——排名第18的诺丁汉森林主场迎战第6的曼联。尽管历史交锋中森林曾连续三次击败红魔,但本赛季两队状态可谓天壤之别:森林场均仅0.7球的进攻火力...

站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实

站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实

  智东西8月7日报道,昨天,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编...

焦点访谈|明年经济工作政策取向确立了这八个字!

焦点访谈|明年经济工作政策取向确立了这八个字!

  央视网消息(焦点访谈):刚刚闭幕的中央经济工作会议,对2026年经济工作进行了部署,明确了明年我国经济工作的方向和重点。良好的开局是成功的一半。作为“十五五”规划的开局之年,明年的经济...

【明日主题前瞻】DeepSeek下一代旗舰系统R2预计春节前后问世

【明日主题前瞻】DeepSeek下一代旗舰系统R2预计春节前后问世

  据媒体报道,DeepSeek近日发布论文,阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写,提出了名为“流形约束超连接”(mHC)的框架。作者称,该框架旨在提升可扩展...

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明

  快科技3月9日消息,此前传闻DeepSeek V4在上周发布,遗憾的是这事也没有发生,目前DeepSeek依然是官网更新了一个小模型,被网友成为DeepSeek V4 Lite。...