当前位置:首页 > Deepseek最新资讯 > 正文内容

Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122

6个月前 (12-23)Deepseek最新资讯141

  这套“豪华”集群由四台搭载 M3 Ultra 芯片的 Mac Studio 组成(两台配备 512GB 内存,两台配备 256GB 内存),通过 Thunderbolt 5 连接,构建了总容量达 1.5TB 的统一内存池,硬件总价值近 4 万美元(现汇率约合 28.2 万元人民币)。

  在多机集群中,节点间的通信速度往往决定了整体性能。传统的以太网连接通常受限于 10Gb/s 的带宽,而此次测试启用的 Thunderbolt 5 支持将带宽上限提升至 80Gb/s。

  更为关键的是,苹果在新系统中引入了 RDMA 技术。该技术无需经过对方 CPU 的繁琐处理,允许集群中的某个 CPU 节点直接读取其他节点的内存数据。

  这意味着四台 Mac 的内存资源被整合成一个巨大的共享池,极大地降低了延迟,为运行单个设备无法承载的超大语言模型(LLM)提供了硬件基础。

  测试还成功运行了万亿参数级别的 Kimi K2 Thinking 模型,四节点速度达到 28.3 tokens/s,验证了该方案在处理超大规模模型时的可用性。

  尽管测试结果令人振奋,但该方案仍存在一定门槛。首先是约 4 万美元的高昂成本,虽相比企业级 H100 集群具有价格优势deepseek,但对个人用户依然遥不可及。

  其次是 Thunderbolt 5 目前仅支持菊花链连接,缺乏专用交换机,限制了集群的无限扩展;此外,测试过程中也出现了基准测试报错等软件稳定性问题。

  不过,随着未来 M5 Ultra 芯片及 GPU 神经加速器的引入,结合 SMB Direct 等潜在功能的开放,Mac 集群有望成为 AI 研究机构和高带宽需求团队的高效解决方案。

  IT之家注:RDMA 全称为 Remote Direct Memory Access,直译为远程直接内存访问,是一种允许一台计算机直接读取或写入另一台计算机内存的技术。

  就像你不用打电话让同事发文件,而是直接把手伸进他的抽屉拿文件一样,过程中不需要对方的大脑(CPU)参与,因此速度极快、延迟极低,常用于高性能计算集群。

  Thunderbolt 5(雷雳 5)是英特尔发布的新一代连接标准,传输速度翻倍达到了 80Gb/s(特定模式下可达 120Gb/s),能像高速公路一样快速传输海量数据。

  雷雳 5 集群是指 macOS 现已支持多台电脑通过雷雳 5 端口互联,可将参数庞大的 AI 大语言模型分布运行在多台电脑上,不仅能够分担运算负载,还能够共享内存等硬件资源,同时系统还提升了 AI 运算的整体性能。

  特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

  特朗普宣布美军将建造“特朗普级”战舰:首舰将名为“无畏”,设想总共建造20至25艘该型战舰

  新华社政论:循道而行,推动建设一个更加美好的世界——以四大全球倡议为百年变局注入稳定性和确定性原文出处:Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122.6%,感谢原作者,侵权必删!

标签: deepseek

“Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122” 的相关文章

纪事报:纽卡对等待利物浦筹集资金签伊萨克感到愤怒

纪事报:纽卡对等待利物浦筹集资金签伊萨克感到愤怒

  据纪事报消息,利物浦将用出售努涅斯和迪亚斯的资金来竞购伊萨克,纽卡高层对等待利物浦筹集资金感到愤怒。   消息称,随着塞斯科转会曼联的可能性不断增加,纽卡求购前...

12月5日DeepSeek预测:凯尔特人vs奇才,绿军双星闪耀客场轻取奇才

12月5日DeepSeek预测:凯尔特人vs奇才,绿军双星闪耀客场轻取奇才

  作为NBA历史悠久的知名球队,华盛顿奇才本赛季陷入泥沼,目前以3胜17负的惨淡战绩稳居东部垫底。而波士顿凯尔特人则以12胜9负位列东部第六,正为季后赛席位全力冲刺。此役胜负将直接影响双...

12月13日DeepSeek预测:老鹰vs活塞,东部榜首大战,康宁汉姆率队捍卫主

12月13日DeepSeek预测:老鹰vs活塞,东部榜首大战,康宁汉姆率队捍卫主

  北京时间12月13日,NBA常规赛将迎来一场东部焦点战,目前高居东部榜首的底特律活塞将在主场迎战亚特兰大老鹰。两支球队本赛季表现迥异,活塞以19胜5负的傲人战绩领跑东部,而老鹰则以14...

性能再提升!蓝耘元生代MaaS平台多个模型服务性能登顶AI Ping榜首

性能再提升!蓝耘元生代MaaS平台多个模型服务性能登顶AI Ping榜首

  当AI大模型推理速度逐渐成为影响企业应用效能的关键指标时,每一单位tokens/s的性能提升,都意味着用户体验的质变。   2026年1月27日,权威AI性能测试平台...

Deepseek推荐全国旅游百强区第60名:广西南宁市江南区

Deepseek推荐全国旅游百强区第60名:广西南宁市江南区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

万亿科创沃土赋能,六联智能剑指2026百亿营收与1500万台AI终端双目标

万亿科创沃土赋能,六联智能剑指2026百亿营收与1500万台AI终端双目标

  2026年2月1日扎根南山的六联智能迎来“一起来,聚力AI”18周年感恩盛典暨2025年终答谢晚宴,活动在前海会议中心盛大举办。现场正式官宣2026年百亿营收与1500万台AI终端出货...