当前位置:首页 > Deepseek最新资讯 > 正文内容

Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122

6个月前 (12-23)Deepseek最新资讯142

  这套“豪华”集群由四台搭载 M3 Ultra 芯片的 Mac Studio 组成(两台配备 512GB 内存,两台配备 256GB 内存),通过 Thunderbolt 5 连接,构建了总容量达 1.5TB 的统一内存池,硬件总价值近 4 万美元(现汇率约合 28.2 万元人民币)。

  在多机集群中,节点间的通信速度往往决定了整体性能。传统的以太网连接通常受限于 10Gb/s 的带宽,而此次测试启用的 Thunderbolt 5 支持将带宽上限提升至 80Gb/s。

  更为关键的是,苹果在新系统中引入了 RDMA 技术。该技术无需经过对方 CPU 的繁琐处理,允许集群中的某个 CPU 节点直接读取其他节点的内存数据。

  这意味着四台 Mac 的内存资源被整合成一个巨大的共享池,极大地降低了延迟,为运行单个设备无法承载的超大语言模型(LLM)提供了硬件基础。

  测试还成功运行了万亿参数级别的 Kimi K2 Thinking 模型,四节点速度达到 28.3 tokens/s,验证了该方案在处理超大规模模型时的可用性。

  尽管测试结果令人振奋,但该方案仍存在一定门槛。首先是约 4 万美元的高昂成本,虽相比企业级 H100 集群具有价格优势deepseek,但对个人用户依然遥不可及。

  其次是 Thunderbolt 5 目前仅支持菊花链连接,缺乏专用交换机,限制了集群的无限扩展;此外,测试过程中也出现了基准测试报错等软件稳定性问题。

  不过,随着未来 M5 Ultra 芯片及 GPU 神经加速器的引入,结合 SMB Direct 等潜在功能的开放,Mac 集群有望成为 AI 研究机构和高带宽需求团队的高效解决方案。

  IT之家注:RDMA 全称为 Remote Direct Memory Access,直译为远程直接内存访问,是一种允许一台计算机直接读取或写入另一台计算机内存的技术。

  就像你不用打电话让同事发文件,而是直接把手伸进他的抽屉拿文件一样,过程中不需要对方的大脑(CPU)参与,因此速度极快、延迟极低,常用于高性能计算集群。

  Thunderbolt 5(雷雳 5)是英特尔发布的新一代连接标准,传输速度翻倍达到了 80Gb/s(特定模式下可达 120Gb/s),能像高速公路一样快速传输海量数据。

  雷雳 5 集群是指 macOS 现已支持多台电脑通过雷雳 5 端口互联,可将参数庞大的 AI 大语言模型分布运行在多台电脑上,不仅能够分担运算负载,还能够共享内存等硬件资源,同时系统还提升了 AI 运算的整体性能。

  特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

  特朗普宣布美军将建造“特朗普级”战舰:首舰将名为“无畏”,设想总共建造20至25艘该型战舰

  新华社政论:循道而行,推动建设一个更加美好的世界——以四大全球倡议为百年变局注入稳定性和确定性原文出处:Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122.6%,感谢原作者,侵权必删!

标签: deepseek

“Mac四集群开启RDMA后推理DeepSeek V3.1 AI模型速度提高122” 的相关文章

3月17日DeepSeek预测:灰熊vs公牛,吉迪三双率队主场复仇

3月17日DeepSeek预测:灰熊vs公牛,吉迪三双率队主场复仇

  公牛目前位列东部第12,距离附加赛区尚有5.5个胜场差,在常规赛仅剩15场的情况下,季后赛希望已十分渺茫。而西部第11的灰熊更是遭遇5连败,本赛季早已进入练兵模式。本场胜负对双方排名影...

DeepSeek预测:皇家马德里VS西班牙人!姆巴佩领衔银河战舰冲击五连胜,西班

DeepSeek预测:皇家马德里VS西班牙人!姆巴佩领衔银河战舰冲击五连胜,西班

  西甲第5轮焦点战即将打响,领头羊皇家马德里坐镇伯纳乌迎战黑马西班牙人。皇马目前4战全胜积12分领跑,而西班牙人3胜1平积10分排名第三,这场对决将直接影响榜首格局。...

高温空调选购指南,TCL空调小蓝翼C7新风空调解锁“清凉安睡”秘籍

高温空调选购指南,TCL空调小蓝翼C7新风空调解锁“清凉安睡”秘籍

  今年夏天,罕见的高温天气席卷全国,江浙沪、安徽、江西等地40℃高温频现。酷热难耐之下,空调成为每个家庭不可或缺的避暑“神器”,这就导致空调市场需求暴涨,不少地方甚至出现了一机难求的局面...

DeepSeek“上岗” 方城文旅智能升级

DeepSeek“上岗” 方城文旅智能升级

  “上午,探秘清初皇宫,漫步沈阳古街;下午,登高望远览古城,寻访金融旧时光;傍晚,登临百年钟楼deepseek,赏古城夜景……”咋样?这样的沈阳方城一日路线推荐是不是很靠谱?这还不算,就...

天风证券:DeepSeek V3.1版本正式发布,坚定看好中国AI投资机会

天风证券:DeepSeek V3.1版本正式发布,坚定看好中国AI投资机会

  表示,中国AI板块延续模型与应用双线共振的积极趋势,一方面,国产模型能力持续演进deepseek。DeepSeek发布V3.1版本,重点增强了代码理解与Agent任务的执行能力,Dee...

10月16日DeepSeek预测:独行侠vs湖人,东契奇率队险胜残阵紫金军团

10月16日DeepSeek预测:独行侠vs湖人,东契奇率队险胜残阵紫金军团

  在10月16日的NBA季前赛收官战中,西部新贵独行侠将造访加密球馆挑战传统豪门湖人。尽管是练兵性质的季前赛,但两队近期交锋火药味十足——过去5次常规赛交手湖人3胜2负稍占上风,其中3场...