当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

4个月前 (02-15)Deepseek最新资讯69

  中国日报2月13日电(记者 程钰)2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

  在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek,支持多步规划与工具调用。

  Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

  随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

  目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处:全球首个混合线性架构万亿参数思考模型开源,感谢原作者,侵权必删!

标签: deepseek

“全球首个混合线性架构万亿参数思考模型开源” 的相关文章

DeepSeek预测:尤文图斯VS拉齐奥!斑马军团主场碾压?伊尔迪兹火力全开!

DeepSeek预测:尤文图斯VS拉齐奥!斑马军团主场碾压?伊尔迪兹火力全开!

  意甲第24轮焦点战,尤文图斯将在安联球场迎战拉齐奥。主队目前以45分排名第4,距离榜首国际米兰10分,但仅领先第5名罗马2分;客队拉齐奥积32分排名第8,距离欧战区尚有9分差距。此役对...

国产AI助手DeepSeek交互风格转变引争议

国产AI助手DeepSeek交互风格转变引争议

  近日,国产AI助手DeepSeek因技术升级后交互风格从细腻共情转向简洁理性deepseek,被用户吐槽“变冷淡”,引发全网关于“AI是否在假装关心”的热议,甚至催生出话题#DeepS...

破解AI“安全与性能”难题!DeepSeek-R1-Safe基础大模型在华为全联

破解AI“安全与性能”难题!DeepSeek-R1-Safe基础大模型在华为全联

  9月18日,华为全联接大会2025在上海盛大开幕。会上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。在中国工程院院士陈...

2月6日DeepSeek预测:黄蜂vs火箭,申京率队捍卫主场,火箭险胜5分

2月6日DeepSeek预测:黄蜂vs火箭,申京率队捍卫主场,火箭险胜5分

  NBA常规赛即将迎来一场东西部球队之间的较量,夏洛特黄蜂将客场挑战休斯顿火箭。这场比赛将在北京时间2月6日上午9点打响,两支球队目前都处于季后赛席位争夺的关键阶段,这场比赛对于双方来说...

从展厅到政务大厅,数字人厂商世优科技多元场景规模化落地实践

从展厅到政务大厅,数字人厂商世优科技多元场景规模化落地实践

  在2025年,如果你走进北京丰台区政务服务中心,可能会遇到一位特殊的“公务员”——“丰小数”。它身着正装,面带微笑,7x24小时在线,用多语言甚至方言解答着办事群众的疑问。它并非真人,...

11月18日DeepSeek预测:雷霆vs鹈鹕,西部霸主或轻取副班长,亚历山大对

11月18日DeepSeek预测:雷霆vs鹈鹕,西部霸主或轻取副班长,亚历山大对

  新奥尔良鹈鹕坐镇主场迎来俄克拉荷马雷霆的挑战,这是本赛季西部第一与倒数第一的悬殊对决。鹈鹕作为知名球队却深陷泥潭,近期遭遇5连败且场均净负14.6分,而雷霆则携5连胜之势,以联盟第一的...