当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

3周前 (02-15)Deepseek最新资讯35

  中国日报2月13日电(记者 程钰)2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

  在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek,支持多步规划与工具调用。

  Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

  随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

  目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处:全球首个混合线性架构万亿参数思考模型开源,感谢原作者,侵权必删!

标签: deepseek

“全球首个混合线性架构万亿参数思考模型开源” 的相关文章

2月28日DeepSeek预测:尼克斯vs雄鹿,字母哥缺阵恐难阻纽约双星

2月28日DeepSeek预测:尼克斯vs雄鹿,字母哥缺阵恐难阻纽约双星

  北京时间2月28日9:00,NBA常规赛将上演东部焦点战,雄鹿坐镇主场迎战尼克斯。尽管雄鹿坐拥字母哥、利拉德等巨星,但近期伤病潮或将改变比赛走势。   雄鹿(26胜3...

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

  消息面上,Eventbrite平台出售DeepSeek-R2门票,窗口期为8月16日至8月31日,但具体日期尚未官宣。Eventbrite是美国知名在线活动策划服务平台,主营业务为在线...

AI回答暗藏广告调查:商家称支持DeepSeek、豆包、元宝等,6600元就能包

AI回答暗藏广告调查:商家称支持DeepSeek、豆包、元宝等,6600元就能包

  对于网友担忧GEO行业“污染”大模型生态,胡铭轩认为,对于GEO商家来说,输出优质内容才能形成核心竞争力。不过,他也表示,目前GEO行业确实“鱼龙混杂”,其中不少人是希望赚一波快钱。...

1月14日DeepSeek预测:公牛vs火箭,杜兰特率队主场止颓,武切维奇难救主

1月14日DeepSeek预测:公牛vs火箭,杜兰特率队主场止颓,武切维奇难救主

  1月14日丰田中心将迎来一场关键对决,东部第10的公牛(18胜20负)挑战西部第7的火箭(22胜14负)。公牛距离附加赛区仅差1.5个胜场,而火箭正面临三连败危机,此役可能成为双方赛季...

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

  马斯克不爽自家Grok没有上推荐榜,炮轰苹果偏袒合作伙伴OpenAI,威胁要起诉苹果涉嫌垄断操纵应用商店,却被网友用中国应用DeepSeek光速打脸,更被自家的Grok...

12月16日DeepSeek预测:灰熊vs快船,莫兰特率队客场复仇,哈登伤情成X

12月16日DeepSeek预测:灰熊vs快船,莫兰特率队客场复仇,哈登伤情成X

  。尽管快船拥有哈登、伦纳德等超级巨星,但本赛季仅以6胜19负排名西部第13;而灰熊则以11胜14负暂列西部第9,仍在为季后赛席位奋力拼搏。   快船方面,哈登场均26...