当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个混合线性架构万亿参数思考模型开源

2个月前 (02-15)Deepseek最新资讯62

  中国日报2月13日电(记者 程钰)2月13日,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。

  在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理deepseek,支持多步规划与工具调用。

  Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

  随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

  目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。原文出处:全球首个混合线性架构万亿参数思考模型开源,感谢原作者,侵权必删!

标签: deepseek

“全球首个混合线性架构万亿参数思考模型开源” 的相关文章

内事也可问DeepSeek

内事也可问DeepSeek

  去超市买菜,我在收银台看到一个熟悉的身影,她左手拿着一块蛋糕,右手接过大把零钱胡乱塞进兜里,快速溜走。我心怀疑惑,回家检查了抽屉里的现金,果然少了100元。心里一紧,女儿咋变成了“偷东...

DeepSeek崩了引热议,官方深夜回应:网页API已恢复

DeepSeek崩了引热议,官方深夜回应:网页API已恢复

  8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题”DeepSeek崩了“反馈服务异常。根据DeepSeek在官网发布...

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

  NBA常规赛即将迎来一场东部对决,克利夫兰骑士队将客场挑战纽约尼克斯队。作为上赛季东部第四的强队,骑士在新赛季首战中将面对状态火热的尼克斯,这场比赛无疑充满看点。  ...

刚刚,DeepSeek最新发文!V3R1训练细节全公开,信息量巨大

刚刚,DeepSeek最新发文!V3R1训练细节全公开,信息量巨大

  【新智元导读】新规第一天,DeepSeek第一时间站出来了!接下来,所有自家AI生成内容,统统标出「AI身份」。更劲爆的是,DeepSeek主动「交底」V3/R1的模型训练细节。...

11月4日DeepSeek预测:国王vs掘金,约基奇率队主场轻取残阵国王

11月4日DeepSeek预测:国王vs掘金,约基奇率队主场轻取残阵国王

  北京时间11月4日10:00,NBA常规赛将迎来西部第6的掘金主场迎战第12的国王。卫冕冠军掘金(3胜2负)近期状态起伏但底蕴犹存,而国王(2胜4负)虽刚终结雄鹿却面临严重伤病困扰。本...

DeepSeek预测:乌迪内斯vs那不勒斯!霍伊伦德能否轰碎弗留利防线?

DeepSeek预测:乌迪内斯vs那不勒斯!霍伊伦德能否轰碎弗留利防线?

  北京时间12月14日晚22:00,意甲第15轮将迎来一场焦点对决,乌迪内斯坐镇弗留利球场迎战联赛第二的那不勒斯。目前那不勒斯与AC米兰同积31分并列榜首,而乌迪内斯仅排名第11位,距离...