当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景209

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

DeepSeek爆火之后,“卖铲人” 赚得盆满钵满

国产大模型DeepSeek在2024年底的爆红盛况就不再阐述了,彼时市场目光都聚焦在这家新兴AI公司身上。随着大模型私有化部署需求激增,“卖铲人”们(在热门产业或风潮中,通过为相关产业提供设备、工具或...

燧原科技DeepSeek一体机亮相全球人工智能大会 低门槛高效率引关注

燧原科技DeepSeek一体机亮相全球人工智能大会 低门槛高效率引关注

在全球人工智能大会现场,国产智算力量不可忽视。燧原科技展台展示了DeepSeek一体机系列,该产品2025年初刚推出,支持国产CPU平台和多种场景调优能力。据悉,现场技术人员表示该产品的最大特点是低门...

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

 文 丨 新浪科技 周文猛  “DeepSeek很热,但它对企业的大影响还没全面到来。”  “许多企业拥抱AI,还要补数字化的课。”  “智能体归根结底是一个软件,规模化应用要有信息化基础”  “所有...

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

来源标题:金美信消费金融引入DeepSeek大模型,开启智能化新篇章近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数...

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

IT之家 6 月 9 日消息,OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布,OPPO 小布助手已率先升级 DeepSeek-R1 全新版本(海报显示为“最新版”),号称...

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践  每日甘肃网兰州讯(新甘肃·甘肃日报记者范海瑞通讯员雷璐)今年以来,酒泉市以DeepSeek大模型为技术支点,在政务服务、公共治理、产业升...