当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

9个月前 (07-10)Deepseek应用场景473

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

可孚医疗开源大模型接入DeepSeek

可孚医疗开源大模型接入DeepSeek

可孚医疗开源大模型接入DeepSeek 证券日报网讯 可孚医疗7月1日在互动平台回答投资者提问时表示,公司持续探索AI技术与医疗健康的融合创新,目前已完成DeepSeek开源大模型的接入与本地化部署。...

月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1

月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1

在科技圈最近炸开了一个不大不小的新闻——月之暗面公司昨天凌晨突然扔出个王炸,他们开发的Kimi-Dev-72B代码大模型在专业领域直接干翻了一众行业巨头。这个参数量只有720亿的AI程序员,在权威的S...

DeepSeek下载量暴跌背后:生态转型与长期价值之争

DeepSeek下载量暴跌背后:生态转型与长期价值之争

来源:AI文体通最新调研数据显示,人工智能应用DeepSeek在2025年第二季度的月均下载量同比暴跌72.2%,从第一季度的8111.3万次骤降至2258.9万次,引发市场对其发展前景的广泛担忧。然...

曲阜市打造全国首个 “信访+DeepSeek”大模型智慧平台

曲阜市打造全国首个 “信访+DeepSeek”大模型智慧平台

近年来,曲阜市将“和为贵”传统文化精髓融入信访实践,整合省市县三级资源,作为“信访工作法治化提升年”的有力举措,以智能化助力信息化、提升规范化、促进法治化,形成“数据贯通、智能联动”的数字化信访样板。...

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

【寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型】财联社6月26日电,寒武纪在互动平台表示,公司研发的产品是通用型智能芯片,可以适配包括DeepSeek在内的主流开源模型。...

IBM高管评生成式AI:DeepSeek热度难掩实际影响有限

IBM高管评生成式AI:DeepSeek热度难掩实际影响有限

6月13日,IBM大中华区董事长陈旭东对生成式AI发展发表观点。他表示,尽管DeepSeek等模型备受关注,但其对企业流程的实际改变和效率提升有限。目前,生成式AI在文生图、翻译、写代码等领域应用较多...