当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

12个月前 (07-10)Deepseek应用场景479

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

AI大模型“上车” 多家车企接入DeepSeek-DeepSeek上车!吉利、极氪、岚图、智己等多家车企官宣

AI大模型“上车” 多家车企接入DeepSeek-DeepSeek上车!吉利、极氪、岚图、智己等多家车企官宣

今年春节,国产AI大模型DeepSeek以其强大的智能交互能力风靡全球。众多企业也纷纷接入DeepSeek大模型。2月9日,北京青年报记者获悉,目前已有多家车企官宣与DeepSeek大模型完成深度融合...

中昊芯英首批通过 DeepSeek 适配测试 :人工智能软硬件测试验证中心权威发布

中昊芯英首批通过 DeepSeek 适配测试 :人工智能软硬件测试验证中心权威发布

近日,由人工智能软硬件协同创新与适配验证中心(以下简称“人工智能软硬件测试验证中心”)、中国人工智能产业发展联盟联合举办的 2025 年人工智能软硬件协同创新高级别研讨会暨中国人工智能产业发展联盟第十...

有没有觉得Deepseek最近没那么火了?

有没有觉得Deepseek最近没那么火了?

个问题其实早几天我跟我媳妇讨论过,起因是我觉得现在我用Deepseek越来越少,基本上都不怎么用了,但是我媳妇觉得她用的还是挺多的。所以我们就聊了聊为什么现在觉得Deepseek没那么火了。结果正好今...

华为云王丰:DeepSeek实践验证,“三个臭皮匠抵个诸葛亮”

华为云王丰:DeepSeek实践验证,“三个臭皮匠抵个诸葛亮”

“2025(第二十四届)中国互联网大会”于7月23日-25日在北京举行。华为云产业发展总裁王丰出席并演讲。  王丰表示,DeepSeekR1出现之后,大家都知道16个千亿专家和256个26亿专家二者能...

拉芳家化:2025年初开始在办公流程中使用DeepSeek技术

拉芳家化:2025年初开始在办公流程中使用DeepSeek技术

证券之星消息,拉芳家化(603630)07月17日在投资者关系平台上答复投资者关心的问题。投资者:为评估公司价值,请说明1.是否在办公、研发、客户服务或业务流程中应用AI技术?(a)是(b)否2.若应...

346款生成式AI完成备案,DeepSeek日活突破3000万

346款生成式AI完成备案,DeepSeek日活突破3000万

346款生成式AI完成备案,DeepSeek日活突破3000万据央视新闻报道,中国互联网络信息中心(CNNIC)在京发布第56次《中国互联网络发展状况统计报告》。2025年上半年,生成式人工智能产品在...