当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

12个月前 (07-10)Deepseek应用场景480

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

AI 领域“氢弹级”突破:DeepSeek只是开胃小菜?LPU惊艳世界

AI 领域“氢弹级”突破:DeepSeek只是开胃小菜?LPU惊艳世界

导读:AI 领域“氢弹级”突破:DeepSeek只是开胃小菜?LPU惊艳世界当DeepSeek-R1横空出世,华尔街曾陷入了短暂的恐慌。然而资本巨头们很快达成共识:“即便模型效率提升,deepseek...

福建省闽侯县市场监管局用DeepSeek升级智能政务助力企业开办“零跑动”

福建省闽侯县市场监管局用DeepSeek升级智能政务助力企业开办“零跑动”

中国质量新闻网讯 在数字化浪潮奔涌向前的当下,福建省福州市闽侯县市场监管局积极作为,携手闽侯县政务服务中心与中国电信闽侯公司,借助DeepSeek人工智能大模型,为政务服务装上“智慧引擎”,全力推动政...

DeepSeek使用率暴跌至3%,新模型未推出或成主因

DeepSeek使用率暴跌至3%,新模型未推出或成主因

近日,据国际知名半导体研究机构 Semianalysis 数据显示,DeepSeek 的用户使用率已从年初 7.5% 的峰值明显回落,官网流量同期下滑近三成,其使用率由过年时 7.5%的高点下滑到如今...

DeepSeek最新预警:5大HR高危岗位名单曝光!第1个淘汰率突破85%…

DeepSeek最新预警:5大HR高危岗位名单曝光!第1个淘汰率突破85%…

“不是所有HR都会被淘汰,但固守传统工作模式的从业者注定出局。”‌晚上8点,李婷关掉电脑,揉了揉发酸的眼睛。作为一家中型企业的招聘专员,她刚刚结束今天的第20场初面——从早上9点到现在,她机械地重复着...

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

金美信消费金融引入DeepSeek大模型,开启智能化新篇章

近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全新阶段。此次技术升级不仅夯实了公司数字化底层能力,更依托生成式AI技术的创新应用,实现办公效率与业务处理...

DeepSeek爆火,最应该关注的十大走向

DeepSeek爆火,最应该关注的十大走向

作 者丨孔海丽、赵云帆编 辑丨朱益民DeepSeek火成了现象级,中国公司在全球AI竞技场投下一枚"算法裂变弹"。当硅谷巨头们仍在算力军备竞赛中重兵鏖战,中国工程师用"更...