当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

16小时前Deepseek应用场景39

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

马云再次现身引热议!DeepSeek爆火,阿里巴巴能否借势AI?

《科创板日报》2月11日讯(记者 黄心怡)今日,阿里巴巴创始人马云再度现身阿里园区。《科创板日报》记者了解到,马云出现在夸克所处的阿里智能信息事业群,与员工交流。今日港股开盘后,阿里股价一度上涨触及1...

深耕DeepSeek领域 引领行业智能化变革

深耕DeepSeek领域 引领行业智能化变革

在“东数西算”工程与东北全面振兴战略的交汇点上,辽宁电信以DeepSeek人工智能技术为支点,构建起“智算筑基—场景突破—生态聚合”的创新发展体系,成为东北地区AI产业升级的关键推动者。生态辐射构建东...

见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更

见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更

【新智元导读】终于等到了DeepSeek-R1-0528官宣。升级后的模型性能直逼o3和Gemini 2.5 Pro。如今,DeepSeek真正坐实了全球开源王者的称号,并成为了第二大AI实验室。昨晚...

月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1

月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1

在科技圈最近炸开了一个不大不小的新闻——月之暗面公司昨天凌晨突然扔出个王炸,他们开发的Kimi-Dev-72B代码大模型在专业领域直接干翻了一众行业巨头。这个参数量只有720亿的AI程序员,在权威的S...

转运,DeepSeek有妙招!

转运,DeepSeek有妙招!

别扯什么“改运”,先搞明白这几件事最近“改运”这词儿又火了,也不知道是哪个犄角旮旯冒出来的“大师”又开始忽悠人了。说实话,这年头,谁不想走点儿好运?但要是指望烧香拜佛、念念咒语就能心想事成,那还不如直...

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型

【寒武纪:公司产品可以适配包括DeepSeek在内的主流开源模型】财联社6月26日电,寒武纪在互动平台表示,公司研发的产品是通用型智能芯片,可以适配包括DeepSeek在内的主流开源模型。...