当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

9个月前 (07-10)Deepseek应用场景472

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践每日甘肃网兰州讯(新甘肃·甘肃日报记者范海瑞通讯员雷璐)今年以来,酒泉市以DeepSeek大模型为技术支点,在政务服务、公共治理、产业升级等领域展开深...

宣亚国际:OrangeGPT接入了DeepSeek-R1大模型

宣亚国际:OrangeGPT接入了DeepSeek-R1大模型

证券日报网讯 宣亚国际7月14日在互动平台回答投资者提问时表示,公司OrangeGPT接入了DeepSeek-R1大模型,在文本生成领域,如文案创作、稿件撰写、视频脚本等业务场景的内容生成质量、场景适...

知乎直答接入DeepSeek R1最新版

知乎直答接入DeepSeek R1最新版

36氪获悉,5月30日,知乎宣布旗下AI搜索产品知乎直答正式接入DeepSeek R1-0528版本。5月28日晚,DeepSeek开启新版本测试。据介绍,DeepSeek R1-0528模型升级后,...

优刻得接入DeepSeek全系列模型适配工作

优刻得接入DeepSeek全系列模型适配工作

每经AI快讯,有投资者在投资者互动平台提问:传deepseekR2因算力短缺迟迟未发布,你司算力与deepseek公司合作进展的怎么样了,请加快推进与deepseek公司的算力合作。优刻得(68815...

ima已接入DeepSeek R1-0528

ima已接入DeepSeek R1-0528

5月29日,腾讯旗下AI 工作台产品ima迎来更新,全端接入深度思考模型DeepSeek R1-0528版本。用户无需更新,打开ima任意版本(包括电脑端、App、小程序),选择DeepSeek R1...

国网长乐区供电公司:开展DeepSeek办公节能增效培训

国网长乐区供电公司:开展DeepSeek办公节能增效培训

近日,国网长乐区供电公司联合长乐区总工会开展“DeepSeek办公节能增效”专题培训。活动邀请福建省数字经济促进会人工智能专业委员会副主任、秘书长、海峡(福州)职工创新创业创造中心特聘AI导师黄进授课...