当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

6个月前 (10-10)Deepseek最新资讯333

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

2025年度全球50家聪明公司榜单发布,DeepSeek、华为等中国企业入选

2025年度全球50家聪明公司榜单发布,DeepSeek、华为等中国企业入选

  DeepSeek、宇树科技、华为deepseek、小米、比亚迪、科大讯飞等多家中国企业成功入选,展现中国创新力量!   “聪明公司”不仅以技术驱动未来,更以商业智慧实...

11月17日DeepSeek预测:老鹰vs太阳,布克率队捍卫主场,太阳险胜老鹰

11月17日DeepSeek预测:老鹰vs太阳,布克率队捍卫主场,太阳险胜老鹰

  北京时间11月17日09:00,NBA常规赛将迎来一场东西部劲旅对决——亚特兰大老鹰客场挑战菲尼克斯太阳。两支球队目前战绩同为8胜5负,分列东部第5和西部第6,这场势均力敌的较量或将影...

2月26日DeepSeek预测:雷霆vs活塞,东西部榜首大战,亚历山大缺阵成关键

2月26日DeepSeek预测:雷霆vs活塞,东西部榜首大战,亚历山大缺阵成关键

  NBA常规赛即将迎来一场东西部榜首的巅峰对决,底特律活塞将在主场迎战俄克拉荷马雷霆。两支球队目前分别领跑东西部,活塞以42胜14负的战绩高居东部第一,雷霆则以45胜14负的战绩领跑西部...

12月30日DeepSeek预测:尼克斯vs鹈鹕,唐斯率队客场轻取锡安

12月30日DeepSeek预测:尼克斯vs鹈鹕,唐斯率队客场轻取锡安

  作为西部传统劲旅,鹈鹕本赛季表现令人失望,目前以8胜25负的战绩排名西部垫底。而东部豪强尼克斯则以22胜9负高居东部第二,两队实力差距明显。   鹈鹕本赛季攻防两端都...

2025年度AI创新应用DeepSeek

2025年度AI创新应用DeepSeek

  【#2025年度AI创新应用DeepSeek#】在上海举办的#2025中国AI盛典#中,年度AI创新应用正式揭晓——DeepSeek!作为首个全开源策略的应用,它能写代码、解难题、创诗...

DeepSeek公告:强化AI内容标识,防止信息误导

DeepSeek公告:强化AI内容标识,防止信息误导

  公告宣布,为贯彻落实《人工智能生成合成内容标识办法》(2025 年 9 月 1 日起施行)及《网络安全技术 人工智能生成合成内容标识方法》等国家标准的相关要求,防止 AI 生成内容可能...