当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

9个月前 (10-10)Deepseek最新资讯336

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

DeepSeek严正声明!任何要求用户私下转账的行为均属诈骗

DeepSeek严正声明!任何要求用户私下转账的行为均属诈骗

  9月17日晚,深度求索(DeepSeek)发布声明指出,近期,有不法分子冒充“深度求索”公司或在职员工,伪造工牌deepseek、营业执照等材料,在   据了解,De...

亨利:说阿森纳是小俱乐部都是不懂球的,哲凯赖什的加盟让阿森纳有机会拿英超和欧冠。

亨利:说阿森纳是小俱乐部都是不懂球的,哲凯赖什的加盟让阿森纳有机会拿英超和欧冠。

  我和很多阿森纳球员最近都聊过,萨卡、厄德高、萨利巴,包括赖斯,他们都希望能在阿森纳拿下欧冠冠军,我认为这是一个好兆头。   我之前说过,我希望阿森纳能拿下今年的英超冠...

11月13日DeepSeek预测:奇才vs火箭,火箭主场大胜?杜兰特与萨尔对决

11月13日DeepSeek预测:奇才vs火箭,火箭主场大胜?杜兰特与萨尔对决

  北京时间11月13日,NBA常规赛将迎来一场东西部强弱分明的对决——华盛顿奇才客场挑战休斯顿火箭。目前奇才以1胜10负的战绩排名东部垫底,而火箭则以6胜3负高居西部第五。从历史交锋到近...

DeepSeek新模型将至?创业板人工智能ETF南方(159382)上涨2.21

DeepSeek新模型将至?创业板人工智能ETF南方(159382)上涨2.21

  消息面上,1月20日,国新办举行新闻发布会介绍2025年工业和信息化发展成效。相关负责人表示,目前人工智能(AI)已渗透领航级智能工厂70%以上的业务场景,沉淀了超6000个垂直领域模...

数智赋能:温江区城运中心打造12345热线治理新范式

数智赋能:温江区城运中心打造12345热线治理新范式

  工单智能分派效率提升40%,风险预警从“被动响应”转向“主动治理”,民生诉求实现“一网统管”——温江区城运中心正以数字技术重塑城市治理生态。   走进温江区城运中心指...

又强大又便宜!DeepSeek V3.2又让谷歌和OpenAI慌了

又强大又便宜!DeepSeek V3.2又让谷歌和OpenAI慌了

  12月1日晚,DeepSeek突然来了一波更新:V3.2版本正式上线并向所有用户开放,同时也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官方公布的测试结果来看,Deep...