当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek同款“外挂大脑”进军生命科学!国内团队发布Gengram,破解D

5个月前 (02-02)Deepseek最新资讯96

  不仅刷新了多项基因组任务的SOTA记录,让模型在剪接位点识别等任务上AUC提升16.1%,还能自己悟出DNA双螺旋的物理规律

  在生物学中,很多DNA的功能元件(如启动子、剪接位点)往往由特定的碱基组合(Motif)决定,但目前主流的基因组大模型都采用单碱基分词的形式,也就是把DNA序列拆成一个个碱基来处理。这种方式虽然精准,但效率极低。

  就像我们看“刻舟求剑”,是一眼看懂成语的含义,而不是先分析“刻”字有几笔,“舟”字怎么写,然后一个字一个字拼在一起,这不仅浪费算力,还容易让模型在长达数亿的碱基序列中迷路。

  今年1月13日,DeepSeek发布的Engram论文在圈内引发热议,其核心是减少“死记硬背”的任务,交给一个外部查表机制。受此启发,Genos团队提出了Gengram,成功将这一模式引入基因组学,实现了“静态模体识别”与“动态语境推理”的结构解耦。

  外置“基因字典”(显式存储):团队预构建了一个涵盖1~6碱基长度的哈希字典,将生物学中常见的短序列组合存入其中。当模型读取序列时,可以直接检索相关的生物学先验知识,不再需要从零推导。

  动态门控机制:AI学会了“看人下菜碟”。在编码区或关键调控区,门控高度激活,积极调用记忆库;而在广袤的无功能背景区,门控则保持抑制,减少计算干扰。

  在测试过程中deepseek,研究团队发现了一个很有意思的现象,Gengram在训练时,会通过一个局部窗口来聚合信息。研究人员发现,当这个窗口大小设定为21bp(碱基对)时,模型性能达到最优。

  我们知道,DNA是双螺旋结构,旋转一圈大约是10.5个碱基,21个碱基恰好转了2圈。这意味着,相隔21bp的两个碱基,在三维空间中恰好位于螺旋的同一侧,面对相似的生化环境,共同决定了蛋白质(如转录因子)如何结合到DNA上。

  也就是说,Gengram通过这种设计,让AI在处理一维序列时,隐约也看见了DNA的三维空间。

  Gengram是一个极轻量的插件,参数仅约20M,相对于100亿参数的模型微乎其微,却对模型能力有了极大的提升。

  出色的模型数据能效比:在与多款主流DNA基础模型的横向测评中,集成Gengram的模型仅需极小规模的训练数据,便能在核心任务上媲美乃至超越训练数据规模领先其数倍乃至数十倍的公开模型。

  这篇文章里的实验,大多基于人类基因组基础模型Genos来实现。Genos是研发团队于去年10月发布的全球首个百亿级人类基因组基础模型,目前已应用于华大基因面向遗传病临床检测的大语言模型GeneT,助力提高遗传病分析解读的水平。

  这支低调的团队结合了华大生命科学研究院的组学大数据经验,与之江实验室的计算和模型能力。这种“数据+算力”的强强联合,正是目前攻克AI for Science领域壁垒的关键配置。

  如果说DeepSeek证明了通用AI的极限,那么Genos团队则用行动展示了当AI深度对齐生物学逻辑时,我们离真正读懂“生命之书”又近了一大步。

  /2月2日周末要闻:特朗普释放与伊朗谈判信号 欧佩克+3月继续暂停增产 比特币跌破7.6万美元

  /现货白银最大跌近10%,黄金跌超3%!比特币跌破76000美元,全球超16万人被爆仓!美股股指期货下跌

  /十大机构看后市:本轮ETF集中赎回潮结束,A股有望在春节前企稳,春节前后迎新一轮上行行情,2月上涨概率76%

  /上市公司“炒股”倒亏2亿,年薪43万董事长承诺自掏腰包“填坑”,补足投资差额,一个月内先上缴5000万原文出处:DeepSeek同款“外挂大脑”进军生命科学!国内团队发布Gengram,破解DNA天书,让我们离读懂“生命之书”又近了一大步,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek同款“外挂大脑”进军生命科学!国内团队发布Gengram,破解D” 的相关文章

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

  国产算力突破:DeepSeek V3.1显存带宽降50%,FP8技术推理吞吐提2.3倍;2025年市场规模破200亿,国产芯片渗透率30%deepseek。原文出处:DeepSeek...

DeepSeek预测:皇家马德里vs摩纳哥!姆巴佩9球屠杀or黑马逆袭?

DeepSeek预测:皇家马德里vs摩纳哥!姆巴佩9球屠杀or黑马逆袭?

  在36队混战的欧冠联赛阶段,皇马以4胜2负积12分暂列第7,距离直接晋级区仅差1分。银河战舰打进13球(赛事第9)丢7球(赛事第8),场均轰出19.2次射门(赛事第2)的恐怖火力下,姆...

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

  据知情人士透露,DeepSeek正在开发具有更先进代理功能的人工智能AI模型,以与诸如OpenAI等美国同行在这个技术领域的一个新前沿展开竞争。   知情人士表示,这...

您的AI智能工作台已升级!鸿蒙版ima率先接入DeepSeek V3.1,效率飞

您的AI智能工作台已升级!鸿蒙版ima率先接入DeepSeek V3.1,效率飞

  8月21日DeepSeek正式发布V3.1并宣布开源。鸿蒙版ima第一时间接入了DeepSeek-V3.1deepseek,为用户带来更强大、更智能的AI使用体验。...

12月13日DeepSeek预测:爵士vs灰熊,马尔卡宁能否带队终结五连败?

12月13日DeepSeek预测:爵士vs灰熊,马尔卡宁能否带队终结五连败?

  西部两支季后赛边缘球队将在孟菲斯展开较量,爵士(8胜15负,西部第12)挑战灰熊(11胜13负,西部第9)。本赛季双方胜场差3场,此役对季后赛卡位战具有关键意义。  ...

盈建科:AI产品支持Qwen、DeepSeek等基础模型,构建知识管理等技术生态

盈建科:AI产品支持Qwen、DeepSeek等基础模型,构建知识管理等技术生态

  有投资者在互动平台向盈建科提问:“尊敬的董秘您好,贵司AI产品有没有接入Deepseek,智谱AI,通义千问等大模型?谢谢deepseek!”   针对上述提问,盈建...