经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
网站运营

新的机器学习模型可预测哪个基础编辑器在修复数千种致病突变方面表现最佳

作者:habao 来源: 日期:2020-6-17 0:54:16 人气:

  基因编辑技术正在变得比以往任何时候都更好,增长更快。新的和改进的基础编辑器(一种特别有效且精确的基因校正器)使这项技术更接近于治疗人类遗传疾病。但是,基础编辑器的繁荣带来了新的挑战:就像没有指南的巨大钥匙圈一样,科学家们可以花费大量时间来寻找最佳的工具来解决导致镰状细胞性贫血或早衰的遗传故障(快速疾病)。梦见和死去的亲人说话对于患者而言,时间实在太浪费了。

  “ 似乎每周都会有新的基础编辑出现,” David Liu,自然科学教授Thomas Dudley Cabot以及Broad大学和Howard Hughes医学研究所(HHMI)的核心研究所表示。“取得了巨大的进步,但是对于使用哪种基本编辑器,研究人员却产生了令人困惑的选择。”

  刘发明了基本编辑。如今天在Cell中所报道的,他和他的研究团队现在已经发明了一种合适的方法来识别最有可能实现所需编辑的方法。利用实验数据,从最流行的基础编辑器(BES)的11编辑在人类和小鼠细胞38000个多靶位点,他们创造了一个机器学习模型,准确地预测基础的编辑结果,刘说。该库名为BE-Hive,可供使用。但是,这项工作所产生的不仅仅是BE的完整目录。机器学习模型发现了人类没有注意到的新的编辑器属性和功能。

  “如果您打算使用基础编辑来纠正单个致病突变,” Liu实验室的博士后研究员,该研究的第一作者Mandana Arbab说,“您留下了很多可能的方法。要做到这一点,很难知道哪些最有可能起作用。”

  基本编辑器可能比其他形式的基因编辑更为精确,但是它们仍然会在预期的遗传靶标之外引起不必要的,通常是无法预测的编辑。每个编辑器都有自己的怪癖。不同类型的文件在较小或较大的编辑“窗口”(约2至5个字母宽的DNA片段)内运行。一些编辑器可能会超出或低于目标。其他人可能只更改给定窗口中两个As之一。

  “如果窗口中的序列是GACA,” Liu说,“而您正在使用腺嘌呤碱基编辑器来更改其中一个As,是否优先编辑另一个?”

  答案取决于碱基编辑器,配对的指导RNA(将编辑器运送至适当的DNA工作位点的伴侣)以及周围的DNA序列。为了所有这些复杂因素,该团队首先收集了大量数据。Arbab说,在大约一年的时间里,他们为细胞配备了超过38,000个DNA靶位点,然后用11种最受欢迎​​的碱基编辑器与指导RNA配对。治疗后,他们对细胞的DNA进行了测序,以收集有关每个碱基编辑者如何影响每个细胞的数十亿个数据点。

  为了分析这笔赏金,Max Max博士 麻省理工学院计算与系统生物学计划的学生,博德学院的,也是第一作者,设计并训练了机器学习模型,以预测每个基本编辑者的特殊偏心率。在之前的一项开创性研究中,Shen和他的实验室伙伴训练了一种不同的机器学习模型来分析来自另一个常见基因编辑工具CRISPR的数据,并消除了一个普遍的,认为该工具会产生不可预测的且通常无用的插入和删除,Shen说。相反,他们表明,即使人类无法预测这些插入和删除的,机器学习也可以。

  现在,研究人员可以将目标DNA序列放入Shen增强的机器学习模型 BE-Hive中,并查看在该目标上使用11种基础编辑器中的每一种的预期结果。刘说:“ BE-Hive预测到单个DNA序列水平,由那些作用于该靶位点的碱基编辑产生的产物分布是什么。”

  BE-Hive的一些预言甚至对基础编辑的发明者来说都是令人惊讶的。“有时候,” Liu说,“由于我们的灵长类动物大脑不够复杂而无法预测的原因,该模型可以准确地告诉我们,即使在编辑窗口中有两个C,该特定编辑器也只会编辑第二个C。 , 例如。”

  BE-Hive还了解了基本编辑器何时可以进行所谓的转换编辑:一些基本编辑器没有将C更改为T,而是将C更改为G或A,这是罕见的,异常的但可能有价值的怪癖。然后,研究人员使用BE-Hive纠正了174种引起疾病的突变,副产物最少。并且,他们使用BE-Hive发现了未知的基础编辑器属性,并使用它们设计了具有新功能的新颖工具,为不断增长的环添加了更多的遗传密钥。

  

推荐文章