首页>>生活 >>内容

科学家开发基于人工智能的方法来预测RNA修饰

发布时间:2023-02-10 14:47:23编辑:愉快的缘分来源:

来自科学,技术和研究局(A*STAR)和新加坡国立大学(NUS)的一组研究人员开发了一种软件方法,可以从基因组数据中准确预测RNA分子的化学修饰。他们的方法称为m6Anet,发表在NatureMethods上。

科学家开发基于人工智能的方法来预测RNA修饰

在RNA中,添加到RNA中的不同类型的化学分子决定了RNA分子的功能。然而,这些RNA变化对于科学家用来读取RNA的标准方法通常是不可见的。目前,已经发现了160多种RNA修饰,其中最普遍的RNA修饰-N6-甲基腺苷(m6A)-与癌症等人类疾病有关。

过去,鉴定RNA修饰需要耗时且费力的台式实验,而大多数实验室无法进行这些实验。此外,以前的方法未能在单分子分辨率下检测m6A,这对于理解涉及m6A的生物学机制至关重要。

该团队通过利用直接纳米孔RNA测序克服了这些限制,这是一种新兴技术,可将原始RNA分子及其RNA修饰一起测序。在这项研究中,他们开发了m6Anet,这是一种使用丰富的直接纳米孔RNA测序数据和多实例学习(MIL)方法训练深度神经网络的软件,以准确检测m6A的存在。

“在传统的机器学习中,我们通常为想要分类的每个示例提供一个标签。例如,每个图像要么是猫,要么不是猫,算法学习根据标签将猫图像与其他图像区分开来。检测m6A的问题在于,我们有大量的数据标签不明确。想象一下,有一个大型相册,其中一张猫照片隐藏在数百万张其他照片中,并试图识别该特定照片,而没有任何标签作为搜索的基础。幸运的是,这之前已经在机器学习文献中研究过,被称为MIL问题,“A*STAR新加坡基因组研究所(GIS)和新加坡国立大学数据科学研究所的博士生ChristopherHendra解释说,他是该研究的第一作者。

在这项研究中,研究小组证明m6Anet可以在跨物种的单个样品中以单分子分辨率高精度预测m6A的存在。

“我们的人工智能模型只看到了来自人类样本的数据,但它能够准确地识别RNA修饰,即使是来自该模型以前从未见过的物种的样本,”A*STAR的GIS计算转录组学实验室组长JonathanGöke博士说。“识别不同生物样品中RNA修饰的能力可用于了解它们在许多不同的应用中的作用,例如癌症研究或植物基因组学。

“看到如何利用理论基础和经过充分研究的机器学习技术(如MIL)为这一具有挑战性的问题提供优雅的解决方案,这是非常令人满意的。目睹软件被科学界如此迅速地采用是对我们的努力的奖励!“共同领导这项研究的新加坡国立大学理学院统计与数据科学系副教授AlexandreThiery说。

A*STAR的GIS执行董事PatrickTan教授说:“准确有效地识别RNA修饰一直是一个长期的挑战,而m6Anet有助于解决这些限制。为了使更广泛的科学界受益,这种人工智能方法以及研究结果已被公开,供其他科学家加速他们的研究。