首页>>健康 >>内容

盘古药物模型像人一样学习一个分子

发布时间:2023-02-25 10:32:27编辑:愉快的缘分来源:

最近发表在《中国生命科学》杂志上的一项研究由乔南博士(华为云计算技术健康智能实验室)、江华良博士(中国科学院上海药物研究所)和明月博士领导郑(中国科学院上海药物研究所)。

盘古药物模型像人一样学习一个分子

“在过去的一年里,语言模型的参数规模持续增长,超过了1750亿个GPT3。最近,新一代语言模型ChatGPT以更真实的方式与用户交互,比如回答问题,承认错误、质疑不正确的问题或拒绝不适当的请求,甚至被认为会颠覆搜索引擎,”乔博士说。

除了语言模型,图像、视频和多模态等领域也在这几年被transformer架构同时更新。这些大型模型通常使用自监督学习,可以大大减少工作量并在长尾任务中取得更好的性能。然而,在药物发现的人工智能领域,还没有真正的大模型来加速药物研发和提高效率。

XinyuanLin和ZhaopingXiong与实验室主任NanQiao一起,寻求建立一个药物发现大模型,可用于分子特性预测、分子生成和优化等药物发现任务。该团队提出了一种新颖的图到序列(graph2seq)非对称结构,它不同于经典的序列到序列(seq2seq)和图到图(graph2graph)的变分自动编码过程。

该模型预训练了17亿个类药分子(目前最大),输入为类药分子的二维无向循环图,输出为对应的化学式或SMILES字符串。人类阅读化学结构的图像,并写下相应公式的文字,因此经过数十亿次重复,盘古可以了解化学结构与公式串之间的关系,类似于人类的认知转换。

在对17亿个类药小分子进行预训练后,该模型在包括分子特性预测在内的20项药物发现任务中取得了state-of-the-art的结果。(预测ADMET特性、化合物-蛋白质相互作用、药物-药物相互作用和化学反应产率)、分子生成和分子优化。

盘古分子发生器还生成了1亿个类药小分子的新药筛选库,新颖度达99.68%,也能有效生成理化性质与给定分布相似的新化合物。该库可用于补充现有的化合物数据库。此外,盘古分子优化器可以优化起始分子的化学结构,改善目标分子的特性。