盘古药物模型像人一样学习一个分子

发布时间：2023-02-25 10:32:27编辑：愉快的缘分来源：

最近发表在《中国生命科学》杂志上的一项研究由乔南博士(华为云计算技术健康智能实验室)、江华良博士(中国科学院上海药物研究所)和明月博士领导郑(中国科学院上海药物研究所)。

盘古药物模型像人一样学习一个分子

“在过去的一年里，语言模型的参数规模持续增长，超过了1750亿个GPT3。最近，新一代语言模型ChatGPT以更真实的方式与用户交互，比如回答问题，承认错误、质疑不正确的问题或拒绝不适当的请求，甚至被认为会颠覆搜索引擎，”乔博士说。

除了语言模型，图像、视频和多模态等领域也在这几年被transformer架构同时更新。这些大型模型通常使用自监督学习，可以大大减少工作量并在长尾任务中取得更好的性能。然而，在药物发现的人工智能领域，还没有真正的大模型来加速药物研发和提高效率。

XinyuanLin和ZhaopingXiong与实验室主任NanQiao一起，寻求建立一个药物发现大模型，可用于分子特性预测、分子生成和优化等药物发现任务。该团队提出了一种新颖的图到序列(graph2seq)非对称结构，它不同于经典的序列到序列(seq2seq)和图到图(graph2graph)的变分自动编码过程。

该模型预训练了17亿个类药分子(目前最大)，输入为类药分子的二维无向循环图，输出为对应的化学式或SMILES字符串。人类阅读化学结构的图像，并写下相应公式的文字，因此经过数十亿次重复，盘古可以了解化学结构与公式串之间的关系，类似于人类的认知转换。

在对17亿个类药小分子进行预训练后，该模型在包括分子特性预测在内的20项药物发现任务中取得了state-of-the-art的结果。(预测ADMET特性、化合物-蛋白质相互作用、药物-药物相互作用和化学反应产率)、分子生成和分子优化。

盘古分子发生器还生成了1亿个类药小分子的新药筛选库，新颖度达99.68%，也能有效生成理化性质与给定分布相似的新化合物。该库可用于补充现有的化合物数据库。此外，盘古分子优化器可以优化起始分子的化学结构，改善目标分子的特性。

标签：模型分子药物