首页>>生活 >>内容

新的化学工具包加速了溶液中分子的分析

发布时间:2022-11-30 18:23:01编辑:愉快的缘分来源:

一个新的开源工具包在解决方案阶段自动化计算分子特性的过程,为化学及其他领域的人工智能设计和发现扫清新途径。《化学物理杂志》发布了由埃默里大学的理论化学家开发的免费开源工具包。

新的化学工具包加速了溶液中分子的分析

该工具包被称为AutoSolvate,可以加快创建大型、高质量数据集的速度,这些数据集需要在从可再生能源到人类健康的各个方面取得进步。

“通过使用我们的自动化工作流程,研究人员可以快速生成比传统方法多10倍甚至100倍的数据,”埃默里化学助理教授、该论文的通讯作者刘芳说。“我们希望许多研究人员能够使用我们的工具包来对溶液中的分子进行高通量模拟和数据管理。”

Liu补充说,此类数据集将为应用最先进的机器学习技术提供基础,以推动广泛的科学努力中的创新。

该论文的第一作者是Liu实验室的博士后EugenHruska。共同作者包括埃默里大学博士。候选人ArielGale和XiaoHuang,他们在埃默里大学读本科时参与了这篇论文,现在是杜克大学化学专业的研究生。

探索量子世界

作为一名理论化学家,Liu领导着一个专门研究计算量子化学的团队,包括建模和破译分子特性以及溶液相中的反应。

世界变得更加复杂,因为它缩小到原子和小分子的尺度,其中量子力学描述了能量和物质的波粒二象性。

理论化学家使用超级计算机来模拟分子结构和反应过程中可能发生的大量相互作用,以便他们可以预测分子在特定条件下的行为方式。了解这些动力学是为各种应用识别有前途的分子和有效驱动反应的关键。

研究人员已经为气相中许多分子的特性生成了数据集。然而,尽管大多数反应发生在溶液中,但在大数据和机器学习的背景下,溶液阶段的分子特性仍然相对未被探索。

问题是研究溶液中的分子需要更多的时间和精力。

一个复杂的过程

“在气相中,分子彼此相距很远,”刘解释说,“所以当我们研究感兴趣的分子时,我们不必考虑它的邻居。”

然而,在溶液相中,一个分子与许多其他分子紧密地浸在一起,使系统变得更大。“想象一个溶剂分子被一层又一层的水分子包围,”刘说。“根据其大小和结构,一个分子可能被数十个甚至数百个水分子覆盖。在如此大的系统中,计算速度会很慢,甚至可能不可行。”

在为溶液相中的分子运行量子化学程序之前,有必要首先确定分子的几何形状以及周围溶剂分子的位置和方向。

“这个过程很难做到,”刘说。“这需要花费大量时间和精力,而且非常复杂,以至于研究人员只能对一篇论文中他们关心的几个系统进行这种计算,”刘说。

她补充说,在过程的每个步骤中也可能出现技术问题,从而导致结果出现错误。

简化的解决方案

Liu和她的同事用他们的自动化系统AutoSolvate取代了执行这些计算所需的复杂步骤。

以前,计算化学家可能必须将数百行代码输入超级计算机才能运行模拟。然而,AutoSolvate的命令行界面只需要几行代码即可自动进行数百次计算。

“运行模拟的时间可能很长,但这是计算机的工作,”刘说。“我们将研究人员从大部分繁琐的手动数据输入任务中解放出来,使他们可以专注于分析结果和其他创造性工作。”

除了面向更有经验的理论化学家的命令行界面外,AutoSolvate还包括一个直观的图形界面,适合正在学习运行模拟的研究生。

实验室现在可以有效地为溶剂化分子生成许多数据点,然后使用数据集来构建用于化学设计和发现的机器学习模型。AutoSolvate还可以更轻松地在不同研究小组之间构建和共享数据集。

为机器学习奠定基础

“在过去的10年里,机器学习已成为化学领域的一种流行工具,但缺乏计算数据集一直是一个瓶颈,”刘说。“AutoSolvate将允许研究界在解决方案阶段为分子特性管理大量数据集。”

确定溶剂分子的氧化还原电位,或发生氧化的可能性,只是AutoSolvate可以帮助推进的一个关键研究领域的一个例子。氧化还原活性分子在开发抗癌药物和用于可再生能源储存的化学电池方面具有应用潜力。

“建立氧化还原电位数据集将使我们能够使用机器学习来观察数百万种不同的化合物,以快速找到氧化还原电位在所需范围内的化合物,”刘说。

这种对大型数据集的分析可以产生可解释的人工智能或分子模型的基本规则,而不是黑盒结果。

“最终目标是确定可用于解决广泛的基础科学问题的规则,”刘说。