《发展和应用分块的量子化学方法进行生物大分子性质计算和动力学模拟》这篇论文主要探讨了如何利用人工智能和机器学习技术改进生物大分子性质的计算和动力学模拟。传统量子化学从头算方法由于计算复杂度的问题,难以直接处理生物大分子系统。为解决这一问题,研究者们开发了各种线性标度和分块的量子化学方法,其中分块方法因其计算量近乎线性增长而受到关注。
论文中提到的分子碎片共轭帽方法(MFCC)是一种由作者所在课题组提出的分块方法,起初用于计算蛋白质与配体的相互作用,后来扩展到在不同量子化水平下计算蛋白质的总能量。在此基础上,研究进一步发展出扩展化的分子碎片共轭帽方法(GMFCC/MM),通过混合量子力学(QM)和分子力学(MM)来处理分子间的相互作用,特别是对近邻而非序列相邻的残基采用QM计算,而远距离的则用MM描述。
论文的核心创新是静电嵌入的扩展化的分子碎片共轭帽方法(EE-GMFCC)。这种方法不仅能够精确计算蛋白质的各种性质,如能量和蛋白-配体的相互作用能,而且可以求解能量的一阶和二阶导数,从而实现蛋白质结构优化和振动光谱计算,包括红外和拉曼光谱。此外,EE-GMFCC还能进行显式溶剂环境下的从头算分子动力学模拟(AIMD)。
EE-GMFCC的关键在于将相邻的三个残基作为分子碎片,用QM计算其能量,而短程的非相邻残基相互作用也用QM处理,长程部分则用经典的静电库仑相互作用描述。每个分块的QM计算都考虑了蛋白质内部环境产生的电场,用背景电荷模拟生物环境。大量测试表明,EE-GMFCC方法在HF/6-31G*水平下计算的蛋白质总能量与全量子计算结果高度吻合,平均误差仅为2.39 kcal/mol。同时,该方法还适用于DFT和MP2计算,保持了高精度。
此外,EE-GMFCC与类导体极化连续介质模型(CPCM)结合,可用于计算蛋白和配体的结合自由能。测试显示,该方法在计算avidin蛋白与biotin及其类似物的结合能时,与实验值的相关性优于传统的分子力场计算。
总结来说,这篇论文展示了如何利用人工智能和机器学习技术,尤其是分块的量子化学方法,有效地计算生物大分子的性质和动力学行为。通过EE-GMFCC方法,研究人员能够在保证精度的同时,显著减少计算成本,为大规模的生物分子模拟提供了新的可能。