合聚咖

合聚咖

GROMACS蛋白配体分子动力学模拟预处理过程简要笔记

admin

本文主要针对蛋白配体模拟体系的预处理过程进行简要记录。体系中包含一个蛋白质,六个初始位置不同的配体分子。蛋白质使用PDB编号为2BEG的Aβ17-42五聚体,配体为特定多酚类小分子。实际使用时,对于力场以及相关参数的确定需更加仔细。

首先从PDB下载编号为2BEG的pdb文件,此蛋白质结构由NMR方法测定。接着将文件另存为protein_split_from_2beg.pdb,并使用pymol打开检查蛋白质结构完整性,确保N端及C端正确,如发现C端缺少结束的氧原子,则需使用Swiss-PdbViewer添加。之后利用Swiss-PdbViewer打开protein_split_from_2beg.pdb,添加OXT原子,保存为protein_modified_by_SPDBV.pdb。删除不必要的字段后,使用pymol将文件保存为protein.pdb,完成所需pdb文件的准备。

配体文件则来源于ZINC网站的mol2文件,通过pymol直接导出为pdb格式。构建蛋白配体复合物构象时,使用pymol同时载入protein.pdb和ligand.pdb文件,构建包含一个蛋白质和6个配体的复合物,配体均匀随机分布在蛋白质周围,使用surface模式观察配体与蛋白质无表面接触和重叠。随后以pdb格式单独导出每个配体,得到6个配体的pdb文件。

蛋白质拓扑结构生成时,通过命令根据蛋白质的pdb文件生成所需的分子坐标文件(gro文件)、拓扑文件(topol.top)、位置限制文件等。配体拓扑结构处理则需使用PRODRG网站,生成配体的相关拓扑文件,使用的力场为GROMOS87。按照指定步骤处理6个配体,注意配体坐标、手性中心保留、电荷设定等,并确保文件命名正确。修改配体的itp文件和gro文件命名,防止配体重名。

构建复合物时,复制protein_processed.gro文件为complex.gro,将每个配体gro文件的坐标部分复制到complex.gro的蛋白质原子坐标末尾,更新复杂性开头的原子总数。修改topol.top文件,添加配体itp文件以及调整系统组分内容,包含蛋白质位置限制所需的文件。

接着利用命令定义周期性的边界条件,设置盒子类型为立方,盒子尺寸为边长8 nm,并填充水分子。添加离子时,通过命令添加5个钠离子以平衡体系净电荷问题。随后运行能量最小化过程,生成index.ndx文件以方便对蛋白质和配体间能量进行检测,并设置能量最小化的参数文件em_real.mdp,运行命令生成em.tpr文件,执行能量最小化。最后,检查能量最小化过程的能量变化并验证结果。

在主体模拟前,需进行NVT预平衡和NPT预平衡,以稳定体系在合适的温度和压力下。NVT预平衡时长设定为100 ps,温度设定为310 K,使用Particle-mesh Ewald(PME)方法计算长程库仑力,采用LINCS算法限制水溶液与氢原子相连的共价键和键角的振动。NPT预平衡时则需产生压力,使用Berendsen 法控压,时长设置为100 ps。通过检查温度、密度和压力等参数,验证预平衡过程是否充分。

模拟结束前,通过监测体系参数变化以及配体蛋白的动态轨迹,确认预平衡过程是否有效。可使用命令从xxx.edr文件中提取相关数据,并利用xvg文件可视化参数变化,确保能量最小化、NVT预平衡和NPT预平衡过程达到预期效果。同时,通过pymol监测蛋白配体的动态轨迹,检查有无异常。

成品模拟时,取消蛋白质位置限制,设置时间为100 ns,采样间隔为10 ps。控压算法更改为Parrinello-Rahman。生成tpr文件后,执行主体模拟。如使用GPU加速,可在命令后添加-nb gpu。使用PBS命令提交模拟任务,并在运行过程中检查状态,下载数据进行分析。

学习过程中参考了Jerkwin的相关博客和翻译的GROMACS教程,对分子动力学模拟的预处理过程有了更深入的理解。本文旨在说明蛋白配体模拟体系的预处理过程,后续将详细说明数据分析部分。

感谢关注公众号杜艾维,获取更多技术笔记和工具推荐。