周期性图像建的最小距离
对于QA,一个最重要的需要检查的事项是,周期性图像之间不应该有相互作用;因为周期性图像是有独立身份的,这些相互作用在物理学上不应该发生。设想双极性蛋白质图像存在直接的相互作用,那么同一蛋白质在盒子边界的两个末端就会产生作用力,这将影响蛋白质的本身行为并使模拟结果失效。 为了确认这些相互作用没有发生,我们用g_mindist命令计算周期性图像每次的最小距离:
g_mindist -f traj.xtc -s minimal-periodic-distance.xvg -pi
topol.tpr
-od ==Q== What was the minimal distance between periodic images and at what time did that occur? ( T )
==Q== What happens if the minimal distance becomes shorter than the cut-off distance used for electrostatic interactions? Is it the case in your simulations?
小距离的事件发生是偶然性的还是持续性的,也会有影响。如果是持续性的,就可能影响蛋白质动力学;但是如果只是偶尔发生,就一般不会有影响。 ==Q== Run now g_mindist on the C-alpha group, does it change the results? What does is mean for your system?
不只是直接相互作用需要关注,那些由水分子介导的间接效应,也会产生问题。例如,蛋白质可能影响最初四层水分子的排列,这相当于1 nm的距离;理想的情况是,最小距离不应该小于2nm。
波动的均方根
除了能量本身的检查外,还应该检查模拟过程中,松弛后的蛋白质向平衡状态收敛的情况。通常,松弛只是考虑了与参考结构(例如,晶体结构)的Euclidean距离。这个距离以 均方根偏差 (RMSD)表示。然而,我们推荐再检查一下与平均结构的松弛情况,也就是说,与平均结构的RMSD。个中原因,将在下一段说明。但为了计算与平结构的RMSD,需要首先得到平均结构。这个结构可在计算波动均方根(RMSF)时附加得到。
RMSF的捕获每个原子相对平均位置的波动。这能深入观察蛋白质柔性部位的性质,相应于晶体结构测定中的b-factors (温度因子)。通常,我们希望RMSF与b-factors相近,这能表明模拟结果与晶体结构相适应。RMSF (和平均结构)用g_rmsf计算。-oq选项运行计算b-factors,并把它们添加到参考结构中。我们最关心每个残基的波动,可用选项-res设定。
g_rmsf -f traj.xtc -s topol.tpr -o rmsf-per-residue.xvg -ox average.pdb -oq bfactors.pdb -res
用xmgrace看看RMSF,找出柔性和刚性区域。
==Q== Indicate the start and end residue for the most flexible regions and the maximum amplitudes. ( T )
==Q== Compare the results from the different proteins. Are there differences? If yes, which is the most flexible and which least?
为了获得这些结果关联性的印象,这里有个人类prion蛋白质1qlz 的RMSF,图中会导致CJD疾病的突变残基被标示出来。
现在来看看两个pdb文件,把它们读入Pymol。然后根据b-factors给结构文件bfactors.pdb上色,检查柔性区域。平均结构是非物理结构。看看其中的一些侧链,并注意平均结构对其构想的影响。 pymol average.pdb bfactors.pdb spectrum b, selection=bfactors
颜色分布在b-factor范围内,蓝色代表最低(最稳定),红色代表最高(最易波动)。你可以减少最大值来调整颜色范围,如设为500:
Q = 500; cmd.alter(\q
以下图像显示的是人类野生型UbcH8蛋白根据模拟计算得到的b-factors上的颜色。蓝色是低,红色是高。白色区域表示目前已知的能够反转蛋白质相互作用特征的残基。在图像右侧,你可以看到那些在Helix 2前后的loops有较高的b-factors。第二个图像是helix 2前loop的放大显示。
RMSD的收敛
当心!因为你的蛋白质可能会跳出盒子外, 我们必须重新制作轨迹来把中间周期性图像中的粒子拽回来。为此,运行以下命令:
trjconv -f traj.xtc -o traj_nojump.xtc -pbc nojump 由于RMSF计算也给出平均结构,我们现在计算均方根偏差(RMSD)。RMSD通常被用作指示到平衡状态的收敛情况。前面说过,RMSD仅仅是个距离单位,值越小越好。RMSD用g_rms程序计算。首先计算所有原子的RMSD,使用起始结构作为参考:
g_rms -f traj_nojump.xtc rmsd-all-atom-vs-start.xvg
-s
topol.tpr
-o ==Q== If observed, at what time and value does the RMSD reach a plateau? ( T )
再次计算RMSD,但只计算骨架原子: g_rms -f traj_nojump.xtc rmsd-backbone-vs-start.xvg
-s
topol.tpr
-o 这次,RMSD达到了一个低值,这是由于排除了侧链原子(侧链原子往往更容易发生运动)。两个RMSD最后都应到达一个平台值。这意味着蛋白质结
构达到了与参考结构有一定距离并或多或少保持那个距离。然而,随着距离的增加,可能构象的数目也在增加。这意味着虽然RMSD达到了一个平台值,结构仍然可能在向平衡状态收敛。出于这个原因,建议同时检查一下向平均结构的收敛情况。
echo 1 | trjconv -f traj_nojump.xtc -s topol.tpr -o protein.xtc
g_rms -f protein.xtc rmsd-all-atom-vs-average.xvg g_rms -f protein.xtc rmsd-backbone-vs-average.xvg
-s
average.pdb
-o -s average.pdb -o 比较与上次图像的差别。注意RMSD值的平衡点。
==Q== Briefly discuss two differences between the graphs against the starting structure and against the average structure. Which is a better measure for convergence?
回旋半径的收敛
QA的最后一步,我们将计算回旋半径。这个值表示每次分子形状的变化。将回旋半径与试验得出的回旋半径相比较。可以用g_gyrate计算回旋半径。该程序也会给出个性因子(individual components),相应于惯性矩阵的本征值。这意味着,第一个individual component对应于原子的最长轴,最后一个individual component相应于最小轴。这三个轴能说明分子的形状。输入以下命令:
g_gyrate -f traj.xtc -s topol.tpr -o radius-of-gyration.xvg 看看回旋半径和individual components,注意这些值如何达到平衡值。 ==Q== At what time and value does the radius of gyration converge? ( T ) 这里,我们完成了分析的第一部分,包括图像检查和质量检查。现在该深入一点了,挖掘一下蛋白质内部发生的情况。第二部分的分析包括结构特性,这些特性可用蛋白质形状,例如氢键数量、溶剂可接近表面或特定原子-原子之间的距离等。Let’s go。
结构分析:由形状得出的特性
如果提示需要选择,选择 \;如果没有特别提示或者没有 if no selection is specifically stated or does not follow logically from the text.
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库Gromacs教程II-MD结果分析(2)在线全文阅读。
相关推荐: