To get rid off the noise, please use the 'Running Average' method in 'Data->Transformation' to smooth your graphs with xmgrace 如果确认了模拟已经收敛,就可以进行真正的分析了。对模拟数据的分析,可以分为几种类型。第一种包括对单个图形的解释,通过一些函数逐个点进行计算得到一个值或者一些值;例如RMSD和回旋半径的计算。这些特性可称为构型,依赖或瞬间特性。另外一种是可以通过一定时间范围内的平均化来分析的特征,比如相互关系或波动。本部分将进行一些通常的分析,每个都能得到直接来自于轨迹(不同时间下的坐标)的一个时间序列值。这些问题可以参考程序运行时的屏幕输出或者图形。
溶剂可及表面面积
一个可能感兴趣的特性是蛋白质表面可被溶剂到达的面积,一般指溶液科技表面 (SAS)或者溶剂可及表面面积 (SASA)。还可细分为亲水性SAS和疏水性SAS。除此之外,SAS可以和一些经验参数一起使用,得到一个溶剂化自由能的估计。 所有这四个参数都可用g_sas程序完成。本程序也允许计算每个残基或原子一段时间内的平均SAS。输入下面的命令,设置需要计算SAS的基团和输出基团,查看输出文件。
g_sas -f traj_nojump.xtc -s topol.tpr -o solvent-accessible-surface.xvg -oa atomic-sas.xvg -or residue-sas.xvg
==Q== Focusing on the loop1 (residues 53-62), which residues are the most accessible to the solvent?
氢键
另一可能能提供很多信息的性质是氢键,内部氢键(蛋白质-蛋白质)或蛋白质与其周围的溶剂之间的氢键都是这样。氢键的存在与否可以通过氢键受体和供体对的距离和键角来推断。为了计算氢键,使用如下命令(并用Xmgrace查看输出文件):
echo 1 1 | g_hbond -f traj_nojump.xtc -s topol.tpr -num hydrogen-bonds-intra-protein.xvg
echo 1 12 | g_hbond -f traj_nojump.xtc -s topol.tpr -num hydrogen-bonds-protein-water.xvg
==Q== Discuss the relation between the number of hydrogen bonds for both cases and the fluctuations in each.
特定氢键可以用包含相应原子数量的索引文件来得出。从分析1得出的RMSF及b-factors显示loops 2 和 3 (helix 2附近)值比较高。实验数据也显示,loop 1可能在UbcH6 and UbcH8的多个行为中起了一定作用。看看这些loop所包含的氢键连接。第一个命令会在菜单中弹出3个新的条目去选择基团,每个loop一个。第二个命令是一个通用命令g_hbond,需要一个索引文件。你可能想看看每个loop里的氢键、loop1和loop2之间的氢键;例如,某个特定的loop和蛋白质其他部分的氢键(为此可能需要修改索引文件,不明白就找人问问)或者和水形成的氢键,等...
echo \53-62\\nname 16 loop1\\nr 87-94\\nname 17 loop2\\nr 110-117\\nname 18 loop3\\nq\| make_ndx -f confout.gro -o my_index.ndx
g_hbond -f traj_nojump.xtc -s topol.tpr hydrogen-bonds-loop.xvg -n my_index.ndx
-num ==Q== What can you say about the stability of the hydrogen bonds for these loop regions?
==Q== On the hydrogen bonding basis, which loop is the more, respectively less, stable? Did you detect H-bonding between loops?
盐桥
除了氢键之外,蛋白质也常在不同的带点残基之间形成盐桥。这对蛋白质的结构有重要的稳定作用,尤其是当它们位于一个憎水环境,例如蛋白质核心。但是盐桥也能在蛋白质暴露表面看到,对于介导蛋白质识别过程往往很重要。盐桥的存在,可以用g_saltbr来查看。当需要时,通过设置选项-sep,这个程序可以为每对相反的带电残基产生一个输出文件,这些残基位于轨迹中的某点,彼此之间在一定的隔断距离范围内(这里是0.5 nm,通过选项-t设置)。这将产生许多文件,所以分析时最好建立一个单独的文件夹。执行以下命令: mkdir saltbridge cd saltbridge
g_saltbr -f ../traj_nojump.xtc -s ../topol.tpr -t 0.5 -sep 为了更清晰点,删除有关钠离子和氯离子的文件: rm -f *CL-* *NA+* \\#*
看看以下残基之间的相互作用:
? ?
GLU-56 (resp. ASP-56) 和 LYSH-60 LYSH-60 和 ASP-88
==Q== What can you say about the interactions? The residues K60 and D88 are highly conserved and the single mutation of residue D56 toward E56 in UbcH8 modify its interaction profile. What could be the cause of that? Compare your graphs with the ones generated by your co-group colleagues.
现在回到你的工作目录: cd ../
二级结构
蛋白质结构最常需要判断的是二级结构,如α-螺旋和β-折叠的确定,一个可以用来做出判断的命令是dssp。此程序不在gromacs发行,但是可以在CMBI(Radboud University)得到。Gromacs确实为dssp提供了一个交互界面,允许对每帧轨迹计算二级结构: cd ~/Desktop
wget
ftp://ftp.cmbi.ru.nl/pub/molbio/software/dsspcmbi.tar.gz tar -zxvf dsspcmbi.tar.gz
setenv DSSP \
do_dssp -f traj_nojump.xtc -s topol.tpr -o secondary-structure.xpm -sc secondary-structure.xvg -dt 10 secondary-structure.xvg文件包含一个时间序列,列出了每帧中与各种二级结构有关的残基数量。更详细的信息在.xpm文件中,它对每个残基一段时间的二级结构用颜色表示出来。.xpm文件能用类似Gimp等软件进行观察,但是一些有用的元数据可以用gromacs工具xpm2ps加入,结果可以用gview或类似程序观看。For locals, do note the similarity between the plot and the front of the new building of the Hogeschool Utrecht.
xpm2ps -f secondary-structure.xpm -o secondary-structure.eps gv secondary-structure.eps
==Q== Discuss some of the changes in the secondary structure, if any. ==Q== Compare the stability of the secondary structures in the different proteins.
拉氏图
蛋白质骨架的phi-和psi-扭转角是两个对于深入了解蛋白质结构特性非常有用的参数。对phi-相对psi-角度作成的图称为拉氏图;拉氏图的某些特定区域反映了蛋白质二级结构单元或氨基酸的特性,(而这些区域)之外的区域被认为是不可能出现的(不可到达)。phi/psi角随时间的变化可以反映结构的变化。这些叫可以用g_rama程序计算,虽然方式有点粗略,因为它把所有的东西一股脑儿放在一个文件里。为了观察单个残基,可以用linux程序 'grep'从图中选出来。
g_rama -f traj_nojump.xtc -s topol.tpr -o ramachandran.xvg 此文件包含所有残基所有的phi/psi角。为了提取某个残基(例如LYS-60)的角度,输入:
grep LYSH-60 ramachandran.xvg | awk '{print $1 \rama-LYSH-60.xvg
用这个提取后面的拉氏图,并用xmgrace观察。PDB结构中,残基82-86被归为螺旋。看看你的模拟结果,现在还是不是这样?
==Q== What can you say about the conformation of these residues, based on the ramachandran plots (see the plot given above)?
动力学和时间平均特性的分析 又是RMSD
均方根偏差(RMSD)在模拟的收敛性中已经算出来了,但是它也可用于进一步的分析。RMSD是两个结构之间的比较值。如果我们对轨迹文件中的结构各个合并,计算RMSD值,然后就可以看看是否有属于同一类型或有共同特征的结构组。这些结构中,属于同一组的有较低的RMSD值, 而与其它结构相比则有更高的RMSD值。用矩阵形式表示RMSD值,这也可以用来确定过渡变化。
为了建立RMSD矩阵,调用g_rms命令和两条轨迹。本教程中,我们采用同一条轨迹。我们在轨迹文件中每隔一帧提取一次,生成了1001x1001矩阵。选择组合\
==Q== What is interesting by choosing the group \for this analysis? Think about the different proteins used for this practical. g_rms -s topol.tpr -f traj_nojump.xtc -f2 traj_nojump.xtc -m rmsd-matrix.xpm -dt 10
得到的矩阵是灰阶图。为了看得更清楚,我们可以采用彩色梯度图: xpm2ps -f rmsd-matrix.xpm -o rmsd-matrix.eps -rainbow blue gv rmsd-matrix.eps
==Q== How many transitions do you see?
把你的和你同组同学的轨迹相比较,也是非常有趣的。请重复相同过程,但采用-f和 -f2选项,对不同的轨迹运行g_rms。你应当和你的组员共享你们的工作结果,那么将会有6种组合可能性:
? ? ? ? ? ?
UbcH6_wt vs UbcH8_wt UbcH6_wt vs UbcH6_E56D UbcH6_wt vs UbcH8_D56E UbcH8_wt vs UbcH6_E56D UbcH8_wt vs UbcH8_D56E UbcH6_E56D vs UbcH8_D56E
==Q== What can you conclude from this analysis? Could you expect such a result, justify?
簇分析
在结构间距离的基础上,这些RMSD也可以归并为一些反映构象可及性和每个RMSD相对权重的簇。用一个簇算法可以完成这个任务,g_cluster包含多个簇算法。该程序产生多个输出文件。查看帮助文件了解它们的含义,然后运行这个程序。注意,我们已经算好了RMSD矩阵,可以把它作为g_cluster的输入。 g_cluster -h
echo 6 6 | g_cluster -s topol.tpr -f traj_nojump.xtc -dm rmsd-matrix.xpm -dist rmsd-distribution.xvg -o clusters.xpm -sz cluster-sizes.xvg -tr cluster-transitions.xpm -ntr cluster-transitions.xvg -clid cluster-id-over-time.xvg -cl clusters.pdb -cutoff 0.1 -method gromos -dt 10
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库Gromacs教程II-MD结果分析(3)在线全文阅读。
相关推荐: