77范文网 - 专业文章范例文档资料分享平台

生物信息学课程论文.doc(2)

来源:网络收集 时间:2018-12-03 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

[键入文字]

生物信息学结课论文

[键入文字]

表5.2氨基酸序列比对

程序

Pairwise blastp emboss_needle emboss_water

得分值

1074 2771.5 2771.5

一致性

522/537(97.0%) 522/537(97.2%) 522/537(97.2%)

相似性 空位

528/537(98.0%) 3/537(0%) 528/537(98.3%) 528/537(98.3%

3/537(0.6%) 3/537(0.6%)

99 Solanum lycopersicum1007341 Solanum tuberosum Nicotiana sylvestris Beta vulgaris subsp. vulgaris Malus domestica Sesamum indicum Pyrus x bretschneideri0.1

图5.1进化树

如图5.1所示:

1) 同属于茄科的马铃薯、番茄和烟草聚成一个亚类,这说明它们的亲缘关系很近,其中番茄和马铃薯的同源性极高。

2) 甜菜和番茄尽管在一个类群,但是甜菜在外侧,说明它们亲缘关系较远。 3) 从表5.2也可以看出番茄WRKY26基因编码的蛋白质和马铃薯STWRKY8基因编码的蛋白质的相似度非常高,说明两个基因的同源性很高,与进化树分析结果相同

六.蛋白质理化性质分析

使用ExPASy - ProtParam tool分析氨基酸序列。 表6.1氨基酸组成 氨基酸 数量 比例 氨基酸 数量 比例 Ala (A) 21 3.9% Arg (R) 30 5.6% Asn (N) 39 7.3% Asp (D) 33 6.2% Cys (C) 6 1.1% Gln (Q) 37 6.9% Glu (E) 26 4.9% Gly (G) 32 6.0% His (H) 12 2.2% Ile (I) 15 2.8% Leu (L) 24 4.5% Lys (K) 28 5.2% Met (M) 8 1.5% Phe (F) 19 3.6% Pro (P) 42 7.9% Ser (S) 78 14.6% Thr (T) 34 6.4% Trp (W) 5 0.9% Tyr (Y) 21 3.9% Val (V) 25 4.7% Pyl (O) 0 0.0% Sec (U) 0 0.0%

6

[键入文字]

生物信息学结课论文

[键入文字]

表6.1氨基酸序列ExPASy分析结果

名称 理论等 电点 数值 6.87 带正电 带负电 氨基酸 氨基酸 58 59 不稳定 系数 60.15 45.91 脂肪系数 总平均 疏水性 -1.062 C2562H3948N758O863S14 59624.9 化学式 分子量 结果分析: 1) 总的亲水性平均系数(GRAVY)为-1.062,由于总的亲水性平均系数可以体现蛋白质的亲疏水性质,数值越大代表亲水性越强,越低代表越弱。由于-1.062<0,,测该蛋白属于疏水性蛋白。

2) 由于该蛋白质带负电氨基多于带正电氨基酸,推测此蛋白质带负电。 3) 该蛋白质等电点为6.87,低于7.0,说明该蛋白质为酸性。

4) 该蛋白质不稳定系数为:60.15,其值大于40,表明这个分类的蛋白质不稳定。

七.蛋白质亲疏水性分析

蛋白质亲疏水性氨基酸的组成是蛋白质折叠的主要驱动力。一般通过亲水性

分布图反映蛋白质的折叠情况。使用ProtScale tool分析WRKY26所编码蛋白的亲疏水性。

图 7.1蛋白质的亲疏水性预测

结果表明:

根据氨基酸分值越低亲水性越强和分值越高的规律,如图7.1,该蛋白质位于第523位为S的氨基酸具有最小值为-3.244,亲水性最强;位于第90位为E的氨基酸有最大值为 1.500,其疏水性最强。而就整体而言,疏水性氨基酸均匀分布在整个肽链中且多于亲水性氨基酸。 因此,整个多肽链表现为疏水性,无明显的亲水区域,可认为WRKY26 基因编码的蛋白是疏水性蛋白。

7

[键入文字]

生物信息学结课论文

[键入文字]

八.信号肽的分析

信号肽位于蛋白质的 N 端,指导分泌性蛋白到内质网膜上合成,在蛋白质合成结束之前被切除,它一般有16-26个氨基酸残基,其中包括疏水核心区、 信号肽的C 端和 N 端。在靠近该序列N端常常有1个或数个带正电荷的氨基酸 在其C末端靠近蛋白酶切割位点处常常带有数个极性氨基酸,离切割位点最近的那个氨基酸往往带有很短的侧链。使用Signal IP 4.1severse预测信号肽。

C--剪切位点计分 S--信号肽计分 Y--综合计分

图8.1信号肽分析结果

注:

S值:一个氨基酸可以找到一个对应的S值,S值的变化趋势在结果显示的图表中有一个曲线可以表示,观察发现信号肽区域的S值相对较高。

C值:剪切位点值。每个氨基酸也会对应一个C值,C值最高在剪切位点处。 Y值:Y-max是一个参数,可以用来综合考虑S值和C值,这要比单一考虑S值要更为精准。因为在一条系列中剪切位点只有一个,而C值可能有不止一个此时的剪切位点就由Y-max值來推测的,为S值是睦峭的位置和高C值的位点的判断提供依据。

S平均值:是从端氨基酸开始到剪切位点处各氨基酸的平均值。

D值:S-mean和Y-max的平均值,对区分该蛋白是否具有分泌作用具有重要 作用。

表8.1信号肽分析结果

测量值

最大C值 最大Y值 最大S值

位置 数值

0.163 0.151 0.289

剪切

信号肽

36 11 5

8

[键入文字]

生物信息学结课论文

[键入文字]

平均S值 平均D值

1-10 1-10

0.211 0.183

0.450

NO

结果表明:

由图 8.1可知,C 值最大切割点在第36个氨基酸位置,分值为0.163,综合剪切点分值(Y 值)最高值在第11个氨基酸位置,分值为0.151,信号肽最大分值(S 值 )在 第5个氨基酸位置,为0.289,信号肽区域的平均S值为0.211,平均D值为0.183。因此判断 WRKY26 编码的蛋白质没有信号肽,分析结果也显示不存在信号肽。可以推测番茄WRKY26基因在游离核糖体上起始合成后,可能不进行蛋白转运,而是保留在细胞质基质中属于非分泌性蛋白。

九.跨膜结构域分析

跨膜结构域常常是由跨膜蛋白的效应区域所展现。一般由 20 个左右的疏水性氨基酸残基组成,主要形成α-螺旋。

图9.1 跨膜结构域分析

WEBSEQUENCE Length: 535 WEBSEQUENCE Number of predicted TMHs: 0

WEBSEQUENCE Exp number of AAs in TMHs: 0.00205 WEBSEQUENCE Exp number,first 60AAs: 0.00205 WEBSEQUENCE Total prob of N-in: 0.00044 WEBSEQUENCE TMHMM 2.0 outside 535

结果分析:

根据图9.1所示:没有跨膜结构域。无跨膜区,蛋白全部在膜外。曲线的纵坐标是概率,横坐标是序列,一共535个氨基酸。红色表示跨膜区,几乎为零,蓝色表示在膜内部概率,其概率为零;紫色细线表示在膜外的概率,几乎100%。表明,WRKY26编码的整条肽链都在细胞膜的外面,不具跨膜结构域。

结合上述信号肽的预测,可以推测出WRKY26编码的蛋白质在细胞质基质中合成后,很可能不进行转运,而是继续留在细胞质中行使功能。

十.亚细胞定位

9

[键入文字]

生物信息学结课论文

[键入文字]

亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在部位。例如在核内、胞质内或者细胞膜上存在。使用TargetP 1.1 Server分析信号肽。

表10.1亚细胞定位分析结果

Name

Sequence Cut off

Len mTP(线粒体) SP(信号肽) Other Loc RC

0.174 0.000

0.094 0.000

0.625 _ 3 0.000

535

表10.2亚细胞定位分析结果

Name Len cTP mTP SP other Loc RC

(叶绿体) (线粒体)(信号肽)

P11043_has_a_very_ve 516 0.873 0.012 0.004 0.320 C 3 P07505 266 0.330 0.047 0.004 0.444 _ 5 P12360 246 0.580 0.119 0.210 0.089 C 4 P12352 97 0.397 0.555 0.014 0.150 M 5 Q01289 399 0.733 0.017 0.031 0.462 C 4 P08817 129 0.844 0.092 0.089 0.015 C 2 P07263 546 0.400 0.380 0.075 0.020 C 5 P07597 117 0.005 0.095 0.967 0.006 S 1 P48786 1088 0.199 0.070 0.067 0.822 _ 2 Q01238 102 0.420 0.277 0.033 0.164 C 5 P35334 342 0.055 0.010 0.968 0.041 S 1 P13086 333 0.053 0.905 0.045 0.034 M 1 cutoff 0.000 0.000 0.000 0.000

结果分析:

1)如表10.1结果所示:SP(信号肽)的值远小于1.0,所以不存在信号肽,与信号肽分析结果一致。mTP小于1,所以不在线粒体内。

2)如表10.2所示:位于Loc列的“C”表示位于叶绿体,序列包含了cTP即叶绿体转运肽;“M”表示位于线粒体,序列包含了mTP即线粒体靶向肽;“S”表示序列包含SP即信号肽;“-”表示位于其他的细胞器。RC用于评估预测的可靠度,RC大小是衡量最高输出分值和第二高输出的得分之间的大小区别(diff)。RC从1到5,1表示最强的预测,并且值越小表示预测越可靠。有5个可靠度,定义如下:

1 : diff > 0.800

2 : 0.800 > diff > 0.600 3 : 0.600 > diff > 0.400 4 : 0.400 > diff > 0.200 5 : 0.200 > diff

3)综合上述分析,P07597和P35334蛋白具有信号肽,P13086位于线粒体内。

十一.蛋白质三级结构分析

蛋白质的生物学功能是由高级结构决定的。对蛋白质高级结构的预测和分析,

10

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库生物信息学课程论文.doc(2)在线全文阅读。

生物信息学课程论文.doc(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/334888.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: