摘要:为了系统分析兰花真核翻译起始因子5A(Eukaryotictranslationinitiationfactor5A,eIF5A)基因家族在兰花中如何发挥作用,利用兰花基因组数据库,通过生物信息学的方法,鉴定兰花eIF5A基因家族的基因结构、编码蛋白和磷酸化位点预测,通过序列比对进行进化分析。结果表明,兰花eIF5A基因家族含有eIF5A1和eIF5A2两个基因,分别含有5个和6个外显子。MEME保守基序分析显示,兰花eIF5A1和eIF5A2蛋白均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287)。磷酸化位点预测分析表明兰花eIF5A1和eIF5A2蛋白均含有大量的潜在磷酸化位点。以上结果将为今后揭示兰花eIF5A1和eIF5A2蛋白的功能提供重要的线索。
关键词:兰花;eIF5A;基因家族;进化分析
中图分类号:S682文献标识码:A文章编号:1008-0384(2017)11-1218-06
真核翻译起始因子5A(Eukaryotictranslationinitiationfactor5A,eIF5A)是一类普遍存在于真核生物细胞中、分子质量为16~18kDa的高度保守小分子蛋白质;是迄今为止发现的唯一含有羧腐胺赖氨酸(Hypusine)残基的蛋白质[1-2]。Hypusine是由eIF5A蛋白翻译后特定位置的赖氨酸在脱氧羧腐胺赖氨酸合酶(DHS)和脱氧羧腐胺赖氨酸羟化酶(DOHH)的作用下形成的。eIF5A前体没有活性,每个成熟eIF5A仅含有1个Hypusine残基,该残基是eIF5A行使生物学功能所必需的[3]。
1976年,Kemper等从兔子内质网膜上分离出eIF5A[4],生化分析表明eIF5A主要功能是促进第一步甲硫氨酸的合成,故此认为eIF5A在蛋白翻译起始阶段起重要作用[5]。植物eIF5A的研究起步较晚,2004年,Thompson等从模式植物拟南芥中分离出3个AteIF5A基因[6]。后续的研究表明AteIF5A1参与次生木质部的形成,超量表达AteIF5A1的转基因拟南芥木质部增大[6-7]。AteIF5A2主要在拟南芥受机械损伤的组织中高水平表达,其能够抑制由伏马毒素B1和黑暗引起的細胞凋亡[6,8]。AteIF5A3主要在拟南芥种子中表达,超量表达AteIF5A3的转基因拟南芥的叶子变为并生叶、种子变大、同时能够响应高盐、干旱以及渗透等多种胁迫[6,9]。
2014年11月24日小兰屿蝴蝶兰Phalaenopsisequestris(Schauer)Rchb.f.的全基因组以封面文章的形式在NatureGenetics杂志公开发表[10],为后续通过生物信息学挖掘、鉴定和分析兰花基因组奠定了相关基础。本研究从兰花基因组数据库出发,重点分析兰花eIF5A基因家族基因结构、编码蛋白的保守基序和潜在的磷酸化位点等,为进一步研究兰花eIF5A蛋白的生物学功能以及其磷酸化修饰提供重要信息。
1材料与方法
11兰花eIF5A基因家族基因组、cDNA和蛋白序列的获得
拟南芥Arabidopsisthaliana的eIF5A基因及其推导的蛋白序列来自TAIR数据库(http://www.arabidopsis.org);毛果杨Populustrichocarpa的eIF5A基因及其推导的蛋白序列下载自phytozome数据库(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Ptrichocarpa);美洲黑杨Populusdavidiana和小麦Triticumaestivum的eIF5A蛋白序列来自NCBI数据库(https://www.ncbi.nlm.nih.gov/)。
分别以拟南芥AteIF5A1(AT1G13950)、AteIF5A2(AT1G26630)、AteIF5A3(AT1G69410)、小麦TaeIF5A1(AAZ95171)、TaeIF5A2(AAZ95172)和TaeIF5A3(AAZ95173)蛋白序列为参比序列,利用OrchidBase数据库中Blast程序进行BlastP检索,检索结果的全序列E值大于e50的舍去,再利用美国国家生物技术信息中心提供的在线CDS(Conserveddomainsearch)程序(http://www.ncbi.nlm.nih.gov/cdd)预测这些蛋白有无DNA结合寡核苷酸结合结构域,同时具有这2个特征的蛋白序列属于eIF5A基因家族。
12兰花eIF5A基因家族基因结构分析
利用OrchidBase数据库,获取兰花P.equestris中eIF5A基因家族成员基因注释,根据各成员的内含子和外显子的大小和数目,用手绘制其各自基因结构示意图。
13
兰花eIF5A基因家族二级结构及跨膜区结构预测
利用在线ClustalOmega(http://www.ebi.ac.uk/Tools/msa/clustalo/)对eIF5A基因家族各成员编码蛋白的氨基酸相似性进行分析[11],利用在线二级结构预测软件SOPMA(https://npsaprabi.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html)对兰花P.equestriseIF5A蛋白的α螺旋、β折叠、β转角和无规则卷曲等二级结构进行分析[12]。利用在线软件TMHMMServerv.20(http://www.cbs.dtu.dk/services/TMHMM20/)对兰花(P.equestris)eIF5A蛋白的跨膜区结构进行预测分析[13]。
14兰花eIF5A基因家族保守基序分析
应用在线软件MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi),对小麦、拟南芥、美洲黑杨、毛果杨和兰花eIF5A蛋白的保守基序进行分析[14]。
15兰花eIF5A蛋白三级结构预测
应用在线三级结构预测软件SwissModel(https://swissmodel.expasy.org/),选取其自动建模功能对兰花P.equestriseIF5A蛋白质的空间结构模型进行同源建模分析[15]。
16兰花eIF5A蛋白系统进化树的构建
利用ClustalX(20)[16]软件对鉴定出所有兰花eIF5A蛋白、3个拟南芥eIF5A蛋白[6]、4个毛果杨eIF5A蛋白[17]、4个美洲黑杨eIF5A蛋白[9]和3个小麦eIF5A蛋白[18]进行多重序列比对,使用MEGA60[19]软件,采用邻接(neighborjoining,NJ)算法构建系统进化树,进行1000次Bootstrap抽样。
17兰花eIF5A基因家族编码蛋白磷酸化位点预测
利用NetPhos31Server在线软件[20](http://www.cbs.dtu.dk)对鉴定出所有兰花eIF5A蛋白序列进行磷酸化位点预测,所有参数都选用程序默认值。
2结果与分析
21兰花eIF5A基因家族的鉴定和命名
分别以3个拟南芥eIF5A蛋白和3个小麦eIF5A蛋白序列为参比序列,利用OrchidBase数据库提供的BlastP程序进行检索,共得到了3个兰花候选eIF5A基因。利用CDS程序验证特异性保守结构域(PLN03107)的存在,初步确定了2个兰花eIF5A基因。根据通用植物基因的命名方法,对鉴定到的2条eIF5A基因进行了命名,并统计了它们对应的定位名称、基因长度、位置以及对应的推导蛋白长度和外显子个数等,他们推导的蛋白质长度分别为159个氨基酸和201个氨基酸(表1)。兰花eIF5A基因家族成员分别含有4个和5个内含子,且内含子的长度远大于外显子的长度(图1)。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育类兰花?eIF5A?基因家族鉴定与生物信息学分析在线全文阅读。
相关推荐: