三核苷酸序列与氨基酸序列用法错误辨析
生物信息学稿件中,经常出现因核苷酸序列与氨基酸序列混淆而发生的表述错误。基因序列就是指核苷酸序列,或称基因核苷酸序列;而蛋白质序列就是指氨基酸序列,或称蛋白质氨基酸序列。核苷酸序列和氨基酸序列最简单的区分方法就是,核苷酸序列中仅含A、T、C、G4个字母,而氨基酸序列中还有其他字母。作为编辑,有时虽然不知道稿件作者具体是基于什么序列进行的分析,但可从一篇文章中对此类问题的前后描述以及图表来准确区分和表述这两种序列。生物信息学稿件中常见的错误有:
1.基因序列与氨基酸序列混淆
例7.茶尺蠖EoL2与其他昆虫脂肪酶氨基酸序列进化树分析
例8.PmMMP17与其他物种的进化分析(标题);PmMMP17蛋白质聚类分析(图题)
例7中,“EoL2”是指脂肪酶基因,显然基因序列(核苷酸序列)是不能与“其他昆虫脂肪酶氨基酸序列”一起构建系统进化树的,因此,应将“茶尺蠖EoL2”改为“茶尺蠖EoL2氨基酸序列”;例8中前后两句是同一篇文章的一个二级标题和一个图题,描述的是同一个内容,显然前一句描述的是基于基因序列的物种进化分析,而后一句描述的是基于蛋白质序列的物种进化分析,前后不一致,实际上,根据原文内容后一句描述是正确的,因此,可将例8中前一句改为“PmMMP17氨基酸序列与其他物种的进化分析”。
2.蛋白质与核苷酸序列、基因与氨基酸序列错误搭配
例9.剑尾鱼Cu/ZnSOD核苷酸及氨基酸序列相似性与其他已知鱼类的比对
例10.猪、人、牛、绵羊和小鼠PDGFRα基因氨基酸多重序列比对结果
例9中,据原文正体符号Cu/ZnSOD代表蛋白质,蛋白质不能直接搭配核苷酸序列,應将蛋白质改为基因,即改为“剑尾鱼Cu/ZnSOD核苷酸序列及其推导的氨基酸序列”;例10中,基因不能直接搭配氨基酸序列,应将基因改为蛋白质,即改为“PDGFRα蛋白质氨基酸多重序列”。
四同源性与系统进化分析结果描述错误辨析
同源性分析与系统进化分析都是用于判断同源基因或同源蛋白质而进行的不同层面的分析,同源性分析进行的是基因序列或蛋白质序列的比对,其结果一般用一致性、相似度、同源序列等描述;而系统进化树的构建是基于同源基因序列或是同源蛋白质序列,其结果一般用是否聚在一个分支和亲缘关系远近等描述。生物信息学稿件中常见的错误有:
1.同源性分析结果用物种的亲缘关系远近描述
例11.EoL2编码的蛋白与其它昆虫脂肪酶蛋白序列比较分析的结果表明,EoL2序列与家蚕BmL1序列相似度最高,为57%,亲缘关系较近,其次为黑脉金斑蝶Danausplexippus(Linnaeus)DpL1为55%,与棉铃虫HaL、家蚕BmL、黑脉金斑蝶DpL2序列一致性均为44%……
例11中,有多个错误描述:(1)本例中描述的是同源性分析结果,不能用“亲缘关系较近”来描述,应将“亲缘关系较近”删除;(2)“BmL1序列相似度最高,为57%”中显然指相似度为57%,一般情况下,根据序列比对软件得出的结果中只有“Identity”(一致性)值,没有“Similarity”(相似度)值,因此,序列比对分析中,数值的多少要用一致性描述,序列的相似程度即相似度要用高低来描述,本例中应将“57%”改为“序列一致性为57%”,“为55%”改为“序列一致性为55%”。
2.系统进化分析结果用同源性描述
例12.将ScMT2-1-4推导的氨基酸序列进行了Blastp同源搜索,选取不同植物的MT2蛋白序列与ScMT2-1-4构建系统进化树,结果表明,ScMT2-1-4基因编码蛋白与已报道的甘蔗ScMT2-1-3基因(登录号:KJ504375)和甘蔗ScMT2-1-2基因(登录号:AAV50043)编码蛋白同源性最高,其次是高粱MT2(登录号:XP0024551970)和玉米MT2-1(登录号:NP001150795)。
例12中,描述的是系统进化分析结果,不能用同源性高低描述,应将“同源性最高”改为“亲缘关系最近”。
五结语
科技期刊来稿中,有很多作者对基因、蛋白质、核苷酸、氨基酸、序列等名词及其组合的表述比较混乱,甚至会出现歧义,编辑应根据文中的实际情况,将这些名词准确加以区分,正确表述。
作者:郝拉娣等
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育类科技期刊中生物信息学常见名词用法错误辨析(2)在线全文阅读。
相关推荐: