77范文网 - 专业文章范例文档资料分享平台

科技期刊中生物信息学常见名词用法错误辨析

来源:网络收集 时间:2021-05-07 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

  摘要:为准确编辑生物信息学稿件,对目前科技期刊生物信息学稿件中最常见的一些既有关联又有区别的名词用法错误进行了辨析。结果表明:生物信息学稿件中常见的基因、蛋白质、核苷酸序列、氨基酸序列、同源性、亲缘关系等名词的使用及其表述经常有误甚至有歧义;同时对基因和蛋白质的符号表达错误进行了辨析,虽然有90%的科技期刊中基因符号已用斜体字母表达,但其中还是有很多基因符号尤其以基因命名的引物名称以及重组质粒中的基因符号未能用斜体字母表达。该研究结果可为科技期刊编辑掌握生物信息学稿件中最基本的一些名词的使用及其表述提供参考。


  关键词:科技期刊,生物信息学,基因,蛋白质


  引言


  生物信息學是近年来发展起来的一门新兴学科,科技期刊中有关生物信息学方面的文章越来越多,但科技期刊的很多编辑对生物信息学方面的知识了解有限,在尚无规范和标准可参考的情况下,只能原稿来什么样就发什么样,经常会出现一些关联名词描述方面的错误,因此,对生物信息学中一些关联名词用法进行研究具有重要的意义。目前,在生物信息学编辑方面仅见蒋元霖[1]、刘华[2]、张翠英[3]、张冰[4]等关于科技期刊中基因及蛋白质符号的规范表达,宋亚珍等[5]关于同源性、一致性、相似性概念辨析等研究,有关生物信息学中更多名词的用法及其准确表述的研究尚未见报道。而科技期刊中有关基因的克隆与表达以及蛋白质的提取、分离、纯化和功能等方面研究的文章越来越多,笔者根据对此类文章的编辑实践以及对部分科技期刊此类文章的阅读,发现一些既有关联又有区别的名词,如基因与蛋白质,核苷酸序列与氨基酸序列,同源性与亲缘关系等的使用及其表述不少有误甚至存在歧义,为此,本研究对这些高使用频率关联名词的用法错误进行了分析,旨在为同人提供参考。


  一基因和蛋白质名词用法错误辨析


  基因和蛋白质是最常见的两个名词,虽然是两个不同的概念,但又紧密关联。基因是一段有遗传效应的脱氧核糖核苷酸序列(DNA),基因的基本结构单位是脱氧核苷酸;DNA要通过RNA的转录(mRNA)和翻译(tRNA)才能产生蛋白质,即基因编码蛋白质,蛋白质的基本结构单位是氨基酸[6-8]。生物信息学稿件中常见的错误有:


  1.基因与蛋白质混淆


  例1.本研究通过PCR技术对RcTIR1基因进行了克隆,生物信息学分析显示其含有富含亮氨酸重复序列的结构域,并通过多序列比对显示该基因与小立碗藓的生长素受体蛋白TIR1相似度达76%,初步认为该基因为生长素受体蛋白TIR1。


  例1中,存在多个错误:(1)“其含有富含亮氨酸”中的“其”指基因,而基因是不含有氨基酸的,应将“其”改为蛋白质;(2)“多序列比对显示该基因”中的“该基因”是不能与蛋白质直接比较的,应将“该基因”改为蛋白质;(3)“相似度76%”指的是氨基酸序列之间的同源性比对,数值结果应描述为一致性,应将“相似度76%”改为“一致性76%”;(4)“初步认为该基因为生长素受体蛋白TIR1”有逻辑错误,即“基因”是“蛋白质”。因此,本例应改为:“本研究通过PCR技术对RcTIR1基因进行了克隆,生物信息学分析显示该基因编码的蛋白质含有富含亮氨酸重复序列的结构域,并通过多序列比对显示该基因编码的蛋白质与小立碗藓的生长素受体蛋白TIR1一致性达76%,初步认为该基因编码的蛋白质为生长素受体蛋白TIR1。”


  2.标题或图题中基因、蛋白质的描述与研究内容不一致


  例2.Fesod的生物信息学分析;Fesod生物信息学分析


  例3.Actin系统进化树分析;Actin系统进化树分析


  例2、例3均为常见的二级标题或图题,其中每个例子的第一句都是表述基因层面的内容,第二句都是表述蛋白质层面的内容,表面看上去都没有错误,但在文中标题或图题中基因、蛋白质的表述与研究内容经常不一致。如生物信息学分析中,如果是通过软件对克隆的基因片段推导的蛋白质的分子量、等电点、信号肽、跨膜区、二级结构等进行预测,标题或图题应表述为蛋白质的生物信息学分析;如果是对克隆的基因序列及其结构等进行的分析,标题或图题应表述为基因的生物信息学分析。再如系统进化分析中,如果是基于基因序列(核苷酸序列)构建的系统进化树,标题或图题应表述为基因系统进化分析;如果是基于蛋白质序列(氨基酸序列)构建的系统进化树,标题或图题应表述为蛋白质系统进化分析。


  二基因符号与蛋白质符号用法错误辨析


  笔者随机对2015和2016年30多种科技期刊中基因符号的斜体表达情况进行调查,结果还是有10%左右的期刊未用斜体字母表示基因符号,即使用斜体字母表示基因符号的期刊,存在的问题也很多,如对一些基因与蛋白质未能准确区分,导致基因符号和蛋白质符号表达存在诸多问题。生物信息学稿件中常见的错误有:


  1.引物名称、重组质粒中的基因符号等未用斜体


  例4.设计了IGFBP2基因的1对简并引物IGFBP2F和IGFBP2R


  例5.刺参凝集素基因AJL与原核表达载体pET32a(+)的重组质粒pET32a(+)AJL


  例4中,引物名称是以基因命名的,基因“IGFBP2”应为斜体,即改为“简并引物IGFBP2F和IGFBP2R”;例5中,重组质粒是指将酶切的基因片段和表达载体通过酶连接并转化至大肠杆菌细胞(或其他细胞)中得到的重组体,因此,本例中基因“AJL”应为斜体,即改为“重组质粒pET32a(+)AJL”。


  2.蛋白质符号未用正体或未大写


  例6.用邻接法构建的基于nm23氨基酸序列的系统进化树


  例6中,“nm23”表示的是蛋白质,而字母全为小写,说明蛋白质符号用法错误,可以找作者确定此蛋白质的准确符号,是首字母大写还是所有字母全大写,也可以将“nm23氨基酸序列”直接改为“nm23基因推导的氨基酸序列”。


  目前,基因和蛋白质的命名及符号在不同物种间没有统一的规则[9],根据《TIG遗传命名指南》[10]有关细菌、原生动物、酵母、丝状真菌、植物、无脊椎动物、脊椎动物中一些典型生物模式的命名规则与书写原则,生物基因符号的组成归纳起来一般有以下几种:全小写斜体字母,全大写斜体字母,斜体的小写字母+大写字母(有首字母大写,有最后一个字母大写),斜体字母+数字等。但蛋白质符号的定义基本相同,一般用相同的基因符号命名蛋白质,不用斜体,但要大写(或首字母大写)。这表明,基因与蛋白质符号的正斜体表达目前已有统一规定,只要作者使用的生物基因和蛋白质符号命名准确,再加以正斜体,即可用字母符号准确表达基因和蛋白质,即使“基因”和“蛋白质”两词省略,也能分清描述的是基因还是蛋白质。

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育类科技期刊中生物信息学常见名词用法错误辨析在线全文阅读。

科技期刊中生物信息学常见名词用法错误辨析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/lunwen/jiaoyu/1217369.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: