77范文网 - 专业文章范例文档资料分享平台

转录组学主要技术及其应用研究(2)

来源:网络收集 时间:2019-08-03 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

在不同状态下上成千上万个基因的表达状况、DNA序列分析等方面具有更大的优越性[12]. 有人誉赞“微阵列技术铺平了通往21世纪的医学之路”[13],相信在不久的将来, DNA芯片或微阵列技术将会广泛应用于基础及临床医学各个方面,而发挥出巨大的经济、社会效益。

随着微阵列技术的广泛应用,其内在缺陷也日益暴露出来,成为其发展的瓶颈。第一,技术水平还需要不断提高。非特异性杂交是微阵列技术的亟待解决的问题,目前,对于这个问题,在实验中一般采用提高杂交温度的方法,减少非特异性序列间的相互影响。然而在提高杂交温度的同时,又很可能造成微阵列灵敏性的降低,使一些应该能够检测到的基因表达状况得不到准确的反映,研究者只能在其中寻找平衡;第二,不同时间不同地点不同平台的微阵列结果难于比较。操作者本身造成的实验误差不可避免,还有样品DNA在取样上的误差,此外,由于实验仪器和操作平台的差别,包括不同实验地点的差别,也导致了相同样本检测到的表达基因相差很大[14];第三,数据处理难度大。由于微阵列往往集成了成千上万个基因信息,而且微阵列信号中往往掺杂了大量的背景噪音,最终大量的微阵列数据,如何与生物体内在的因素相结合,所以,微阵列技术中最大的挑战来源于数据的处理和数据的挖掘。

2.2 表达序列标签技术(EST)

基因表达序列标签(expressed Sequence tags,ESTs)为长约200-800bp的cDNA部分序列。最早利用EST技术是1991年Adms用人脑组织cDNA得到的EST进行的,当时人类基因组计划刚刚开始,一些科学家就主张cDNA测序应该先于基因组测序进行,原因是基因组的编码区代表了基因组绝大部分信息,而且是对我们直接有用的,而编码区长度只有总基因组长度的3%因此可以用最低的代价、最短的时间获取最多最有用的信息。有了EST的方法之后,人们可以用比cDNA测序更低的费用而得到等量的信息,因此EST技术已成为目前发现新基因的强有力的信息工具。

2.2.1 原理和方法

一个典型的真核生物mRNA分子由5’-UTR (5’ 端转录非翻译区)、ORF (开放阅读框架)、3’-UTR (3’ 端转录非翻译区)和poly (A )四部分组成,其cDNA具有对应的结构。对于任何一个基因, 其5’-UTR 和3’-U TR都是特定的,即每条cDNA的5’端或3’端的有限序列可特异性地代表生物体某种组织在特定的时空条件下的一个表达基因。来自某一组织的足够数量的ESTs可代表某种组织中基因的表达情况[ 1 ]。EST的数目可以反映某个基因的表达情况,一个基因的拷贝数越多,其表达越丰富,测得的相应EST 就越多。所以,通过对生物体EST的分析可以获得生物体内基因的表达情况和表达丰度。要获得生物体EST信息,通常应先构建其某个代表性组织的cDNA文库,然后从中随机挑取大量克隆,根据载体的通用引物进行测序,一般可以得到其5’或3’端的200-500 bp的碱基序列,然后将测得的EST序列与网上已有的EST数据库进行比较,根据同源性大小,可以初步鉴定出哪些EST 代表已知基因,哪些EST代表未知基因,并可以对生物体基因的表达丰度进行分析。

以EST 分析基因表达丰度的原理是这样的:基因x的高水平表达将导致高水平的mRNAx合成,而与mRNA x相对应的cDNA在cDNA文库中的含量也会很丰富。所以,在对cDNA 文库中的大量克隆进行随机测序后,统计与基因x的mRNA相对应的EST数目,就可估计原先mRNA群体中的mRNA x的丰度。而且,以与mRNA x相对应的EST 数目除以所得到的EST 总数,就可得到mRNA x 绝对丰度的估计值。White等人称这种以cDNA 测序来估计基因表达水平的方法为“电子Northern”(electronic Northern) 或“数字Northern”(digital Northern)。EST构建的技术路线为:提取样品的总RNA 或带有polyA的mRNA →构建cDNA文库,随机挑取大量克隆进行→EST测序→对测得的EST序列进行组装、拼接→对网上己有的EST数据库进行同源性比较→确定EST代表的是己知基因还是未知基因→对基因进行定位、结构、功能检测分析。

2.2.2 应用

(1)基因组物理图谱的绘制

通过已知的EST序列设计引物对基因组BAC文库进行PCR能产生扩增条带的那个克隆就是EST在染色体上的位置,这个EST就可以被定位在几号染色体上,进而亚定位至染色体的某个区段。另外也可以用EST序列提供的探针与基因组BAC文库杂交,同样能将某个已知EST在染色体上定位和亚定位。EST与STS(特定序列位点)在基因组作图上有相同的作用,而且EST位点还直接与一个表达的基因位置相对应。

(2)基因的电子克隆

电子克隆技术是以算法为核心,以计算机和互联网为工具,利用现有的表达序列标签(EST ) 和生物信息数据库,对其中大量EST进行分类、整合、组装,直接获得大片段或cDNA 全长的方法。由于EST 序列是全世界很多实验室随机产生的,所以属于同起来, 通过EST assembly 程序在EST 库中搜索与之高度重叠的EST ,并将它们组装成一致序列(consensus sequence) ,再用它检索数据库并逐次放宽匹配条件,重复组装以获得尽可能长的或全长cDNA 序列。电子克隆技术的出现,可充分利用现有的信息资源,别是利用其它模式生物的EST信息,快速发现有用基因。但该技术也有局限,如果参数限制条件太低,很可能会得到错误结果;而参数条件限制太高,就可能没有结果。对于所拼接出来的基因还需要从生物学意义上进行分离和鉴定。 (3)分离鉴定新基因

对某一特异组织或某一生长发育阶段的cDNA文库进行随机的部分测序,得到大量EST,将这些EST作查询项在dbEST中进行同源查找,同时将由EST推出的氨基酸序列作为查询项在PIR中查找类似物,很就可以识别这些基因到底是什么基因;对于那些在以上数据库中没有找到类似物的EST,再把它们置于6个ORF下,翻译出推定的氨基酸序列,将可能的氨基酸序列作为查询项,在PIR数据库中查找类似物,

果有类似物,就认为这个EST代表着这个蛋白的基因。对于通过EST数据库和PIR数据库已识别的EST,还可以通过探针杂交从cDNA文库中分离我们所感兴趣的那个全长cDNA克隆。对于那些在dbEST和PIR数据库中都没有类似物的EST,就可能是完全新的基因,需要进一步识别和研究它。 (4) 通过EST寻找SSR和SNP分子标记

从EST数据库中筛选SSR和SNP的主要优点在于,这样筛选出来的SSR和SNP分子标记直接与基因的编码区相对应,即得到的往往是基因相关标记(gene-associated markers);另外,从EST中筛选SSR和SNP比从基因组中筛选费用要小得多。筛选的大致步骤为:EST重叠群的组装;通过对大量重复的EST进行序列比较,识别出候选SSR或SNP;对候选SSR或SNP进行确认。总之,通过对大量EST数据的归纳整理是寻找SSR和SNP以构建高密度遗传图谱的最经济的方法。除了以上用途外,EST还在基因结构分析(内含子、外显子识别)、基因表达及重组蛋白表达的分析中具有重要作用。 (5)RNAi技术的研究

结合GATEWAY技术和基因转化技术用于突变体库建立的RNAi技术,开发出了pHellsgate 系列载体,将该技术与cDNA文库构建技术和大规模EST测序技术相结合,使得大规模基因的敲除成为了可能。RNAi 指外源性双链RNA (dsRNA )能抑制细胞内与其序列同源的基因的表达。在进化上,这可能是生物调控基因表达及抵御病毒侵染或转座子诱导DNA突变的一种共生有的生理机制。该技术最大的优点就是可以获得大规模的缺失突变体,为基因功能的研究提供了很好的研究工具,同时EST作为序列标签,可以很好地实现表型相关的基因克隆。

2.2.3 不足和展望

EST技术己成为一种强有力的工具,帮助人们揭示基因组所包含的信息,使基因组研究进入一个新的阶段。随着“后基因组”时代的到来,生物信息学在基因功能研究中发挥着越来越重要的作用。而EST数据处理和分析是生物信息学分析的核心任务之一,它为新基因的克隆和功能分析提供了新的出发点。EST数据库为新基因的发现和基因表达研究提供了大量的信息和分析材料,也为DNA分子标记的开发奠定了基础。

但是,目前EST研究还存在许多问题。第一,大量EST序列信息整理的问题。随着EST数据的不断增加,利用生物信息学方法建立高通量、自动化的EST数据分析平台,己成为EST研究急需解决的问题之一;第二,EST文库中基因表达丰度的问题。植物基因组极其庞大,某一特定组织在特定时期的基因表达频率各不相同。在获取有用的、新的EST方面效率较低,人力物力浪费严重;第三,就世界范围来讲,如何避免不同研究机构对同一物种进行重复测序,协调好科学家之间的分工,加快植物EST计划的进程,也是一个需要解决的问题。

2.3新一代高通量测序技术 2.3.1 原理和方法

(1)基因表达系列分析技术(SAGE)

SAGE技术是由Velculescu 等人[15]在 1995 提出,是一种可以定量并同时分析大量转录本的方法。1998年,Powell[16]利用生物素标记的PCR引物合成生物素标记的接头,并利用链霉抗生物素蛋白磁珠绑定接头,这就有效地去除了一些多余的接头,从而提高了 SAGE技术分析的效率。SAGE 技术大致理论依据有两点:第一,来自cDNA特定位置的一段9-13bp 的序列能够包含有足够的信息作为确认唯一一种转录物的SAGE标签(9个碱基能够分辨49个不同转录物);第二,将来自不同 cDNA 的 SAGE 标签集于同一个克隆中进行测序,就可以获得连续的短序列SAGE标签,而这些SAGE标签可以显示对应的基因的表达情况。SAGE 技术的主要技术路线:

1)将提取的总 RNA,通过生物素标记的oligo(dT)引物合成 cDNA,用锚定酶(一般为 4 碱基的限制性内切酶)酶切,利用链霉抗生物素蛋白磁珠收集酶切后cDNA片段的 3’部分。

2)将收集的 cDNA 片段分为两等份,分别加上含有标签酶(一种Ⅱ类限制酶,在距离识别位点大概 20 碱基处酶切 DNA 双链)识别位点的接头 A 和 B。

3)将连有接头 A 或 B 的 cDNA 短片段分别用标签酶酶切,再将两份样品混合,以连接形成双标签,这样就可以用与接头 A、B 互补的引物扩增。

4)用锚定酶酶切 PCR 富集的产物,得到双标签片段,将 10-50个标签序列置于一个克隆中进行测序。

5)对得到的标签数据进行处理。

为了适应不同的试验需要,目前出现了许多新型 SAGE 技术,如 superSAGE、robust longSAGE、PCR-SAGE、SAR-SAGE等[17]。虽然 SAGE 技术可以快速、大量分析细胞或组织的基因表达状态,但不能完全保证检测到一些低丰度的 mRNA,因而限制该技术的应用。 (2)大规模平行测序技术(MPSS)

MPSS 技术是由 Brenner 等[18]在 2000 年建立的以测序为基础的大规模高通的基因分析技术。其方法的理论基础[19]是:一个标签序列(一般10-20bp)含有其对应 cDNA 的足够识别信息,将标签序列与某种长的连续分子连接在一起,可以便于克隆和测序分析,而每个标签序列的出现频率又能够代表其相应基因的表达量。MPSS 技术的方法包括两个基本过程:第一,cDNA 片段、标签和微球体的结合;第二,测序反应。具体步骤为:

1)利用生物素标记的 oligo(dT)引物将 mRNA 反转录成 cDNA 双链,再将合成的生物素标记的 cDNA 片段用 Dpn Ⅱ限制性内切酶(酶切位点是GATC)消化。

2)将消化并纯化后的片段克隆到含有32bp TAG 序列的标签(tag)载体中,这样就可以通过与标签中序列互补的引物扩增插入的片段,再通过酶切,获得线性化的 PCR 扩增产物(含有 cDNA 序列和特异性的 32bp 标签序列)。

3)每个微球体含有一种与 32bp 标签序列互补的序列(anti-tag),PCR 扩增产物片段通过 32bp 标签与 anti-tag 杂交,进而连接到微球体上,每个微球体大概可以承载 104-105个相同的 cDNA 拷贝,将微球体排列在一个表面上。

4)测序反应过程,将接头、BbvⅠ酶(ⅡS 型限制性酶,可以酶切距离识别位点9-13个碱基)识别位点和识别序列(recognition sequence)结合在微球体上的 cDNA 片段上末端的4个游离碱基,加入 16 种不同的荧光标记的解码器探针与接头杂交,获得相应的荧光信号,以读取这4个碱基的序列,经 BbvⅠ酶消化后,在 cDNA 片段上再次产生4个碱基末端,去掉酶切序列后可以进行下一轮的分析,这样经过5次反应就可以测出每一个微球体上长度为 17bp 的cDNA序列。

该技术的特点是可以分析未知序列的基因、基因组覆盖度高、能测得低表达丰度的基因、实验效率高,但要选择合适的标签序列,如果出现基因和标签之间的非特异性,将容易产生分析错误。 (3)RNA 测序技术(RNA-seq)

该技术首先将细胞中的所有转录产物反转录为cDNA文库(利用最新的SMS技术可略去这一步,直接对RNA进行测序[20]),然后将cDNA文库中的DNA随机剪切为小片段(或先将RNA片段化后再转录),在 cDNA 两端加上接头利用新一代高通量测序仪测序,直到获得足够的序列,所得序列通过比对(有参考基因组)或从头组装(denovoas-sembling,无参考基因组)形成全基因组范围的转录谱。

2.3.2 应用

(1)SAGE技术能够同时检测到大量的基因转录本,一个测序反应可得到40个左右标签序列。同时,由于SAGE技术的灵敏度很高,可以检测出低丰度表达的基因,所以通过该技术不仅能够很全面的获得基因表达的数目、表达丰度等信息。因此,SAGE技术是一种预测基因数目和发现新基因的有效途径。SAGE还可用于在不同生理状态、不同环境、或不同生长阶段的细胞或组织的基因表达图谱构建,对不同状态下基因表达水平的定量或定性比较。目前,通过SAGE技术对疾病组织与正常组织的基因表达差异的进行比较应用较多,而且己发现了许多在癌症组织中上调表达的基因。这些上调基因,尤其那些是在正常组织中不表达或少量表达的基因,很可能成为有用的肿瘤诊断和预测指标或潜在的治疗位点。 (2)MPSS一方面可提供某一cDNA在体内特定发育阶段的拷贝数,另一方面还可测定出相应cDNA 17 bp的序列,所以这就为在转录水平上进行基因表达分析提供了强有力的定性和定量手段,很明显,这一技术首先可以应用于不同丰度基因的差异表达分析,制作基因转录图谱,这无疑将加速新基因克隆和基因功能的分析。MPSS所获得的基因序列可提供PCR引物,可通过比较Gen Bank EST 数据库等进行

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库转录组学主要技术及其应用研究(2)在线全文阅读。

转录组学主要技术及其应用研究(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/676006.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: