第一章 基因组
1、假基因的种类1) 重复假基因: 串接排列, 具有祖先基因的组成特点, 具内含子和外显子,突变失活. 2) 加工假基因: 由RNA反转录再插入基因组中的基因顺序, 无内含子.3) 残缺假基因: 因不等交换使部分顺序缺失. ☆2、假基因能否转录?为什么
1)最初人们认为, 假基因是不能转录的基因, 有些名词解释即以此特征定义假基因, 并不确切.2)随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子的加工的假基因.3)假基因的转录产物已失去原有的功能, 如产生残缺蛋白质. 3、假基因有没有功能?
有两层含义:1)相对于原来的功能基因而言,假基因已失去正常功能.2)假基因是否产生了新的功能. 4、基因组的结构特征:1) C值悖理 2) 基因组DNA的顺序组成 3) 顺序复杂性 4) 基因与基因家族 5) 真核基因组与原核基因组
5、基因组的序列组成:1) 单一顺序: 基因组中只有单拷贝的顺序;2) 中度重顺序: 拷贝数在1—10万, 长度50-1000 bp在基因组中分散分布;3) 高度重复顺序: 串接排列, 拷贝数达数百万, 离心时形成卫星带. 6、假基因可能的功能:1)假基因原有功能已失去原有活性.2)有些假基因产生了新的功能:1. 产生反义RNA, 抑制靶基因功能.2. 在RNA水平与正常基因的mRNA竞争, 起调控作用, 如软体动物Lymnaea stagnalis 的神经细胞NO合成酶假基因产物NOS酶的合成.3. 在DNA水平与正常基因竞争转录因子, 起抑制作用, 如老鼠的Makorin1基因的转录.4. 作为人类免疫球蛋白多样性的顺序库.
7、真核生物基因组的特征:1)结构松弛2)大量重复顺序3)由线性DNA与蛋白质组成染色体结构4)含有细胞器基因组
8、原核生物基因组的特征:1)结构紧凑2)大小在5 Mb以下3)缺少重复顺序4)很少非编码顺序
第二章 遗传图绘制
☆1、什么是SSR标记(简单序列长度多态性SSLP)? SSR标记有哪些优点?如何寻找SSR标记?
① SSR,即SSLP 第二代分子标记.,简单序列长度多态性(simple sequence length polymorphism, SSLP)1)可变排列的简单重复顺序, 即重复次数不一,在染色体的同一座位重复顺序拷贝数不同;2)SSLP的类型: 小卫星序列(minisatellite), 重复单位较长微卫星序列(micrisatellite), 重复单位较短,在1-6个核苷酸之间
②优点:1)在基因组中的分布具有多态性、频率高、分布均匀的特点;2)可采用PCR方法直接扩增,经聚丙烯酰胺凝胶电泳直接分型检测。 ③如何寻找微卫星序列标记?
1)1982年Hamada等首次报道microsatrllite现象 (PNAS, 79:6564, 1982)2)1989年Weber等从GenBank中发现人类基因组的8个位点中, 有7个位点存在(CA)n拷贝数的变化(Am.J.Hum.Genet., 44:388, 1989).3)现已证实人和老鼠基因组中平均每18-28 kb含有一个多态性(CA)n.4)获取方法: a) 机算机搜寻; b) 用Sau3A, RsaI, HaeIII或AluI限制酶酶切基因组DNA, 构建DNA文库. 合成简单寡聚重复核苷酸作为探针从库中筛选.5)根据简单重复顺序两侧的序列设计引物, 用同位素标记PCR扩增样品, 经聚丙烯胺凝胶电泳分辩. 2、遗传作图标记:基因标记和DNA标记
3、RFLP(限制性片段长度多态性)的特点:1) 处于染色体上的位置相对固定;2) 同一亲
1
本及其子代相同位点上的多态性片段特征不变; 3) 同一凝胶电泳可显示不同多态性片段,表现为共显性.
4、如何寻找RFLP标记:1) 随机克隆筛选;2)将其它方法获得的DNA标记, 如RAPD标记转换为RFLP标记;3)从cDNA 中寻找RFLP.4)计算机筛选.
6、VNTR和STR的比较:1)小卫星序列在基因组中的分布很不均匀,大多集中在染色体端部和着丝粒区,而微卫星序列则分布在整个基因组中,且密度较高;2)微卫星序列便于PCR分析,当PCR扩增的DNA长度少于300bp时,反应既快速又精确。小卫星序列因其重复单位较长,加之许多重复序列往往串接在单个序列中,不利于PCR对样品的扩增。
7、SNP (single nucleotide polymorphism,单核苷酸多态性) 特点:1)理论上同一碱基位置SNP等位型式最多为4.2)直接从STS测序中可寻找到 SNP.3)MIT Whitehead Institute 经分析证实, 人类基因组平均每1 kb 含有一个SNP. 估计人类基因组有300万个SNP.4)SNP与人类易感性疾病有关, 涉及药物基因组学.5)编码区SNP主要分布在密码子的第3个碱基位置.
8、为何要绘制遗传图与物理图1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图譜进行指导.2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图.3)遗传图和物理图各有优缺点,必须相互整合校正 (基因组图)
第三章 物理图绘制
1 、物理图绘制种类1)限制性作图(Restriction mapping)它是将限制性酶切位点标定在DNA分子的相对位置。2)基于克隆的基因组作图 (Clone-based mapping) 根据克隆的DNA片段之间的重叠顺序构建重叠群, 绘制物理连锁图。3)荧光原位杂交(Fluorescent in situ hybridization, FISH) 将荧光标记的探针与染色体杂交确定分子标记的所在位置。4)序列标签位点(Sequence tagged site, STS)作图通过PCR或分子杂交将小段单拷贝DNA顺序定位在基因组的DNA区段中。 二STS作图依据的原理是什么
顺序标签位点(Sequence tagged site, STS)作图 通过PCR或分子杂交将特定DNA 顺序定位在基因组染色体区段中.
☆2、STS作图原理:1)基因组中单一序列标签位点(STS)都由独一无二的序列组成,在染色体上的位置是确定的.2)位于染色体上近邻排列的STS是机械连接的,在外力作用下断裂DNA或部分酶解DNA时,2个不同STS出现在同一片段的机会取决于他们在基因组中的相对位置 ☆3、DNA指纹有哪些:1)限制性带型指纹:用不同限制酶处理样品,经凝胶分离产生DNA条带。2)重复序列DNA指纹:将不同克隆的DNA限制性片段电泳后转移到杂交膜中,用一种或几种基因组范围的重复序列作为探针与之杂交,如出现相同的杂交带型,可判断这2个克隆是重叠的3)STS(sequence tagged site)作图指纹:基因组中单一序列。[重复序列DNA PCR或分散重复序列PCR]
4、为什么要绘制物理图1)遗传图的分辨率有限2)遗传图的覆盖面较低3)遗传图分子标记的排列有时会出现差错
5、克隆作图的载体与方法:1)大分子DNA克隆载体构建: YAC:酵母人工染色体; BAC:细菌人工染色体 PAC:P1人工染色体
2) 大分子DNA克隆的作图:步移法、指纹法
第四章 基因组测序与序列组装
☆1、DNA测序中采用的DNA聚合酶与细胞的DNA聚合酶有什么差别?(链终止法对DNA聚合酶的要求) 1)高酶活性:主要指聚合酶在终止合成前,多聚核苷酸分子可延伸的有效长度,如果测序所用
2
的聚合酶与模板结合能力强,在终止核苷酸掺入新链之前不会脱离模板,即不会提前终止反应2)无5‘-3’外切酶活性 :大多数DNA聚合酶都有外切核酸酶活性,5撇到3撇核酸酶活性可将新合成DNAl链的5撇末端除去核苷酸从而改变链的长度,,给序列的阅读造成困难与误差.3)无3‘-5’外切酶活性: 许多DNA聚合酶都有较读功能,具有3撇到5撇外切核酸酶活性,可以将错配的碱基除去,,再补上正确配对的核苷酸.在DNA测序反应时,这一活性同样会产生干扰条带.
☆2、454测序技术测序原理:(焦磷酸测序法工作原理)依靠生物发光进行DNA序列分析的新技术,在DNA聚合酶、ATP硫酸化酶、荧光素酶和双磷酸化酶的协同作用下,将引物上每一个dNTP聚合与一次化学发光信号释放耦连起来,通过检测化学发光信号的有无和强度,达到实时测定DNA序列的目的。
策略有俩中,一种为作图测序,一种为鸟枪法测序.
覆盖面指随机测序获得的序列总长度与单倍体基因组序列总长之比。 覆盖面越大,遗漏的序列越少。
3、DNA测序的方法:链终止法;化学降解法;自动化测序;非常规测序。 4、三个测序:DNA测序;基因组测序;人类基因组测序
5、不同测序路线与序列组装策略的比较:鸟枪法测序的优点:速度快,无需提供相关的遗传图和物理图。局限性:工作量大;存在大量的难以填补的间隙
6、基因组测序的其他路线:重要区域的优先测序;EST测序;序列浏览 7、基因组鸟枪法测序要构建大小不同的插入片段克隆文库,原因何在?
1)采用多个基因组文库时因为任何一种载体都会因某些插入片段与宿主菌的不兼容而不能扩增,使一些DNA片段丢失2)多种质粒文库也增加了克隆片段的总长,扩大了覆盖面3)10kb文库的构建有助于在2kb质粒来源的两端测序序列组装时校正由重复序列产生的差错 4)Fosmid和BAC文库的构建可以使下片段DNA文库组建的重叠群在大分子克隆中有效而准确地归并与整合,避免了再全基因组范围内直接进行重叠群排序所产生的错误,可提高序列组装的效率,保证序列组装的可信度。
8、链终止法技术要点:1)制备相同的单链模板DNA 2)引物:决定了DNA测序的起点3)底物:4种dNTP和少量的双脱氧核糖核苷酸4)DNA聚合酶。
第五章 基因组序列诠释
☆1 、什么是ORF?在基因注释中ORF有何意义?
开放阅读框 ORF:指由一系列指令氨基酸的密码子组成,包括一个起始密码子(ATG),还有一个终止密码子(TAA,TAG,TGA)
①ORF扫描的关键是终止密码子在6种读框中出现的频率。最可能的选择 ORF不少于100个密码子;②细菌基因组中缺少内含子,非编码序列仅占11%,对读框的排查干扰较少。 真核生物ORF阅读较复杂:1)基因间存在大量非编码序列;2)绝大多数基因含有非编码的内含子,以上均为根据基因结构特征搜寻基因. ☆2 、基因功能检测: ①基因失活
基因敲除:将一段无关的DNA片段用来取代某一特定的基因。
原理:在一段无关片段的两侧连接与代换基因两侧相同的序列,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因整合到染色体中。 ②基因过表达
基因产物的不足与过量表达会破坏其它产物的平衡,并表现出生长与发育的异常。 两种技术手段:增加基因的拷贝数;采用强启动子
3
☆3 、蛋白质互作的方法: ①噬菌体外显
原理:检测的基因与噬菌体外壳蛋白基因融合,表达后可产生融合外壳蛋白,当噬菌体遇到可与融合外壳蛋白互作的蛋白质时会发生聚合。
噬菌体外显操作程序:1)用于噬菌体外显的克隆载体是噬菌体基因组,在编码外壳蛋白的基因内部有一限制性酶切位点,可插入外源DNA。2)将许多不同的DNA序列插入外壳蛋白基因内部的克隆位点可构建噬菌体外显库。3)转化受体细胞后,细菌可涂抹在固体培养基中,产生噬菌斑。噬菌斑转化到硝酸纤维膜上,检测与其它蛋白的交互作用。 ②酵母双杂交系统
原理涉及转录因子与启动子之间的互作
转录因子有2个重要的功能区域,DNA结合域与转录激活域
4、真核生物基因的组成特征:密码子偏爱;外显子-内含子边界;上游控制序列;外显子、内含子的组成
5、外显子的组成特点:1)CpG岛:脊椎动物2)摇摆密码子的使用频率或密码子偏爱3)5’和3’非翻译区(UTR)碱基比率, 水稻基因5’的高GC比4)不含或含有较少的终止密码 6、实验确认基因:任何基因都可转录为RNA拷贝,这是实验确认基因的依据。 1)分子杂交可确定DNA片段是否含表达序列2)由EST和cDNA指认基因3)DNA序列中基因位置的确定4)全长cDNA边界序列文库的构建
第六章 基因组解剖
☆1、异染色质与常染色质的差别是什么 深色区分布在细胞核的周缘,称为异染色质
组成型异染色质:持久性结构,不含任何基因,总是保持致密的组成状态。包括着丝粒和端粒DNA以及其他一些区域;兼性异染色质:非持久性异染色质,仅在某些细胞或细胞某一阶段出现
异染色质结构紧密,使控制基因表达的蛋白无法接近DNA。
常染色质,染色浅,基因处于活性状态,松弛,可与调控因子接触,分布在整个细胞中。 ☆2、CpG岛的一般特点(重点)
1)主要在脊椎动物中发现,其它种属基因组中也有CpG岛, 但特征不明显.2)绝大多数CpG岛中很少出现胞嘧啶甲基化, 因此被认为是基因转录活跃区.3)CpG岛主要分布在基因的启动子区和第一个外显子区.4)绝大多数管家基因含有CpG岛, 是寻找基因的一个指标. CpG岛的分布:脊椎动物中CpG岛的分布有如下特点: 1)主要分布在基因的5‘端和第1个外显子区.2)人类中40%的管家基因的5‘端均含CpG岛. 3)双碱基-CpG-具回文结构,是甲基化酶作用的位点,可、在回文对称的两个胞嘧啶5位碳原子上进行甲基化. 在CpG岛中-CpG-双碱基均无甲基化.
☆3、为何会产生CpG岛?(重点)
1)由于细胞内胞嘧啶甲基化与脱氨基事件常常发生, 导致复制时的C→A错配.在下一轮复制时原来的胞嘧啶(C)位置由胸腺嘧啶(T)取代, 即发生碱基代换. 因此基因组DNA顺序进化的总趋势是A/T比例增加.2)管家基因对生物的存活极其重要, 启动子区是基因调控的主要成分, 因此很少发生可遗传的C→A的突变, 保留了较平均值更高的G/C比. ☆4、线粒体基因组和叶绿体基因组在结构与组成上有何差别?
高等植物线粒体基因组的结构特点:1)结构非均一性: 线性和环状DNA共存.2)拷贝非均一性: 同细胞不同亚基因组DNA的拷贝数并不相同.3)不同种属之间线粒体基因组大小变化很大, 在120 –2500 kb之间.4)动态变化: 不同发育时期,每个细胞线粒体基因组的拷贝数不是恒定的.5)分子内重组: 高等植物线粒体基因组中含有大量短序列重复顺,它们之间的重
4
组导致大量的DNA顺序重排, 是Mt DNA频繁突变的主要原因.
高等植物叶绿体基因组特点:1)结构紧凑, 基因之间排列紧密, 很少非编码顺序. 2)不同种属之间叶绿体基因组大小比较恒定, 约在120 kb左右.3)动态变化: 不同发育时期,每个细胞叶绿体基因组的拷贝数是不衡定的.4)有两段很长的反向重复顺序, 这一结构可有效地阻止叶绿体环状DNA的分子内重组, 这是叶绿体基因组很少发生重排的主要原因.
5、基因组的结构成分:1)SAR和MAR2) CpG岛3) 等高线4) 富基因区5)“沙漠区”或贫基因区
6、MAR和SAR的特征:1)当用交联剂如EtB处理提取的真核细胞核时,部分解旋的DNA可从细胞核中突出形成25-600 kb长的环突.2)这些环突的DNA基部与细胞核基质紧密结合, 将染色体DNA分成相对独立的结构区域.3)与细胞核基质结合的DNA顺序(基质附着区, MAR)含有较高比例的AT, 约占总DNA的10%.4)拓扑酶II可与MAR结合, 因此推测MAR成分与DNA复制有关.5)SAR可用二碘水扬酸铝分离, MAR则用高盐NaCl溶液分离.6) MAR或SAR之间的距离平均为30 kb, 染色体DNA环突长约25-600 kb, 因此并非所有MAR或SAR均与基质或骨架结合.
7、基因组的顺序组成:1)编码顺序2)非编码顺序3)重复顺序4)单一顺序
第十章 基因组表观遗传
1、基因组印记是如何产生的?
1)1991年TM.德切艾拉等报道, 老鼠7号染色体上中有一个称为类胰岛素生长因子Igf2的基因(insulin-like growth factorII),该基因的突变纯合子表现为侏儒症.在杂合子中,如果突变等位基因来自父亲, 表型异常.如果来自母亲,表型正常,即母源Igf2基因在子代被抑制.2)这种因为亲本来源不同而使等位基因表达模式发生改变的现象称为印记(imprinting).它有两个特点: ①子代的两个等位基因中有一个发生沉默, 即不表达.②哪一个等位基因沉默取决于等位基因的亲本来源. 这是在哺乳动物中最早发现的表观遗传现像. 随后又在老鼠中发现另外一个基因, 即7号染色体上与Igf2紧密连锁的H19也有类似的情况, 只是表现相反, 即父源的H19等位基因在子代中不表达, 母源的H19基因在子代中正常表达. ☆3、核小体组蛋白有哪些修饰方式?为什么组蛋白修饰可促使染色质松弛?
1) 乙酰基化(可逆) 2)甲基化(不可逆 ) 3)泛素化(可逆) 4)Sumoylation(可逆) 5) 磷酸化(可逆) RNAi可介导组蛋白修饰
4、组蛋白乙酰基化是基因在染色质水平表达调控的主要方式之一. 组蛋白乙酰基化使其与DNA的结合松弛, 利于核小体位移.
☆5、基因组如何阻止相邻基因之间表达调控的干扰?
①座位控制区(LCR):一段DNA序列,能够控制下游基因的表达。 绝缘子可阻止相邻基因之间增强子的彼此干扰
1)真核生物增强子具有双向作用, 超长距离功能, 从而带来位置相邻基因之间的彼此干扰问题.2)有些基因位与异染色质邻近, 会受到抑制效应的干扰.绝缘子可以阻止上述因位置原因产生的对基因表达的抑制. ②副突变
副突变不涉及基因结构的改变,只是等位基因的表达模式不同于原来的同源基因。
这种副突变的原因是,两个同源的等位基因之间存在反式互作,使其中一个等位基因的DNA甲基化状态发生改变从而导致染色质结构的变化,并进一步影响到基因的表达。 ☆6、什么是剂量补偿?果蝇与哺乳动物剂量补偿机制有何不同? 1)剂量补偿效应:指的是在XY性别决定机制的生物中,使性连锁基因在两种性别中有相等或近乎相等的有效剂量的遗传效应。也就是说,在雌性和雄性细胞里,由X染色体基因编码产生的酶或其他蛋白质产物在数量上相等或近乎相等。
5
2) 剂量补偿---哺乳动物
剂量补偿效应的一种机制则是通过失活雌性细胞中的一条X染色体来实现的 剂量补偿---果蝇
机制:调节X染色体的转录速率
7、表观遗传的特征:可遗传;可逆性;DNA不变
8、基因组印记的生物学意义:1)基因组印记使两倍体体细胞中的一个等位基因沉默, 这与两倍体生物学的意义是相悖的, 容易使突变等位基因暴露.2)目前已有三种理论用予解释基因组印记的生物学意义:进化理论: 一组各有缺陷的基因在相互组。合时有优势, 为了不被淘汰而暂时沉默.卵巢期理论: 避免畸胎瘤, 需要胎盘基因沉默.冲突理论: 血缘关系理论 9、核小体:1)核小体是染色质结构的基本单位.2)核小体是连接DNA和染色体高级结构的中间环节.3)核小体核心8聚体与DNA的结合不是随机的.4)核小体核心8聚体与DNA的结合位置是动态的.
10、核小体的定位方式:平移定位; 旋转定位
11、DNA甲基化:1) 细胞命运的确定与基因组DNA的甲基化状态有关2)DNA甲基化是决定基因表达模式的重要因素3)DNA甲基化模式可以在上下代细胞之间传递4)DNA甲基化只限于碱基的修饰
12、与位置效应有关的调控因子:座位控制区;绝缘子;副突变
13、副突变的分子机制:配对模型:重复序列的配对可能改变重复序列在亚细胞核定位,从而确立一种特别的染色质构型使基因表达水平降低 反式-RNA模型:长链RNA;小分子RNA
第十三章 基因组进化的模式
☆1、基因组通过什么方式增加基因的数目
1)整个基因组加倍; 2)单条或部分染色体加倍;3)单个或成群基因加倍。 ☆2、新基因的产生有哪些主要方式
1)基因加倍之后的趋异, 这类基因基本保持原有的基因功能, 但往往获得了新的表达模式. 这是新基因产生的主要方式.2)外显子或结构域洗牌, 即不同的结构域加倍或重组, 产生具有创新功能的基因. 真核生物约19%的基因产生于外显子洗牌.3)逆转录及其随后的趋异或重排.4) 外源基因水平转移.5)基因裂变与融合, 由一个基因分裂成两个不同的基因, 或两个或多个基因融合组成一个新的基因. 原核生物约0.5%的基因由此产生. 6)非编码顺序转变为编码顺序.
☆3、什么是外显子洗牌?他在基因组进化中起什么作用
外显在洗牌 :由不同基因中编码不同结构域的片断彼此连接形成的全新编码序列称为
作用:1)外显子的不同排列和重新组合是基因创新的原动力.2)它们有一个全新的结构组合,可为细胞提供完全不同的生物学功能3)结构域洗牌同样是新生转录因子基因产生的主要方式
6
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库基因组学大题在线全文阅读。
相关推荐: