dna序列的两端为反向dna重复序列列,若发生同源重组将会产生什么结果

 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
第一章 DNA超螺旋、基因组与染色体
下载积分:2000
内容提示:第一章 DNA超螺旋、基因组与染色体
文档格式:PPT|
浏览次数:1|
上传日期: 14:58:18|
文档星级:
全文阅读已结束,如果下载本文需要使用
 2000 积分
下载此文档
该用户还上传了这些文档
第一章 DNA超螺旋、基因组与染色体
关注微信公众号当前位置: >>
农科院―分子遗传学
农科院―分子遗传学 2002 年博士入学考试题 名词解释(每个 4 分,共计 40 分) 1、反义 RNA:反义 RNA 是指与 mRNA 互补的 RNA 分子, 也包括与其它 RNA 互补的 RNA 分子。由于核糖体不 能翻译双链的 RNA,所以反义 RNA 与 mRNA 特异性的互补结合, 即抑制了该 mRNA 的翻译。通过反义 RNA 控 制 mRNA 的翻译是原核生物基因表达调控的一种方式,最早是在 E.coli 的大肠杆菌素的 Col E1 质粒中发 现的,许多实验证明在真核生物中也存在反义 RNA。近几年来通过人工合成反义 RNA 的基因, 并将其导入细 胞内转录成反义 RNA, 即能抑制某特定基因的表达,阻断该基因的功能, 有助于了解该基因对细胞生长和分 化的作用。同时也暗示了该方法对肿瘤实施基因治疗的可能性。 反义 RNA 的来源:细胞中反义 RNA 的 来源有两种途径∶第一是反向转录的产物,在多数情况下 , 反义 RNA 是特定靶基因互补链反向转录 产物 , 即产生 mRNA 和反义 RNA 的 DNA 是同一区段的互补链。第二种来源是不同基因产物,如 OMPF 基因是大肠杆菌的膜蛋白基因,与透性有关,其反义基因 MICFZE 则为另一基因。反义 RNA 的分类 和作用机制:反义 RNA 的分类和作用机制:下表总结了原核细胞内天然存在的 11 种反义 RNA 。这些 反义 RNA 按其作用机制可经分为三大类。 Ⅰ类 : 这类反义 RNA 直接作用于其靶 mRNA 的 SD 序列和 / 或编码区,引起翻译的直接抑制 ( Ⅰ A 类 ) 或与靶 mRNA 结合后引起该双链 RNA 分子对 RNA 酶Ⅲ的敏感性增加,使其降解 ( Ⅰ B 类 ) 。Ⅱ类 : 这类反义 RNA 与 mRNA 的 SD 序列的上游非编码区结合,从而抑制靶 mRNA 的翻译功能。其作用机制 尚不完全清楚,可能是反义 RNA 与靶 mRNA 的上游序列结合后会引起核糖体结合位点区域的二级结 构发生改变,因而阻止了核糖体的结合。Ⅲ类 : 这类反义 RNA 可直接抑制靶 mRNA 的转录。 ticRNA(transcription inhibitory complementary RNA) 是大肠杆菌中 CAP 蛋白 (cAMP 结合蛋 白 ) 的 mRNA 的反义 RNA 。 ticRNA 的基因的启动子可被 cAMP-CAP 复合物所激活,从 CAP mRNA 的转录 起始位点上游 3 个核苷酸处开始,以 CAP mRNA 的模板 DNA 链的互补链为模板,合成 ticRNA 。ticRNA 具体长度不清楚, 但是它是 5' 端一段正好和 CAP mRNA 的 5' 端有不完全的互补, 可以形成双链的 RNA 杂交体。而在 CAP mRNA 上紧随杂交区之后的是一段约长 11bp 的 A , U 丰富区。这样的结构十分类 似于 ρ 不依赖性的转录终止子的结构,从而 CAP mRNA 的转录刚刚开始不久后即迅速终止。从这个 例子中我们可以看到 CAP 蛋白合成的自我调节作用。当 CAP 合成达一定量后,即可与 cAMP 结合成 cAMP-CAP 复合物。再激活 ticRNA 的启动子转录出 ticRNA ,反过来抑制 CAP-mRNA 的合成。 反义 RNA 的功能:在原核生物中反义 RNA 具有多种功能,例如调控质粒的复制及其接合转移,抑制 某些转位因子的转位,对某些噬菌体溶菌 - 溶源状态的控制等。下文仅举数例。 1. 调控细菌基因的 表达 : 反义 RNA 对编码 CAP 的基因的调控作用已如前述。这里再介绍一下 micF RNA 对 ompF 基因的 表达的调控。 ompF 蛋白质是大肠杆菌的外膜蛋白的主要成分这一。 micF RNA 是从另一基因 (ompC 基因 ) 附近的 DNA 序列转录而来,和 o-mpFn RNA 的 5' 端有 70% 的序列互补,因此在体外 micF RNA 可以抑制 ompF mRNA 的翻译。但是这种抑制作用在体内是否重要尚有疑问,因为缺失 micF 基因的 菌株其 ompF 蛋白的表达只受到轻微的影响。 2. 噬菌体溶菌 / 溶源状态的控制 : 反义 RNA 也参与了 λ 和 P22 噬菌体的溶菌 / 溶源状态的控制。 P22 噬菌体编码一种抗阻遏蛋白 Ant ,它可以抑制许多 λ 样噬菌体的阻遏蛋白与 DNA 的结合。这对于刚刚感染细胞的 P22 建立 λ 样原噬菌体 (prophage) 是 有益的。但是 Ant 必须在严格的控制下,否则 Ant 的过分表达必将阻止溶源状态的建立,而成为溶 菌性的噬菌体。 Ant 蛋白质表达的控制是利用反义 RNA(sarRNA) 能与 ant mRNA 的翻译起源区互补结 合,从而抑制 ant mRNA 翻译成 Ant 蛋白。在 λ 噬菌体中 c Ⅱ蛋白控制着溶菌或溶源状态的选择。c Ⅱ蛋白可以激活 λ Pre 启动子,该启动子控制的基因是 λ 噬菌体整合作用所必须的,且同时能抑 制 λ 噬菌体的复制。 c Ⅱ蛋白的另一功能是延缓 λ 晚期基因的表达,其作用机制是 c Ⅱ蛋白激活 PaQ 的启动子,转录出 PaQRNA 。PaQRA 是编码 Q 蛋白的 mRNA 的反义 RNA 。因此,PaQRNA 能与 QmRNA 配对杂交而抑制其翻译,而 Q 蛋白早已知道是晚期基因表达的激活蛋白。 c Ⅱ基因本身的表达还受 到称为 oopRNA 的反义 RNA 的调控。 oopRNA 与 c Ⅱ基因的 3' 端互补,但其具体作用机制尚不清楚。 3.IS10 转位作用的抑制 :outRNA 是一种反义 RNA ,可以和 IS10 编码的转位酶 mRNA(INRNA)5' 端结合 而抑制其翻译,当细胞内只有一个考贝 IS10 时,只能生成很少量的 outRNA ,故转位酶仍可生成。 但当 IS10 的考贝数增多时,outRNA 愈来愈多,其控制作用亦明显增强,所以称为多考贝抑制现象。 这种现象可以防止 IS10 的过量堆积引起的细胞损害。 人工合成构建反义 RNA 既然反义 RNA 在原核生物中对基因表达起着重要的调控作用,那末人工设计 在天然状态下不存在的反义 RNA 来调节靶基因的表达,想必也是可能的。这已在不少实验中得到证 实。 1. 由于目前对靶 mRNA 的 SD 序列的上游区的结构了解甚少,因此,在要设计 Ⅱ类反义 RNA 用 于和靶 mRNASD 序列上游区结合,以期达到调节该 mRNA 翻译的目的是比较困难的。 2. Ⅲ类反义 RNA 是和 mRNA 的起始处结合而形成类似 ρ - 不依赖性的转录终止子而使转录水平上抑制靶基因的表达。 因此,要设法在靶 mRNA 上找到一段连续的 U 序列,就可以设计出反义 RNA ,与该 U 序列上游的 mRNA 链互补,以形成 ρ - 不依赖性终止子。理想的作用位点是在靶 mRNA 的 5' 端上游的非编码区,以免 受核糖体的影响。 3. 只要靶基因的核苷酸顺序已经知道,就可以 人工设计出Ⅰ类反义 RNA 。有时还 可设计同时具有Ⅰ类和Ⅲ类反义 RNA 功能的反义 RNA 。我们还可以设计出天然存在的反义 RNA 的反 义 RNA 来。这样就可以拮抗原始反义 RNA 对靶 mRNA 的抑制作用。而达到激活或加强某个靶基因的 表达的目的。然而并不是所有的 mRNA 对其相应的Ⅰ类反义 RNA 都敏感。例如,有的 mRNA 寿命很短, 只有 1-2 分钟,它们和反义 RNA 结合的机会较少,因而就较不敏感。反之,另一些 mRNA 则很稳定, 寿命可达十多分种,则其对相应的反义 RNA 的抑制作用就很敏感。此外,反义 RNA 本身的稳定性有 很大的实际意义。显然,稳定的反义 RNA 对靶 mRNA 的调节作用比不稳定的反义 RNA 要好。使反义 RNA 分子稳定的方法如下: [1] 反义 RNA3' 端带有茎环结构或类似 ρ - 不依赖性终止子结构时,可以 稳定 RNA 分子。[2]Gorski 等还发现在 T4 噬菌体的基因 32mRNA 的 5' 端上游的茎环结构及其附近的 序列亦可稳定 RNA 分子。所以在设计反义 RNA 基因时,最好将产生 3' 及 5' 端这种二级结构的序列 克隆在反义 RNA 基因的两端。Hirashima 等 1986 年发现,针对靶 mRNA 的 SD 序列和 AUG 区域的反义 RNA ,要比单纯对编码区域的反义 RNA 更为有效。1989 年 Hirashima 又发现,针对 SD 序列和它的上 游区域 ( 但不包括 AUG) 的反义 RNA 更为有效。 在真核生物中, 针对 5' 端非编码区的反义 RNA 更有效。 但也有实验表明针对第一内含子的反义 RNA 也同样有效。现在设计反义 RNA 基因是时应注意之点总 结如下: [1] 长的反义 RNA 并不一定比短的反义 RNA 更为有效。 [2] 在原核生物中针对 SD 序列及其 附近区域的反义 RNA 可能更有效。 [3] 在真核生物中,对应于 5' 端非编码区的反义 RNA 可能比针对 编码区的反义 RNA 更有效。 [4] 尽量避免在反义 RNA 分子中出现自我互补的二级结构。 [5] 设计的 反义 RNA 分子中不应有 AUG 或开放读框,否则该反义 RNA 亦会与核糖体结合而影响其与靶 mRNA 的 配对结合。 [6] 进一步还可以将带有 ribozyme 结构的 RNA 连在反义 RNA 的 3' 端尾上,当反义 RNA 与靶 mRNA 杂交后,即可利用其酶活性来降解靶 mRNA 。此外,为了增强反义 RNA 的作用,还可以采 取一些额外措施,例如 :[1] 由于反义 RNA 对靶 mRNA 的抑制作用有剂量依赖性,所以在构建反义 RNA 基因时,要选择强的、可以诱导的启动子以增强反义 RNA 本身的表达。 [2] 构建许多个反义 RNA 基 因串连在一起,以得到线性重复的多拷贝基因,对提高反义 RNA 的表达也有利。[3]RNA 酶Ⅲ可以降 解 RNA:RNA 杂交体,所以在构建反义 RNA 基因时,可将 RNA 酶Ⅲ的基因也同时转化到靶细胞中并进 行表达。这样,当反义 RNA 与靶 mRNA 结合后,RNA 酶Ⅲ即可将其降解。这显然有利于反义 RNA 的抑 制作用。近年来,有关反义 RNA 的研究进展迅速,已经应用到抗病毒感染,研究癌基因的作用机制, 探索肿瘤治疗的可行途径等方面。在今后一段时间内,有关反义 RNA 的研究肯定将会有更加迅速的 进展和更广阔的应用前景。反义 RNA 技术: 随着分子生物学和遗传工程的发展,基因治疗应运 而生,反义技术是其中一种,它的基础是根据核酸杂交原理设计针对特定靶序列的反义核酸,从而 抑制特定基因的表达,包括反义 RNA 、反义 DNA 及核酶( Ribozyme ) ,它们通过人工合成和生物合成 获得。 (一)反义 RNA ,根据反义 RNA 的作用机制可将其分为 3 类:Ⅰ类反义 RNA 直接作用于靶 mRNA 的 S D 序列和 ( 或 ) 部分编码区,直接抑制翻译,或与靶 mRNA 结合形成双链 RNA ,从而易被 RNA 酶Ⅲ 降解;Ⅱ类反义 RNA 与 mRNA 的非编码区结合,引起 mRNA 构象变化,抑制翻译;Ⅲ类反义 RNA 则直 接抑制靶 mRNA 的转录。 ( 二 ) 反义 DNA 是指一段能与特定的 DNA 或 RNA 以碱基互补配对的方式结合,并阻止其转录和翻 译的短核酸片段,主要指反义寡核苷酸,因更具药用价值而倍受重视。 ( 三 ) 核酶 (ribozyme) 是具有酶活性的 RNA ,主要参加 RNA 的加工与成熟。天然核酶可分为四类: (1) 异体催化剪切型,如 RNaseP ; (2) 自体催化的剪切型,如植物类病毒、拟病毒和卫星 RNA ; (3) 第一组内含子自我剪接型,如四膜虫大核 26SrRNA ;(4) 第二组内含子自我剪接型。利用反义技术研 制的药物称反义药物。反义药物作用于产生蛋白的基因,因此可广泛应用于多种疾病的治疗,如传 染病、炎症、心血管疾病及肿瘤等。与传统药物比较反义药物更具选择性及效率,因此也更高效低 毒。基于上述特点反义药物已成为药物研究和开发的热点。而且反义技术还可以应用于生物科学的 基础研究。 2、 核酶 核酶一词用于描述具有催化活性的 RNA, 即化学本质是核糖核酸 (RNA), 却具有酶的催化功能。 核 酶的作用底物可以是不同的分子, 有些作用底物就是同一 RNA 分子中的某些部位。 核酶的功能很多,有的能 够切割 RNA, 有的能够切割 DNA, 有些还具有 RNA 连接酶、磷酸酶等活性。与蛋白质酶相比,核酶的催化 效率较低,是一种较为原始的催化酶。 核酸类酶、酶 RNA 、类酶 RNA 。 反应 发现 大多数核酶通过催化转磷酸酯和磷酸二酯键水解反应参与 RNA 自身剪切、加工过程。 美国科学家 T.Cech 和 S.Altman 发现了核酶 (ribozyme) 。最早发现大肠杆菌 RNaseP 核酶( ribozyme )是具有催化功能的 RNA 分子。核酶又称的蛋白质部分除去后,在体外高浓度 Mg2+ 存在下,与留下的 RNA 部分 (MIRNA) 具有与全酶相同的催 化活性。后来发现四膜虫 L19RNA 在一定条件下能专一地催化寡聚核苷酸底物的切割与连接,具有 核糖核酸酶和 RNA 聚合酶的活性。影响 核酶的发现对于所有酶都是蛋白质的传统观念提出了挑战。 1989 年,核酶的发现者 T.Cech 和 S. Altman 被授予 诺贝尔化学奖 3、hnRNA:heterogeneous nuclear 核内不均一 RNA 为存在于真核生物细胞核中的不稳定、大小不均的一组高分子 RNA 之总称。在核 内主要存在于核仁的外侧。认为 hnRNA 多属信使 RNA ( mRNA )之先驱体,包括各种基因的转录产物 及其成为 mRNA 前的各中间阶段的分子,在 5’末端多附有间隙结构,而 3’的末端附有多聚腺苷酸 聚合酶分子。这些 hnR-NA 在受到加工之后,移至细胞质,作为 mRNA 而发挥其功能。大部分的 hnRNA 在核内与各种特异的蛋白质形成复合体而存在着 4、基因组 Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基 因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。因此,基 因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部 DNA 分子。说的更确切些,核基因组是单 倍体细胞核内的全部 DNA 分子;线粒体基因组则是一个线粒体所包含的全部 DNA 分子;叶绿体基因组则 是一个叶绿体所包含的全部 DNA 分子。 《遗传学名词》第二版对“基因组”的释义: 单倍体细胞 核、细胞器或病毒粒子所含的全部 DNA 分子或 RNA 分子。现代遗传学家认为,基因是 DNA( 脱氧核糖 核酸 ) 分子上具有遗传效应的特定核苷酸序列的总称,是具有遗传效应的 DNA 分子片段。基因位于 染色体上,并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代,还可以使 遗传信息得到表达。基因是生命遗传的基本单位。 人类只有一个基因组,大约有 5-10 万个基因。人类基因组计划是美国科学家于 1985 年率先提出的, 旨在阐明人类基因组 30 亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部 遗传信息,使人类第一次在分子水平上全面地认识自我 5、δ 因子 δ 因子就是丁型肝炎病毒 HDV,是肝细胞核内一种新的病毒抗原。它是一种缺陷病毒,必须在 HBV(乙肝病毒)或其他嗜肝 DNA 病毒的辅助下(需要 HBV 的表体蛋白)进入肝细胞才能复制增殖。Ty 因子 是一大类转座子,长 6.3kb,两端各有一段长 334bp 的顺向重复序列,称为δ 成分。 1977 年意大利学 者 Rizzetto 用免疫荧光法在慢性乙型肝炎病人的肝细胞核内发现一种新的病毒抗原, 并称为 δ 因子(delta agent)。它是一种缺陷病毒,必须在 HBV 或其他嗜肝 DNA 病毒的辅助下才能复制增殖,现已正式命名为丁 型肝炎病毒 (hepatitis D virus,HDV)。 HDV 体形细小,直径 35~37nm,核心含单股负链共价闭合的 环状 RNA 和 HDV 抗原(HDAg),其外包以 HBV 的 HBsAg。 6、衰减子:attenuator 细菌 E.coli 的 trp 操纵子中第一个结构基因与启动序列 P 之间有一衰减 子区域。 Trp 操纵子的序列 1 中有两个色氨酸密码子,当色氨酸浓度很高时,核蛋白体(核糖体) 很快通过编码序列 1 ,并封闭序列 2 ,这种与转录偶联进行的翻译过程导致序列 3 、4 形成一个不依 赖 ρ ( rho )因子的终止结构 --- 衰减子。 ( 转录衰减是原核生物特有的调控机制 ) 。 8、Z 型 DNA(Z-DNA)Z-DNA, 另两种为 A-DNA 与 B-DNA。 Z-DNA 又称 Z 型 DNA,是 DNA 双螺旋结构的一种形式,具有左旋型态的双股螺旋(与常见的 B-DNA 相反),并呈现锯齿形状。Z-DNA 为三种具生物活性的 DNA 双螺旋结构之一, Z-DNA 为首先于 1979 年被解出晶体结构的 DNA 型态,研究者为麻省理工大 学的 Alexander Rich 等人。B 型及 Z 型相互结合时的结晶则解于 2005 年,使科学家了解 Z-DNA 在细胞中 的潜在角色,当一段 Z-DNA 形成时,其两端必为 B-Z 相互结合型态,形成与 B-DNA 的接口。 结构 Z-DNA 的双股螺旋为左旋型态,与 B-DNA 的右旋型态明显有所差别。其结构每两个碱基对重复出现一次。大小螺旋凹槽之间的差别较 A 型及 B 型小,只在宽度上有些微差异。这种型态并不 常见,但某些特定情况可增加其存在的可能,如嘌呤 - 嘧啶交替序列、DNA 超螺旋,或盐份与某些阳 离子浓度高时。 Z-DNA 能够与 B-DNA 构成相互结合型态,这种结构会使一对碱基突出于双螺旋之外 B-DNA:Watson和Crick提出的DNA双螺旋结构属于B型双螺旋,它是以在生理盐溶液中抽出的DNA纤维 在92%相对湿度下进行X-射线衍射图谱为依据进行推测的, 这是DNA分子在水性环境和生理条件下最稳定的 结构。 A-DAN:在以钾或绝作反离子,相对湿度为75%时,DNA分子的X-射线衍射图给出的是A构象,A-DNA 每螺旋含11个碱基对,而且变成A-DNA后,大沟变窄、变深,小沟变宽、变浅。 Z-DNA:它是左手双螺旋,与右手螺旋的不同是螺距延长(4.5nm 左右),直径变窄(1.8nm),每个螺 旋含 12 个碱基对,分子长链中磷原子不是平滑延伸而是锯齿形排列,有如“之”字形一样,因此叫它 Z 构 象,这一构象中的重复单位是二核苷酸而不是单核苷酸;而且 Z-DNA 只有一个螺旋沟,它相当于 B 构象中 的小沟,它狭而深,大沟则不复存在 9、增变基因(mutator gene)能够增加自发突变率的基因,生物体在通常环境下变异称为“自发突变”, 对“自发突变”的发生和抑制相关的一组基因,称为&增变基因”,在这类基因有缺陷时,“自发突变”的 发生率即大幅度上升增变基因(mutator gene):该基因的突变会使整个基因组的突变频率增高,eg. A. DNA 多聚酶基因,突变后使多聚酶的 3' → 5'校正功能降低或丧失,使基因组突变频率增高; 10、操纵子(operon)是由一个或多个相关基因以及调控他们转录的操纵因子启动子序列组成的基因表达 单位。 11、同功 tRNA(isoaccepter)一种 tRNA 只能携带一种氨基酸,,但一种氨基酸可被不止一种 tRNA 携带。同一生物中,携带同一种氨基酸的不同 tRNA 称作“同功受体 tRNA”。运载同一种氨基酸的一 组不同 tRNA 称为同功 tRNA。一组同功 tRNA 由同一种氨酰基 tRNA 合成酶催化。 12、冈崎片段(Okazaki fragment) 冈崎片段:相对比较短的 DNA 链(大约 1000 核苷酸残基),是在 DNA 的滞后链的不连续合成期间生成的片段,这是 Reiji Okazaki 在 DNA 合成实验中添加放射性的脱氧核苷酸 前体观察到的。 DNA 复制过程中,2 条新生链都只能从 5 端向 3 端延伸,前导链连续合成,滞后链分段合 成.这些分段合成的新生 DNA 片段称冈崎片段.细菌冈崎片段长度
核苷酸,真核生物冈崎片段长度 100-200 核苷酸.在连续合成的前导链中,U-糖苷酶和 AP 内切酶也会在错配碱基 U 处切断前导链. 13、移码突变(frameshift mutation)是由于基因中增加或减少碱基(改变的碱基数不得是 3 或 3 的倍数) 所致在基因 DNA 中插入或缺失非 3 的倍数的少数几个碱基,因而在该基因 DNA 作为蛋白质的氨基酸顺序的 信息解读时,读码的框架会发生移动,这样的突变称为移码突变。 14、基因簇(gene cluster)功能相同或相关的许多基因聚集成簇,就形成一个基因簇。某一祖先基因由 于重复和变异产生的一系列基因称为一个基因家族(Gene family)。家族成员可以成簇存在,或者分散在不 同的染色体中(或两者都有)。尽管一个结构基因家族的成员可以在不同时期或不同类型的细胞中表达,但 是它们经常是相互关联或甚至具有相同的功能。基因家族:是真核生物基因组中来源相同,结构相似,功 能相关的一组基因超基因家族(gene superfamily),其各基因序列间没有同源性,但其表达产物的功能却 相似。在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene) 15、琥珀突变(amber mutation) 由于碱基对的改变而使决定某一氨基酸的密码子变成一个终止密码子的基因突变叫 无 义 突 变 。其 中 密 码 子 改 变 为 U A G 的 无 义 突 变 又 叫 琥 珀 突 变 ,密 码 子 改 变 成 U A A 的 无 义 突变又叫赭石突变。 16、核小体(nucleosme)由 DNA 和组蛋白 (histone) 构成,是染色质(染色体)的基本结构单位。 由 4 种组蛋白 H2A 、H2B 、H3 和 H4 , 每一种组蛋白各二个分子,形成一个组蛋白八聚体,约 200 bp 的 DNA 分子盘绕在组蛋白八聚体构成的核心结构外面,形成了一个核小体。 17、拓扑异构酶(topoisomerase):DNA 拓扑异构酶可以分两类:一类叫拓扑异构酶 I,一类叫拓扑异构 酶 II。拓扑异构酶 I 催化 DNA 链的断裂和重新连接,每次只作用于一条链,即催化瞬时的单链的断裂和连 接,它们不需要能量辅因子如 ATP 或 NAD。拓扑异构酶 II 能同时断裂并连接双股 DNA 链.它们通常需要能 量辅因子 ATP。 为催化 DNA 拓扑学异构体相互转变的酶之总称。 DNA 拓扑异构酶是存在于细胞核内的一类酶,他们能够 催化 DNA 链的断裂和结合,从而控制 DNA 的拓扑状态。DNA 拓扑异构酶可以分两类:一类叫拓扑异构酶 I,一类叫拓扑异构酶 II。拓扑异构酶 I 催化 DNA 链的断裂和重新连接,每次只作用于一条链,即催化瞬 时的单链的断裂和连接,它们不需要能量辅因子如 ATP 或 NAD。E.coli DNA 拓扑异构酶 I 又称 ω 蛋白,大 白鼠肝 DNA 拓扑异构酶 I 又称切刻-封闭酶(nicking-closing enzyme )。拓扑异构酶 II 能同时断裂并连接 双股 DNA 链.它们通常需要能量辅因子 ATP。在拓扑异构酶 II 中又可以分为两个亚类:一个亚类是 DNA 旋 转酶(DNA gyrase ),其主要功能为引入负超螺旋,在 DNA 复制中起十分重要的作用。迄今为止,只有在原 核生物中才发现 DNA 旋转酶.另一个亚类是转变超螺旋 DNA(包括正超螺旋和负超螺旋)成为没有超螺旋的 松弛形式(relaxed form )。这一反应虽然是热力学上有利的方向,但不知道为什么它们仍然像 DNA 旋转酶 一样需要 ATP,这可能与恢复酶的构象有关。这一类酶在原核生物和真核生物中都有发现。 18、引发体(primosome) 是蛋白复合体, 主要成份是引物酶和 DNA 解旋酶,是在合成用于 DNA 复制的 RNA 引物时装配 的。引发体与 DNA 结合后随即由引物酶合成 RNA 引物。 引发体(primosome)是由多种蛋白质及酶组成,是 DNA 复制开始所必需的。引发体中的某些蛋白质如 DnaA 能结合至 DNA 复制起始部位,DnaB 具有解链酶的作用,DnaC 辅助 DnaB 结合到复制起始点,使起始部 位的双链解开。 而引发体中的引物酶(primase)在已解开起始部位的 DNA 单链按碱基互补配对催化 NTP 聚合, 合成一小片段的 RNA,作为 DNA 合成的引物,即沿此引物 RNA 的 3′-OH 进行延伸 引发体(primosome)和 RNA 引物(primer):引发体由引发前体与引物酶(primase)组装而成。引发前 体是由若干蛋白因子聚合而成的复合体;引物酶本质上是一种依赖 DNA 的 RNA 聚合酶(DDRP)。 19、卫星 DNA(satellite DNA)) 卫星 DNA(satellite DNA)是一类高度重复序列 DNA 在介质氯化铯中作密度梯度离心,离心速度可以高达每 分钟几万转;此时 DNA 分子将按其大小分布在离心管内不同密度的氯化铯介质中,小的分子处于上层,大 的分子处于下层;从离心管外看,不同层面的 DNA 形成了不同的条带。根据荧光强度的分析,可以看到在 一条主带以外还有一个或多个小的卫星带。这些在卫星带中的 DNA 即被称为卫星 DNA,这种 DNA 的 GC 含量 一般少于主带中的 DNA,浮力密度也低。卫星 DNA 按其浮力密度的大小可以分成 I、Ⅱ、Ⅲ、Ⅳ四类,其浮 力密度分别是 1.687,1.693,1.697 和 1.700 g/cm3。各类卫星 DNA 都是由各种不同的重复序列家族 所组成。卫星 DNA 通常是串联重复序列。卫星 DNA 按其重复单元的核苷酸的多少,可以分为两类。一类是 小卫星 DNA(minisatellite DNA), 由几百个核苷酸对的单元重复组成。 另一类是微卫星 DNA(microsatellite DNA),由 2 个到 20 个左右的核苷酸对的单元重复成百上千次所组成。卫星 DNAI 家族由 42bp 的单元组成, 其中 17bp(ACATAAAATAT AAAGT)为可变区,25 bp(ACCCAAAAAGT TATTATATACTGT)为重复单元。卫星 DNAⅡ家 族是保守性差的 ATTCC 重复。卫星 DNAⅢ是较保守的 ATTCC 重复,且与 10bp 的序列(A TCGGGTTG)相间分布。 卫星 DNA 还有另一些分类的名称,如 α 卫星 DNA 是灵长类特有的单元为 171 bp 的高度重复序列,最初是 在非洲青猴基因组中发现,现在已确定分布在人染色体的着丝粒区。β 卫星 DNA 家族是单元为 68bp 的串 联重复序列,富含 GC。γ 卫星 DNA 是 220 bp 的串联重复。第Ⅳ类卫星 DNA 称为隐藏的卫星 DNA(cryptil satellite)。这是包含了多种串联重复序列的 DNA 分子,离心时并不像卫星 DNA 那样也分开,但它的属性 却类似卫星 DNA。 20、SD 序列(SD sequence) SD 序列(Shine-Dalgarno sequence):mRNA 中用于结合原核生物核糖体的序列。SD 序列:在细菌 mRNA 起始密码子 AUG 上游 10 个碱基左右处,有一段富含嘌呤的碱基 序列,能与细菌 16SrRNA3’端识别,帮助从起始 AUG 处开始翻译。在原核生物中 , 核糖体中与 mRNA 结合位点位于 16S rRNA 的 3 ' 端 ,mRNA 中与核糖体 16S rRNA 结合的序列称为 SD 序列 (SD sequence), 它是 1974 年由 J.Shine 和 L.Dalgarno 发现的 , 故此而命名。 SD 序列是 mRNA 中 5 '端富含嘌呤的 短核苷酸序列 , 一般位于 mRNA 的起始密码 AUG 的上游 3 至 11 个核苷酸处 , 并且同 16S rRNA 3 '端的 序列互补。所谓 RBS,是指起始密码子 AUG 上游的一段非翻译区.在 RBS 中有 SD(Shine-Dalg-arno)序列,长 度一般为 5 个核苷酸,富含 G,A,该序列与核糖体 16SrRNA 的 3'端互补配对,促使核糖体结合到 mRNA 上,有 利于翻译的起始. RBS 的结合强度取决于 SD 序列的结构及其与起始密码 AUG 之间的距离.SD 与 AUG 之间相距一般以 4-10 个核 苷酸为佳,9 个核苷酸最佳。仅是指原核生物。真核起始不需要 SD,需要帽子,因为真核是单顺反子。 21 颠换 (transversion):异型碱基的置换,即一个嘌呤被另一个嘧啶替换;一个嘧啶被另一个嘌呤置 换 。 22、弱化子(attenuator)衰减子:attenuator 23、基因家族(gene family) 是真核生物基因组中来源相同,结构相似,功能相关的一组基因 24、CAT 框(CAT box)真核生物结构基因上游的顺式作用元件: 真核生物结构基因上游的顺式作用要素。其共有序列为 CCAAT。在真核生物中,在转录起始位点上游 70-80bp 处有。 25、无义突变(琥珀突变)是编码某一氨基酸的三联体密码经碱基替换后,变成不编码任何氨基酸的 终止密码 UAA 、UAG 或 UGA 。虽然无义突变并不引起氨基酸编码的错误,但由于终止密码出现在一条 mRNA的中间部位,就使翻译时多肽链的终止就此终止,形成一条不完整的多肽链。 26、 TATA 框: 启动子启动子主要包括以下两个序列: ①在 5′端转录起始点上游约 20~30 个核苷酸的地方, 有 TATA 框(TATA box)。TATA 框是一个短的核苷酸序列,其碱基顺序为 TATAATAAT。TATA 框是启动子中 的一个顺序,它是 RNA 聚合酶的重要的接触点,它能够使酶准确地识别转录的起始点并开始转录。当 TATA 框中的碱基顺序有所改变时,mRNA 的转录就会从不正常的位置开始。②在 5′端转录起始点上游约 70~80 个核苷酸的地方,有 CAAT 框(CAAT box)。CAAT 框是启动子中另一个短的核苷酸序列,其碱基顺序为 GGCTCAATCT。CAAT 框是 RNA 聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起 始频率,而不影响转录的起始点。当这段顺序被改变后,mRNA 的形成量会明显减少。Hogness 等在真核基 因中又发现了类似 Pribnow 框的共同序列,即位于―25~―30 bp 处的 TATAAAAG,也称 TATA 框(TATAbox)。 RNA 聚合酶同启动子结合的区域称为启动子区。将各种原核基因同 RNA 聚合酶全酶结合后,用 DNase I 水 解 DNA,最后得到与 RAN 聚合酶结合而未被水解的 DNA 片段,这些片段有一个由 5 个核苷酸(TATAA)组成的 共同序列,以其发现者的名字命名为 Pribnow 框(Pribnowbox),这个框的中央位于起点上游 10bp 处,所以 又称―10 序列(―10 sequence),后来在―35 bp 处又找到另一个共同序列(TTGACA)。Hogness 等在真核基 因中又发现了类似 Pribnow 框的共同序列,即位于―25~―30 bp 处的 TATAAAAG,也称 TATA 框(TATAbox)。 TATA 框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列 (uptreamactivatingsequence, UAS)。 另外在―70~―78 bp 处还有一段共同序列 CCAAT, 称为 CAAT 框(CAAT box) 27、反式作用:反式作用因子(trans-acting factor) 是指能直接或间接地识别或结合在各类顺式作用元件核心序列上参与调控靶基因转录效率的 蛋白质。 大多数真核转录调节因子由某一基因表达后,可通过另一基因的特异的顺式作用元件相互作 用,从而激活另一基因的转录。这种调节蛋白称反式作用因子。 参与基因表达调控的因子 , 它们与特异的靶基因的顺式元件结合起作用。编码反式作用因子的 基因与被反式作用因子调控的靶序列 ( 基因 ) 不在同一染色体上。反式作用因子有两个重要的功能结 构域 :DNA 结合结构域和转录活化结构域 , 它们是其发挥转录调控功能的必需结构。反式作用因子可 被诱导合成 , 其活性也受多种因素的调节。 同一类序列特异性的反式作用因子由多基因家族所编码 , 它们具有特定的蛋白质结构 ( 如上述 的锌指结构、碱性亮氨酸拉链、螺旋 - 环 - 螺旋基元等 ) 和蛋白质结构上的同源性 , 因而构成反式作 用因子家族 , 如类固醇激素受体家族、 AP1 家族等。 主要包括: 1.DNA 结合域: a. 螺旋 - 转角 - 螺旋 b. 锌指结构 c. 亮氨酸拉链 d. 螺旋 - 突环 - 螺旋 2. 转录激活域:与其他转录因子相互作用的结构成分。 31、复合转座子:两个插入序列包围着一段中央区域,这两个序列中的一个或者两个可能使整个元件转座。 36、有义链 : DNA 双链在转录过程中于转录形成的 RNA 序列相同( T 对应 U )的那条链叫做有义链。 37、内含子(intron)内含子是基因内的间隔序列 , 不出现在成熟的 RNA 分子中 , 在转录后通过加工被 切除。大多数真核生物的基因都有内含子。需注意的是,在古细菌中也有内含子。 大多数真核结构基因中的间插序列( intervening sequence )或不编码序列。它们可以转录,但在 基因转录后,由这些间插序列转录的部分(也可用内含子这个术语表示)经加工被从初级转录本中 准确除去,才产生有功能的 RNA 41、异源双链体(heteroduplex) Heteroduplex (hybrid) DNA :由不同亲本双链分子中的互补单链产生碱基配对的双链 DNA ,在遗传 重组中产生。 分子杂交 ( 简称杂交 ,hybridization) 是核酸研究中一项最基本的实验技术。其基 本原理就是应用核酸分子的变性和复性的性质 , 使来源不同的 DNA( 或 RNA) 片段 , 按碱基互补关系形 成杂交双链分子 (heteroduplex) 。杂交双链可以在 DNA 与 DNA 链之间 , 也可在 RNA 与 DNA 链之间形 成。 42、转座子(transposon)转座(因)子是基因组中一段可移动的 DNA 序列,可以通过切割、重新整合等一 系列过程从基因组的一个位置“跳跃”到另一个位置。 复合型的转座因子称为转座子(trans―poson, Tn)。 这种转座因子带有同转座无关的一些基因,它的两端就是 IS,构成了“左臂”和“右臂”。两个“臂”可 以是正向重复,也可以是反向重复。这些两端的重复序列可以作为 Tn 的一部分随同 Tn 转座,也可以单独 作为 IS 而转座。转座子是细菌细胞里发现的一种复合型转座因子,这种转座因子带有同转座无关的一些基 因,如抗药性基因;它的两端就是 IS,构成了“左臂”和“右臂”。两个“臂”可以是正向重复,也可以 是反向重复。这种复合型的转座因子称为转座子(trans―poson,Tn)。这些两端的重复序列可以作为 Tn 的 一部分随同 Tn 转座,也可以单独作为 IS 而转座。Tn 两端的 IS 有的是完全相同的,有的则有差别。当两 端的 IS 完全相同时,每一个 IS 都可使转座子转座;当两端是不同的 IS 时,则转座子的转座取决于其中的 一个 IS。Tn 有抗生素的抗性基因,Tn 很容易从细菌染色体转座到噬菌体基因组或是接合型的质粒。因此, Tn 可以很快地传播到其他细菌细胞,这是自然界中细菌产生抗药性的重要来源。 两个相邻的 IS 可以使处于它们中间的 DNA 移动,同时也可制造出新的转座子。Tn10 的两端是两 个取向相反的 IS1O,中间有抗四环素的抗性基因(TetR),当 TnlO 整合在一个环状 DNA 分子中间时,就可 以产生新的转座子。当转座子转座插人宿主 DNA 时,在插入处产生正向重复序列,其过程是这样的:先是 在靶 DNA 插入处产生交错的切口,使靶 DNA 产生两个突出的单链末端,然后转座子同单链连接,留下的缺 口补平,最后就在转座子插入处生成了宿主 DNA 的正向重复。已知的转座因子的转座途径有两种:复制转 座和非复制转座。 1.复制转座(replicative transposition) 转座因子在转座期间先复制一份拷贝,而后拷贝 转座到新的位置,在原先的位置上仍然保留原来的转座因子。复制转座有转座酶(transposase)和解离酶 (resolvase)的参与。转座酶作用于原来的转座因子的末端,解离酶则作用于复制的拷贝。TnA 是复制转座 的例子。 2.非复制转座(non-replicative transposition) 因子,而在插入位置上增加了转座因子。这可造成表型的变化。 保留转座(conservative transposition)也是非复制转座的一种类型。其特点是转座因子的切离和 插人类似于入噬菌体的整合作用,所用的转座酶也是属于入整合酶(integrase)家族。出现这种转座的转座 因子都比较大,而且转座的往往不只是转座因子自身,而是连同宿主的一部分 DNA 一起转座。 非复制转座 可以是直接从供体分子的转座子两端产生双链断裂,使整个转座子释放出来,然后在受体分子上产生的交 错接口处插入,这是“切割与黏接”(“cut and paste&)的方式。另一种方式是在转座子分子同受体分子 之间形成一种交换结构(crossover structure),受体分子上产生交错的单链缺口,与酶切后产生的转座子 单链游离末端连接,并在插入位点上产生正向重复序列;最 后,由此生成的交换结构经产生缺口(nick) 而使转座子转座在受体分子。供体 DNA 分子上留下双链断裂,结果 或是供体分子被降解,或是被 DNA 修复 系统识别而得到修复。 在复制转座过程中,转座和切离是两个独立事件。先是由转座酶分别切割转座子的供体和受体 DNA 分子。转座子的末端与受体 DNA 分子连接,并将转座子复制一份拷贝,由此生成的中间体即共整合体 (cointegrat,)有转座子的两份拷贝。然后在转座子的两份拷贝间发生类似同源重组的反应,在解离酶的 作用下,供体分子同受体分子分开,并且各带一份转座子拷贝。同时受体分子的靶位点序列也重复了一份 拷贝。 酵母接合型的相互转换也是复制转座所产生。酿酒酵母(Saccharomvcescerf―visiae)的生命周期 中有双倍体细胞和单倍体细胞两种类型。单倍体细胞则有 a 型和 α 型两种接合型(mating type)。单倍体 酵母是 a 型还是 α 型,由单个基因座 MAT 所决定。MAT 有一对等位基因 MAT。和 MATα ,在同宗接合 (homothallic)的酵母菌株中,酵母菌十分频繁地转换其接合型,即从 a 转换成 α ,然后在下一代又转换 为 a。这种转换和回复的频率已远远高于通常的自发突变,表明这不是通常的突变机制。现在已经知道, 在 MAT 基因座两侧有两个基因带有 MATα 和 ATα 的拷贝,这就是 HMLα 和 HMRα 基因。这两个基因贮存了 两种接合型等位基因,当转座给 MAT 基因座时就发生了接合型的转换。因此,MAT 基因座是通过转座而转 换其接合型的。MAT 基因座的序列转换成另一个基因的序列,这种机制称为基因转换(gene convertion)。 43、无效突变(null mutation)由于大片段插入、缺失或重排而导致基因产物完全无效。 44、溶源现象(lysogenesis) 溶源性细菌 细胞中含有以原噬菌体状态存在的温和噬菌体基因组的细菌。 在染色体上整合了温和噬菌体的核酸(即原噬菌体),但又检查不出噬菌体的存在,这样的细 菌称为溶源性细菌。原噬菌体可稳定遗传,随细胞分裂而传给子代。在传代过程中可能发生原噬菌 体的丢失,从而失去溶源性。只有极少数细菌个体发生自发裂解;外界因素如紫外线, X 射线等可 诱导原噬菌体活化,使细菌裂解数目大增,实际应用上可用此法获得大量游离噬菌体。溶源性细菌 对其同源噬菌体具有“免疫性”,即噬菌体可进入细胞,但不能增殖,亦不能导致细菌裂解。溶源 性广泛存在于各种细菌中,如大肠杆菌,沙门氏菌属,芽孢杆菌属,棒杆菌属等的某些种类均有溶 转座因子直接从原来位置上转座插入新的 位置,并留在插入位置上,这种转座只需转座酶的作用。非复制转座的结果是在原来的位置上丢失了转座 源现象。有些原噬菌体还能使溶源性细菌获得某种新的特性,例如白喉棒杆菌,只有被噬菌体溶源 化后才具有产生外毒素的致病能力。 溶原现象 大多数烈性噬菌体 (virulent phage) 在感染敏感细菌细胞后,经过一个潜伏期 (eclipse period) ,即细胞内营养生长和繁殖循环后,便可引起宿主细胞裂解,并释放出成百上千的噬菌体 粒子,这就是所谓的噬菌体裂解反应 (lytic response) 然而有一些温和噬菌体除了能产生裂解繁殖外,它的基因组还可以被整合到宿主染色体 DNA 上,并且 长期存在于宿主细胞中。整合后的噬菌体基因组能随宿主 DNA 一起复制,当细菌分裂产生子代细胞时,其 子代染色体 DNA 中都带有整合的噬菌体基因组,这种噬菌体基因组的整合作用就称为噬菌体的溶原化 (lysogenization)。染色体 DNA 上整合有噬菌体基因组的宿主细胞,不会因为噬菌体感染而发生裂解的这 种现象称为溶原现象(lysogenesis),整合有噬菌体基因组的宿主细胞叫做溶原菌(lysogen),而被整合的 噬菌体基因组叫做原噬菌体(prophage)。 45、密码兼并(code degeneracy) 一种氨基酸可以由几种不同的密码子决定 , 这种情况叫做密码子的兼并性。 如苏氨酸有 4 个密码子,即 ACU 、 ACC 、 ACA 、 ACG 。 46、光复合修复(photoreaction repair) 量 CT 和 CC)。 光复活修复(Photoreactivation Repair)作用是一种高度专一的 DNA 直接修复(Direct Repair)过程,它只作用于紫外线引起的 DNA 嘧啶二聚体(主要是 TT,也有少 它的机制是可见光(有效波长为 400nm 左右)激活了光复活酶(Photoreactivating 光复活酶在生物界分布很广,从低等单细胞生 Enzyme),它能分解紫外线照射而形成的嘧啶二聚体。 物一直到鸟类都有,而高等的哺乳类却没有。 47、断裂基因(split gene) 一个基因,往往由几个互不相邻的段落(外显子)组成,它们被长达数百个甚至数千个碱基对的插入 序列(内含子)所间隔,这样的基因称为断裂基因(splicing gene)。在真核细胞中断裂基因具有普遍性, 断裂基因在原核细胞中也有发现。 断裂基因在进化中可能有以下意义。(1)有利于贮存较多的信息,增 加信息量。一般地说,一个基因只转录出一种 mRNA,但是一些断裂基因以不同的剪接方式可以产生两种以 至多种 mRNA,编码不同功能的多肽。(2)有利于变异和进化。虽然单个碱基的改变有时可以引起氨基酸 的变更而造成蛋白质的变化,但是很难产生重大改变而形成新的蛋白质。更何况如果单个碱基的突变发生 在密码子第三位上往往是沉默的,于是大大地降低了突变的效应。而在断裂基因中,如果突变发生在内含 子与外显子结合的部位,那么就会造成剪接方式的改变,结果使蛋白质结构发生大幅度的变化,从而加速 进化。(3)增加重组几率。内含子有可能不断地增减造成新的剪接方式,一方面形成新的基因,另一方面 在剪接过程中无疑会增加重组频率;同时,在断裂基因中,由于内含子的存在,基因长度增加,于是也增 加了重组频率。(4)可能是基因调控装置。内含子可能在基因表达中有一定的调控作用,在基因转录水平 上以及在合成了 mRNA 以后的加工过程中起着调控基因表达的作用。总之,断裂基因是具有十分重要的生物 学意义的,但是对它的功能还不是完全了解,还有待于进一步研究。在本世纪 70 年代以前,人们一直 认为遗传物质是双链 DNA ,在上面排列的基因是连续的。 Robert and Sharp 彻底改变了这一观念。 他们以腺病毒作为实验对象,因为它的排列序列同其他高等动物很接近,包括人。结果发现它们的 基因在 DNA 上的排列由一些不相关的片段隔开,是不连续的。他们的发现改变了科学家以往对进化 的认识,对于现代生物学的基础研究以及生物进化论具有重要的奠基作用,对于肿瘤以及其他遗传 性疾病的医学导向研究,亦具有特别重要的意义。 真核生物的基因组十分复杂, DNA 的含量也比原核生物的大得多。噬菌体由于基因组很小,但 又要编码一些必不可少的蛋白,碱基显然不够用,这样不仅几乎所有的碱基都参加编码,而且在进 化中还出现了“重叠基因”,以有限的基因编码更多的遗传信息。真核基因组正好相反, DNA 十分 富余,这样不仅无需“重叠基因”,而且很多序列不编码,如重复序列、间隔序列 (spacer) 和间 插序列 (intervening sequence) 即内含子 (intron) 等。但不编码并不等于没有功能。有的我们可 能还不了解,如重复序列。间隔区和间插序列这两个概念是不同的,间隔区是指基因间不编码的部 分,有的转录称转录间隔区( TS ),有的不转录称为非转录间隔区 (NTS )。间插序列是指基因内部 不编码的区域,也称内含子,在初始转录本中存在此序列,但在加工后将被切除掉,所以常不作为 翻译的信息。间隔区常常含有转录的启动子和其它上游调节序列。有的内含子也可以编码,如成熟 酶和内切酶等。 在遗传学上通常将能编码蛋白质的基因称为结构基因。真核生物的结构基因是断裂的基因。一 个断裂基因能够含有若干段编码序列,这些可以编码的序列称为外显子。在两个外显子之间被一段 不编码的间隔序列隔开,这些间隔序列称为内含子。每个断裂基因在第一个和最后一个外显子的外 侧各有一段非编码区,有人称其为侧翼序列。在侧翼序列上有一系列调控序列 ( 图 3-3) 。 调控序列主要有以下几种:①在 5′端转录起始点上游约 20~30 个核苷酸的地方,有 TATA 框(TATA box)。 TATA 框是一个短的核苷酸序列,其碱基顺序为 TATAATAAT。TATA 框是启动子中的一个顺序,它是 RNA 聚合酶的重要的接触点,它能够使酶准确地识别转录的起始点并开始转录。当 TATA 框中的碱基顺序有 所改变时,mRNA 的转录就会从不正常的位置开始。②在 5′端转录起始点上游约 70~80 个核苷酸的地方, 有 CAAT 框(CAAT box)。CAAT 框是启动子中另一个短的核苷酸序列,其碱基顺序为 GGCTCAATCT。CAAT 框是 RNA 聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起始频率,而不影响转录 的起始点。当这段顺序被改变后,mRNA 的形成量会明显减少。③在 5′端转录起始点上游约 100 个核苷酸 以远的位置,有些顺序可以起到增强转录活性的作用,它能使转录活性增强上百倍,因此被称为增强子。 当这些顺序不存在时,可大大降低转录水平。研究表明,增强子通常有组织特异性,这是因为不同细胞核 有不同的特异因子与增强子结合,从而对不同组织、器官的基因表达有不同的调控作用。例如,人类胰岛 素基因 5′末端上游约 250 个核苷酸处有一组织特异性增强子, 在胰岛素 β 细胞中有一种特异性蛋白因子, 可以作用于这个区域以增强胰岛素基因的转录。在其他组织细胞中没有这种蛋白因子,所以也就没有此作 用。这就是为什么胰岛素基因只有在胰岛素 β 细胞中才能很好表达的重要原因。④在 3′端终止密码的下 游有一个核苷酸顺序为 AATAAA,这一顺序可能对 mRNA 的加尾(mRNA 尾部添加多聚 A)有重要作用。这个顺 序的下游是一个反向重复顺序。这个顺序经转录后可形成一个发卡结构(图 3-4)。发卡结构阻碍了 RNA 聚 合酶的移动。发卡结构末尾的一串 U 与转录模板 DNA 中的一串 A 之间,因形成的氢键结合力较弱,使 mRNA 与 DNA 杂交部分的结合不稳定,mRNA 就会从模板上脱落下来,同时,RNA 聚合酶也从 DNA 上解离下来,转 录终止。AATAAA 顺序和它下游的反向重复顺序合称为终止子,是转录终止的信号。 sequence) 大肠杆菌 DNA 中与同源重组活性特高有关的一段序列,GCTGGTGG。 它既是 Rec BC 的识别序列,又 是 Rec BC 的激活序列。其促进重组的能力,可远及 10kb 一个提供 E.coli 中 RecA 介导遗传重组热点 的八聚体序列 Chi 结构(structure):双链环状 DNA 重组形成的 8 字型中间体经内切酶切割后通常具有 4 条臂,整个形状像希腊字母 χ (读音为 Chi),因此称为 Chi 结构。Chi 结构的出现直接证明了细胞内重组 过程中异源双链 DNA 和 Holliday 结构及其异构体的存在。 49、复制子(replicon)是 DNA 复制时从一个 DNA 复制起点开始最终由这个起点起始的复制叉完成 的片段。像 E.coli phase 及质粒 DNA 独立复制的单位均为复制子。基因组能独立进行复制的单位称 为复制子,一般把生物体的单个复制单位称为复制子。一个复制子只含一个复制起点。一般说,细菌,病 毒即线粒体 DNA 分子均作为单个复制子完成其复制,真核生物基因组可以同时在多个复制起点上进行双向 复制,即它们的基因组包括多个复制子。所谓复制子(replicon),是指在每条染色体上两个相邻复制终点 之间的一段 DNA 叫做复制子。 50、同裂酶(isoschizomer) 有一些来源不同的限制酶识别的是同样的核苷酸靶子序列,这类酶称为同裂 酶。同裂酶产生同样的切割,形成同样的末端。同裂酶,国内外比较一致的定义,是来源于不同物种但能 48、Chi 序列(Chi 识别相同 DNA 序列的限制性内切酶,切割位点可以相同也可以不同。不过国内和国外在同裂酶的定义及其 定名上,随不同的人有许多差异。国内外还有另一种定义,称同裂酶是来源于不同物种但能识别相同 DNA 序列且切割方式相同的酶。这两种定义出现的比例均较大,均具有一定的代表性。同裂酶的英文以 isoschizomer 的出现占绝大多数,只有极少数国内资料将其表示为 isocaudomer(与国内文献出现 的同尾酶相混淆),一致表明同裂酶的英文名应为 isoschizomer 。 同裂酶在基因工程的 DNA 重组 中有重要的应用,尤其是在载体构建方面往往可以取得巧妙的应用。最具代表性、应用较多、较为 熟悉的同裂酶比如 Sma1 和 Xma1 ,它们均识别 CCCGGG ,但前者切后产生钝末端,后者切后产生粘性 末端。 51、基因转换 基因转换( gene conversion ):在同源染色体配对时,杂种 DNA 间的异常碱基对校正时,使 一个基因变成它的等位基因,从而出现基因不规则现象,称基因转换。 基因转换的生物学意义及分子机制:基因转换(gene conversion)是指遗传信息从一个分子向其同源分子单 向传递的过程,使受体序列部分或者全部被供体序列所替代,而供体本身的序列不变。这种现象不仅在真 菌中普遍存在,在线虫和哺乳动物中也存在。迄今已知该现象在原核生物和真核生物中均普遍存在。深入 的研究表明基因转换在基因的致同进化(concerted evolution)、降低突变率等方面均有重要作用。本文则 主要对在其他不同生物类群上的研究情况以及基因转换的分子机制等方面取得的新进展做一概述。 1. 不同生物类群中基因转换及其生物学意义 从细菌到植物乃至高等的哺乳动物,大多数非编码重复基因(研究最多的是多拷贝 rRNA 基因)和多基因家 族都是通过该机制保持其多拷贝基因序列的一致性,它是致同进化现象的背后机制。 1.1 原核生物中的基因转换现象 在多种原核生物上,研究表明基因转换导致了它们的多拷贝 rRNA 操纵子 的基因致同进化现象。如:在大肠杆菌中有七个 rRNA 操纵子,rrnA、B、C、D、E、G 和 H,每个操纵子上 rRNA 基因的排列顺序为 16S-23S-5S,编码 rRNA 的基因 rrn 往往是多拷贝的。Ammons 等在研究敲除 5S rRNA 基因对细胞的影响时,发现 rrnB 操纵子上敲除了其中一个 5S rRNA 基因后它可以通过基因转换的方 式从别的操纵子上重新获得。 在副溶血弧菌的一个菌株的基因组中有 11 个拷贝的 rRNA 操纵子, 其中 10 个 位于 1 号染色体上,另一个位于 2 号染色体上,其 16S rRNA 基因序列是完全相同的;而在另一菌株中则 含有两类操纵子,其中 7 个为一类型,另外 4 个为另一类型,它们的差异是在编码 16S rRNA 可变的主干 环的 25 bp 中有 10 bp 的差异,Gonzalez-Escalona 等认为这种操纵子的差异是基因转换的结果。 在分析比较肠球菌属 16S RNA 序列时,发现在三个亲缘关系很近的种属菌株基因中的相同位置都含有一段 相同的可变区域,这种情况被认为是因为在不同种属 16S RNA 操纵子之间发生了基因转换而实现了遗传信 息的传递的结果。从以上可知,基因转换可以发生在同一菌株内的多拷贝基因之间,也可以发生在不同菌 株的同一基因之间。其作用是使这些多拷贝的基因序列保持一致。 基因转换: AA'个体通过减数分裂形成的四分体不同于一般的 2A 和 2A' ,而是 3A 和 1A'或 1A 和 3A'的 这种现象。破坏 2:2 比例的一个可能原因,是染色体复制时模板的一次转换。结果,A 基因复制二次,A' 基因却没复制或相反。 颠换(Transversion):异型碱基的置换,即一个嘌呤被另一个嘧啶替换;一个嘧啶被另一个嘌呤置 换碱基对置换(点突变)只涉及一对碱基被另一对碱基所置换,分为转换和颠换 52、滚环式复制(rolling circle replication)是噬菌体中常见的 DNA 复制方式。滚环式复制的一个特点 是以一条环状单链 DNA 为模板,进行新的 DNA 环状分子合成。噬菌体的双链 DNA 环状分子先在一条单链的 复制起点上产生一个切口(nick),然后以另一条单链为模板不断地合成新的单链。释放出的新合成的单链 或是先复制成双链 DNA,被酶切割成单位长度后,再形成环状双链 DNA 分子;或是释放出的新合成的单链 DNA,先被酶切割成单位长度形成单链环状 DNA 分子后再复制成双链环状 DNA 分子。滚环复制 (rolling-circle replication):复制环状 DNA 的一种模式,在该模式中,DNA 聚合酶结合在一个缺口 链的 3@端绕环合成与模板链互补的 DNA,每一轮都是新合成的 DNA 取代前一轮合成的 DNA。 53、DNA shuffling 体外同源重组技术。将来源不同但功能相同的一组同源基因,用核酸酶Ⅰ消化成随机片段,由这些随机片段组成一个文库,使之互为引物和模板进行 PCR 扩增,当一个基因拷贝片段作为另 一基因拷贝的引物时,引起模板互换,重组因而发生,导入体内后,选择正突变体作为新一轮的体外重组。 shuttle vectors 穿梭载体 54、HSH 螺旋―转角―螺旋 螺旋―转角―螺旋 (helix-turn-helix) 是最初在久噬菌体的阻遏蛋白中发现的一种 DNA 结合结 构域。在阻遏蛋白氨基端有 5 段 α 螺旋,每段螺旋之间折转成一定角度相连接,其中两段负责同 DNA 结合 ( 图 7 ― 6) 。。螺旋 3 由 9 个氨基酸组成,与前面的由 7 个氨基酸组成的。螺旋 2 形成一个 角度。α 螺旋 3 通过氨基酸侧链同 DNA 碱基之间的氢键同 DNA 序列相结合,3 个氨基酸识别 3 个碱 基,所以 α 螺旋 3 被称为识别螺旋 (recognition helix) 。 α 螺旋 2 则是通过氢键同 DNA 的磷酸 这种结构是由一个环将两个螺旋结构分隔开来, 与螺旋-转 骨架相接触。这种相互作用对于同 DNA 结合是必需的,但并不控制对靶序列识别的专一性。 螺旋-环-螺旋基元(helix-loop-helix) , 角-螺旋结构的差别在于∶它的两个螺旋的一侧还有一段疏水链, 这样, 当螺旋-环-螺旋结构位于两个多肽 之间时,这两个疏水的侧链就会将两个多肽链连在一起形成类似亮氨酸拉链的结构。 55、chaperone 伴娘蛋白(chaperone) 与一种新合成的多肽链形成复合物并协助它正确折叠成具有生物功能构象的蛋白质。伴娘蛋白可以防 止不正确折叠中间体的形成和没有组装的蛋白亚基的不正确的聚集,协助多肽链跨膜转运以及大的多亚基 蛋白质的组装和解体。1987 年 Lasky 首先提出了分子伴侣(molecular chaperones)的概念。他将细胞 核内能与组蛋白结合并能介导核小体有序组装的核质素 ( nucleoplasmin ) 称为分子伴侣。 根据 Ellis 的 定义,这一概念延伸为“一类在序列上没有相关性但有共同功能的蛋白质,它们在细胞内帮助其他含多肽 的结构完成正确的组装,而且在组装完毕后与之分离,不构成这些蛋白质结构执行功能时的组份”。热休 克蛋白就是一大类分子伴侣。 1987 年, Ikemura 发现枯草杆菌素 (subtilisin) 的折叠需要前肽 (propeptide) 的帮助。这类前肽常位于信号肽与成熟多肽之间,在蛋白质合成过程中与其介导的蛋白质多肽链是一前一 后合成出来的,并以共价键相连接,是成熟多肽正确折叠所必需的,成熟多肽完成折叠后即通过水解作用 与前肽脱离。Shinde 和 Inouye 将这类前肽称为分子内伴侣(intramolecular chaperones) 。分类:伴侣 素家族( chaperonin, Cpn ) ; (Stress-90 family) 。 此外,其他的分子伴侣还有核质素、 T 受体结合蛋白 (TRAP) 、大肠杆菌的 SecB 和触发因子 ( trigger factor )及 PapD 、噬菌体编码的支架蛋白( scaffolding proteins )等。 分子 应激蛋白 70 家族 (Stress-70 family) ; 应激蛋白 90 家族 伴侣不仅与胞内蛋白的折叠与组装密切相关,影响到蛋白质的转运、定位或分泌;而且与信号转导 中的信号分子的活性状态与活性行为相关连,具有重要的生理意义 分子伴侣是一类帮助新生多肽链正确折叠的蛋白质,其作用:1.蛋白质在合成时,分子伴侣可逆地与未折 叠肽段的疏水部分结合随后松开,如此重复进行可防止错误的聚集发生,使肽链正确折叠。2.分子伴侣也 可与错误聚集的肽段结合,使之解聚后,再诱导其正确折叠。3.分子伴侣对蛋白质分子中二硫键的正确形 成,起到重要作用。分子伴侣功能的研究进展:分子伴侣是一类能够协助其他多肽进行正常折叠、组装、转运、降解的蛋白, 并在 DNA 的复制、转录、细胞骨架功能、细胞内的信号转导等广泛的领域都发挥着重要的生理作用,其 功能异常会导致多种相关的疾病. 56、str 短串联重复序列( short tandem repeat , STR )又称微卫星 DNA ( micro satellite DNA ),是一 类广泛存在于人类基因组中的 DNA 多态性基因座。 它由 2~6 碱基对构成核心序列, 呈串联重复排列。 STR 基因位点长度一般在 100 ~ 300 bp 之间.因个体间 DNA 片断长度或 DNA 序列差异而成高度多态 性,在基因传递过程中遵循孟德尔共显性方式遗传。因其基因片段短、扩增效率高、判型准确等特 点。已广泛应用于法医学个体识别和亲子鉴定等领域。人类基因组 DNA 有 3×109bp,其中 10%是串联 重复序列,称为卫星 DNA。按重复单位的长短,又可分为大卫星、中卫星、小卫星和微卫星。其中重复单 位仅由 2-6bases 组成的叫微卫星(microsatellite analysis),又称它为短串联重复序列(Short Tandem Repeat. STR),STR 是存在于人类基因组 DNA 中的一类具有长度多态性的 DNA 序列,不同数目的核心序列 呈串联重复排列,而呈现出长度多态性,通常多态性片段长度在 100-300bp。 57oncogene:人类或其他动物细胞(以及致癌病毒)固有的一类基因。又称转化基因,它们一旦活 化便能促使人或动物的正常细胞发生癌变。 癌基因是英文 oncogene 的译名, onco 源于希腊字 onkos ,意思是肿瘤。顾名思义,癌基因是一类 会引起细胞癌变的基因。其实,癌基因有其正常的生物学功能,主要是刺激细胞正常的生长,以满 足细胞更新的要求。只是当癌基因发生突变后,才会在没有接收到生长信号的情况下仍然不断地促 使细胞生长或使细胞免于死亡,最后导致细胞癌变 癌基因可以分成两大类:一类是病毒癌基因,指反转录病毒的基因组里带有可使受病毒感染的宿主 细胞发生癌变的基因,简写成 V-OnC ;另一类是细胞癌基因,简写成 c ― onc ,又称原癌基因 (proto-oncogene) ,这是指正常细胞基因组中,一旦发生突变或被异常激活后可使细胞发生恶性转 化的基因。换言之,在每一个正常细胞基因组里都带有原癌基因,但它不出现致癌活性,只是在发 生突变或被异常激活后才变成具有致癌能力的癌基因。癌基因有时又被称为转化基因 (transforming gene) , 58virion 病毒粒子 病毒粒子( virion ,或称病毒体) 成熟的或结构完整、有感染性的病毒个体,其结构包括: 衣壳粒( cap-somere ) 构成病毒粒子的最小单位,是由 1 ~ 6 个相同多肽分子折叠缠绕而成的 蛋白质亚单位。病毒粒子不同部位的衣壳粒可由不同的多肽分子组成,简单的病毒粒子只有 1 ~ 2 种多肽,复杂的可达 20 种以上。衣壳粒在电子显微镜下呈子粒状,故又称子粒。 衣壳( capsid ) 又称壳体。由衣壳粒以对称的形式有规律地排列成杆状、球状、 20 面体或其 他形状,构成病毒的蛋白质外壳。具有保护病毒核酸免受核酸酶及其 他因子的破坏、决定病毒感染 的特异性、病毒的抗原性等重要作用。 核衣壳( nucleocapsid ) 又称核壳体。病毒蛋白质衣壳和衣壳中心包含的病毒核酸的合称。 囊膜( envelope ) 又称被膜。有些病毒在核衣壳外层包裹着的一层构造比较复杂的包膜,由 脂类和多糖组成。表面有刺突( spike )或称囊膜突起。囊膜结构具有高度的稳定性,对病毒核酸 可起保护作用。 1、拟基因:pseudogene 拟基因是一类不产生蛋白质表达产物的DNA序列。它们缺少内含子,阅读框架 中出现终止密码子,因存在缺失或插入而使ORF被破坏。 拟基因:pseudogene 拟基因是一种畸变基 因,即核苷酸序列同有功能的正常基因有很大的同源性,但由于突变、缺失或者插入以致不能表达, 所以没有功能。 假基因与有功能的基因在核苷酸顺序的组成上非常相似, 却不具有正常功能的基因。 是相应的正常基因在染色体的不同位置上的复制品,由于突变积累的结果而丧失活性。 11、RNA 编辑 :基因转录产生的 mRNA 分子中,由于核苷酸的缺失,插入或置换,基因转录物的序列不与 基因编码序列互补, 使翻译生成的蛋白质的氨基酸组成, 不同于基因序列中的编码信息, 这种现象称为 RNA 编辑。 二、简答题 1、原核、真核生物翻译起始的异同点(10 分) 内容 完整 亚基 原核生物 70S 50S,30S fMet-tRNAfMet 3种 真核生物 80S 60S,40S Met-tRNAiMet 至少 7 种 1) 40S?Met-tRNAiMet核糖 体起始 tRNA 起始因子起始复合物的 1)30S?mRNA 生成顺序2)30S?mRNA?fMet-tRNAfMet2) 40S?Met-tRNAiMet ?mRNA3)70S?mRNA?fMet-tRNAfMet3)80S?mRNA?Met-tRNAiMet2、转录因子是什么?其与 DNA 结合的功能域(motif)的结构特点是什么? 调控蛋白质包括负调控因子(阻遏蛋白)调控因子(转录因子) 原核生物调控蛋白种类较少(由于启动子或 真核生物调控蛋白种类较多,主要是转录因子 作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:①DNA 结合域(DNA binding domain), 多由 60-100 个氨基酸残基组成的几个亚区组成;②转录激活域(activating domain),常由 30-100 氨基 酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,一酸性结构域最多见; ③连接区,即连接上两个结构域的部分。不与 DNA 直接结合的转录因子没有 DNA 结合域,但能通过转录激 活域直接或间接作用与转录复合体而影响转录效率。 与 DNA 结合的转录因子大多以二聚体形式起作用,与 DNA 结合的功能域常见有以几种: ①螺旋-转角-螺旋(helix-turn-helix,HTH)及 螺旋-环-螺旋(helix-loop-helix,HLH) 这类结构至少有两个 α 螺旋其间由短肽段形成的转角或环连接, 两个这样的 motif 结构以二聚体形式相连, 距离正好相当于 DNA 一个螺距(3.4nm),两个 α 螺旋刚好分别嵌入 DNA 的深沟。 ②锌指(zinc finger) 其结构如图 所示,每个重复的“指”状结构约含 23 个氨基酸残基,锌以 4 个配 价键与 4 个半胱氨酸、或 2 个半胱氨酸和 2 个组氨酸相结合。整个蛋白质分子可有 2-9 个这样的锌指重复 单位。每一个单位可以其指部伸入 DNA 双螺旋的深沟,接触 5 个核苷酸。例如与 GC 盒结合的转录因子 SP1 中就有连续的 3 个锌指重复结构。 ③碱性-亮氨酸拉链(basic leucine zipper,bZIP) 这结构的特点是蛋白质分子的肽链上每隔 6 个氨基 酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在 α 螺旋的同一个方向出现。两个相同的结构的两 排亮氨酸残基就能以疏水键结合成二聚体,这二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与 DNA 双螺旋链上带负电荷的磷酸基团结合。若不形成二聚体则对 DNA 的亲和结合力明显降低。在肝脏、小 肠上皮、脂肪细胞和某些脑细胞中有称为 C/EBP 家族的一大类蛋白质能够与 CAAT 盒和病毒增强子结合,其 特征就是能形成 bZIP 二聚体结构。 3、何谓 RNA 剪接,何谓 RNA 编辑? RNA 剪接( RNA splicing ):从 DNA 模板链转录出的最初转录产物中除去内含子,并将外显子连接 起来形成一个连续的 RNA 分子的过程。 RNA 的剪接机制: 酶母 tRNA 的剪接 RNA 的剪接就是要把断裂基因的转录本中的内含子除去。 酵母细胞核中 400 个 tRNA 基因中约有 40 个是断裂基因。这些基因均只有一个内含子,位于与反密码子的 3' 侧相隔一个核苷酸之处,长 度为 14 至 46bp 。不同氨基酸的 tRNA 基因中的内含子不相同,因此,剪接酶类看来并不能识别任何 共同顺序。所有内含子中均有一段与 tRNA 的反密码子互补的序列,因而使反密码臂的构象发生了 改变,即反密码子被配对而使反密码臂伸长了很多。在前体中仅反密码臂受到影响,tRNA 分子的其 他部分仍保持其正常结构。 操作子结构简单) 酵母 tRNAphe 中的内含子能与其反密码子碱基配对,从而改变了反密码臂 的结构。此剪切过程 可分为两个阶段。第一步是磷酸二酯键的断裂,这不需要 ATP 。这一步由一种内切核酸酶所催化。 第二步是连接反应,需要 ATP 的存在,由 RNA 连接酶所催化。在无 ATP 时,产生的两个 tRNA 半分 子不能连接起来。这两个半分子具有独特的末端 : 其 5' 端有 OH 基,而 3' 有一个 2' , 3'- 环磷酸基。 当加入 ATP 时,即发生第二步反应 : 两个 tRNA 半分子先发生碱基配对,形成成熟 tRNA 分子的构象, 然后由 RNA 连接酶形成磷酸二酯键而将两个半分子共价连接起来。 2' , 3'- 环磷酸基的存在并不限 于酵母,在植物和哺乳动物的 tRNA 剪接反应中也有环状基团的产生。在人的 HeLa 细胞中, RNA 连 接酶能将带有 2' ,3'- 环磷酸基的 RNA 和另一带有 5'-OH 基的 RNA 直接连接起来。酵母 tRNA 前体也 可以在爪蟾的卵母细胞核提取液中正确地被剪接。这表示剪接反应没有种属特异性。爪蟾具有能识 别酵母 tRNA 的内含子的酶类。 自身剪接反应 以前一直认为只有蛋白质有酶活性。这个概念在生物化学界已根深蒂固。然而近期发现 RNA 也 可有酶活性。这种有酶活性的 RNA 有人称之为 ribozyme 。 一种四膜虫 Tetrahumenathermophila 的两个主要 rRNAs 的基因和其他真核生物相类似 ( 见前 文 ) ,被转录在同一个初级转录本中。此转录本称为 35S 前体 RNA ,较小的 rRNA 的序列在 5' 侧,较 大的 rRNA(26S) 序列则在 3' 侧。在编码 26SrRNA 序列存在一个单一的,短的 ( 约 400bp) 内含子。如 将这个 35S 前体 RNA 在体外温育,可以发生自动剪接作用 : 内含子从前体中被切出,先呈线性 RNA 片段,后来又环化为环状 RNA 。这个反应仅需要加入一种一价阳离子,一种二价阳离子,和一种鸟 嘌呤核苷酸 (G) 。其他碱基均不能代替 G. 但并不一定需要 GTP;GDP;GMP 和鸟苷都可以应用。这表示 此反应并不需要能量供应。此外,此鸟嘌呤核苷酸必须有一个游离的 3'-OH 基。这个 G 要连接到内 含子的 5' 端上 ( 通过通常的磷酸二酯键 ) 。当线性的内含子成为环状时,其 3' 端可连接在距离 5' 端 15 个核苷酸之处,从而将原来 5' 端和 15 个碱基的节段 ( 包括 G 在内 ) 排除出去。这种反应基本上是 一种磷酸酯转移反应。外显子 A 的 3'-OH 基可直接和外显子 B 的 5' 端相连接。亦即一个磷酸酯可以 直接被转移到另一个上去, 不需要经过中间步骤 ( 如水解作用之类 ) , 因此磷酸酯键的能量被保存着。 这解释了为什么此反应不需要水解 ATP 或 GTP 来供应能量。同时,两次磷酸酯转移反应似乎是紧密 相连的,因为始终没有找到过游离的外显子 (A 或 B) 。而线性内含子的环化则可以被看作是第三个 磷酸酯转移反应。在体外系统中进行剪接时,并不需要蛋白质的存在。 RNA 有能力自行剪接,故称 为自身催化作用 (auto catalysis) 。 T.Cech 和 S.Altman 各自独立地发现 RNA 具有催化作用。从而改变了生物催化剂的传统概念。 为此他们共同获得了 1989 年 Nobel 化学奖。 1978 年 Altman 从纯化的 RNA 酶 P 中分离出一种多肽和 一种 RNA(M1RNA) 。最初的实验结果表明,蛋白质和 M1RNA 单独都没有酶活性,但二者混合在一起又 可恢复活性。 其它生物材料的实验结果表明 M1RNA 是 RNA 酶 P 活性所必须的。 1983 年 Altoman 证明, 在较高浓度的 Mg2+ 存在下,单独的 M1RNA 就可以催化 tRNA 前体的成熟,而单独的蛋白质则没有这 种能力。这样, RNA 即可看作是个酶。事实上, M1RNA 的酶活性并不比 RNA 酶 P 的粗制品的活性低。 原来认为蛋白质赋予酶的活性, RNA 只起某种辅助作用 ( 例如帮助蛋白质与其底物结合 ) ,但现在发 现这两种功能已经倒转。 Cech 给具有催化活性的 RNA 定名为 ribozyme 。 很长时间以来,人们就试图自己设计和生产酶分子,但因蛋白质分子结构上的复杂性,迄今为 止,尚无成功的例子。近年来随着 ribozyme 的发现,人工酶 ( 新概念下的酶,它的构件分子是核苷 酸 ) 的设计又产生了新的希望。澳大利亚的科学家就设计了九个 ribozyme 分子,它们都具备内切酶 的活性,且切割位点有高度特异性。同时, ribozyme 的活性随 pH 、温度、及阳离子浓度的变化而 变化,显示出典型的酶特性。由于 ribozyme 的作用位点高度特异,故可以用来切割特定的基因转 录产物 (RNA) 。有人将这种切割作用叫做抗基因活性。因为切割的结果破坏了 RNA ,也就是抑制了基 因的表达。这种特性为我们进行基因和病毒的治疗提供了一个可行的途径。 某些线粒体中的内含子也是自身剪接的内含子。一些常见的真菌,如粗糙脉孢菌 (Neurosporacrassa) ,酒酵母 (Saccharomycescerevisiae) 等的线粒体内含子都能进行自身剪接, 像四膜虫中进行的磷酸酯转移反应一样。 能够编码蛋白质的内含子 某些真菌线粒体中的内含子有很不寻常的结构,这些内含子有编码顺序,这些顺序的翻译对于 该顺序所在的内含子的剪接是必须的。 编码细胞色素 b 的 box 基因在仅剪去内含子 1 时, 会产生 RNA 成熟酶的 mRNA 。当内含子 2 亦被剪去时,才是细胞色素 b 的编码顺序的开端。线粒体中的 box 基因 是编码细胞色素 b(cytb) 的。 box 基因中的外显子 1 有 417bp ,编码 cytb 的 N 端 139 个密码子。内 含子 1 有 765bp ,不编码。外显子 2 非常短,仅有 5 个密码子。其后是一个很长的内含子 2 。内含 子 2 的特点是其开头 840bp 是一个开放读框 (ORF) ,有 280 个密码子,其最后一个密码子为终止密 码子。当将内含子 1 剪去后,翻译即从外显子 1 起始,通读过外显子 2 而进入内含子 2 的 ORF ,产 生一个有 423 个氨基酸残基的蛋白质 ( 其中 144 个是 cytb 的 N 端氨基酸, 279 个则由内含子 2 编码, 称为 RNA 成熟酶 (maturase) 。 RNA 成熟酶是特异地用来剪去内含子 2 的。这样,这个酶促反应便成 为一个非常敏感的负反馈径路。去除内含子 2 后,外显子 1 和 2 即与外显子 3 相连接,因而破坏了 编码成熟酶的顺序。 细胞核中的剪接连接点 剪接连接点 (splicing junctions) 是指在切断和重接位点处的两旁的顺序。在内含子左侧的连 接点称为供体 (donor) ,在内含子右侧的称为受体 (acceptor) 。在细胞核的结构基因 ( 即编码多肽的 基因 ) 中的所有内含子在外显子 - 内含子连接处均有 GT ...AG 的共同顺序。较详细的共同顺序如下, 供体位点受体位点: 外显子...AG↓GTAAGT...内含子...Py10CAG↓...外显子 箭头表示切断的键。这些还是较短的共同顺序,存在于几乎所有的真核生物中。 从上述共同顺序可见供体和受体位点之间并无互补现象,所以不可能想像这两个位点会通过碱 基配对而结合一起,以便于内含子的切除。正确的剪接并依赖于天然前体 RNA 分子的完整性。一个 外源基因如果存在于病毒顺序中,仍能很好地被剪接。另外,前体 RNA 亦能在不同的组织,或甚至 不同物种的细胞中被正确地剪接。这都表示剪接作用是很保守的。一个真正基因中一个外显子可以 和另一个基因的外显子连接起来。例如,将 SV40( 猴病毒 40) 的早期转录单位的第一外显子和小鼠 β 珠蛋白的第三外显子相连,这样形成的杂交内含子仍能正确地被剪接。即 SV40 的内含子的供体 位点 (1I) 可以剪接到小鼠 β 珠蛋白的内含子的受体位点 (r2) 上。 套索的产生 HeLa 细胞的核提取液能够剪接纯化的 RNA 前体,这表示剪接作用并不与转录作用 相关连。 RNA 的修饰也和剪接无关,例如珠蛋白 RNAs 即使缺少 poly(A) 尾链,也没有加帽,仍能正常地被剪接。 剪接过程可分为两个阶段,与上文所述自身剪接不需能量不同,核内剪接需要用 ATP 。 在第一阶段中,内含子左端 ( 供体位点 ) 处被切断,形成两个分离的 RNA 分子,即左外显子和右 内含子 - 外显子。 左外显子此时为 - 线性分子, 但右内含子 - 外显子则不然 : 内含子左端 (5' 端 ) 以 5'-2' 键与在内含子右端上游约 30 碱基处的 CTGAC 序列 ( 共同序列 ) 中的 A 相连接,于是形成一个 & 套索 &(lariat)& 。在第二阶段,在受体位点处被切断而将此套索状的内含子剪去 ; 同时分离的右外显子 即与左外显子相连接。套索然后被 & 脱支 (debranch)& 而形成一线性内含子。在这种剪接机构中,有 三个很短的共同顺序, 即供体和受体位点处于一个和套索分支处的一个序列。 用酵母做的实验证明 : 分支处的共同顺序如果发生突变或缺失将使剪接不能进行。这个共同顺序常称为 TACTAAC 盒。它和 左侧的供体位点共同顺序互补,但研究证明两者并不发生碱基配对。在高等真核生物中此分支靶顺 序的保守性较小。 snRNAs 的作用 真核细胞有细胞核和细胞浆中都含有许多小 RNA ,它们约有 100 到 300 个碱基,每个细胞中可 含有 105-106 个这种 RNA 分子。它们是由 RNA 聚合酶Ⅱ或Ⅲ所合成的,其中某些像 mRNA 一样可被 加帽。在细胞核中的小 RNA 称为 snRNA ,而在细胞浆中的称为 scRNA 。但在天然状态下它们均与蛋 白质相结合,故分别称为 snRNP 和 scRNP 。某些 snRNPs 和剪接作用有密切关系。有些 snRNPs 分别 和供体及受体剪接位点以及分支顺序相互补。 snRNAs 中最受注意的一个是 U1 ,它普遍存在于哺乳 动物、鸟类和昆虫细胞中。人 U1snRNP 中除 RNA 外还 8 个蛋白质分子。人 U1snRNA 的可能二级结构 如图。其 5' 端的 11 个核苷酸是单链的,并有一段和内含子左侧的供体序列互补。在供体位点处的 互补序列通常为 4-6bp 。在体外,完整的 U1snRNP 粒子能和左侧共同顺序结合,但纯化的 U1snRNA 却不能。 U1snRNA 参与剪接的证据是抗 U1snRNP 的抗体可以在体外抑制剪接作用 ; 而且如果从系统中 将 U1snRNP 除去,剪接即不能进行。事实上,除去 U1sn RNA5' 端的几个核苷酸即可抑制体外剪接作 用。 有可能 U5snRNA 能识别右侧 ( 受体位点 ) 共同顺序 ; 而 U2snRNA ,则具有与分支位点互补的顺序。 抗 U2snRNP 的抗体可以和 U2snRNA 及包括分支位点在内的内含子所形成的复合体发生免疫沉淀。U1 和 U2 可能参与剪接反应的起始阶段,因为 U1 和 U2 的灭活将阻止左侧连接点的切断和套索的形成。 另外两个 snRNAsns(U4 和 U6) 可能亦参与剪接作用,但它们的功能尚不详。一般认为,脊椎动物细 胞有 6 种不同的 snRNAs ,称为 U1 、U2 、U3 、U4 、U5 和 U6 。最小的是 U6 ,有约 100 核苷酸长。最大 的是 U3 ,也不过 215 核苷酸长。它们和蛋白质结合成 snRNPs 。系统性红斑狼疮 (SLE) 患者和某些风 湿病患者的血清中常可检出对 snRNPs 中某些蛋白质的自身抗抗体。 核内不均一 RNA 编码蛋白质的结构基因是在核浆中被转录的。但是核浆中的 RNA 却并不像 mRNA 。核浆 RNA 要 大得多,很不稳定,并且其顺序的复杂性也要大得多。由于它的大小很不一致,故称核内不均一 RNA(hnRNA) 。 已经证明 mRNA 确实是从 hnRNA 生成的。 细胞浆内的 mRNA 平均只有
个碱基。 而哺乳动物的 hnRNA 平均有
个碱基,其范围很广泛,从
碱基均有,所以一 般要比 mRNA 大 4-5 倍。如果以 5 倍计算,由于正常哺乳动物细胞中测得 mRNA 仅占 hnRNA 量的 5% , 则相当于有 25% 的 hnRNA 可转变为 mRNA 。这意味着有 3/4 的 hnRNA 即在核内降解。 hnRNA 被切除内 含子后即成为 mRNA ,并进入细胞浆内。但在切除内含子之前, hnRNA 可先加帽和加 poly(A) 尾链。 有一种称为 poly(A) 聚合酶的酶可以用 ATP 为底物,以加上 poly(A) 尾链,这是 hnRNA 转变为成熟 的 mRNA 所必须的。在哺乳动物细胞中,仅约 30% 的 hnRNA 被多聚腺苷酸化,而 mRNA 中却约 70% 是 有 poly(A) 尾链的。可能多聚腺苷酸化是 hnRNA 分子要被加工的信号。hnRNA 的尾端要被切去一段, 然后才加上 poly(A) 。因为 RNA 聚合酶在转录时即已通过了相当于加上 poly(A) 的位点,故 hnRNA 尾端的多余部分要由内切核酸酶切去,才能加上 poly(A) 。 RNA 编辑 (RNA editing) RNA 编辑是指在 mRNA 水平上改变遗传信息的过程。具体说来,指基因转录产生的 mRNA 分子中, 由于核苷酸的缺失,插入或置换,基因转录物的序列不与基因编码序列互补,使翻译生成的蛋白质 的氨基酸组成,不同于基因序列中的编码信息现象。 RNA 编辑同基因的选择剪接或可变剪接 (alternative splicing) 一样,使得一个基因序列有可 能产生几种不同的蛋白质,这可能是生物在长期进化过程中形成的、更经济有效地扩展原有遗传信 息的机制。 RNA 编辑是通过比较成熟的 mRNA 与相应基因的编码信息时发现的,成熟的 mRNA 序列中有几种 意想不到的变化,包括 尿嘧啶( U )突变为胞嘧啶( C ) 、胞嘧啶突变为尿嘧啶、尿嘧啶的插入或缺 失、 多个鸟嘌呤 ( G) 或胞嘧啶的插入等。 最典型的例子是锥虫 (Trypanosome) 动质体 (kinetoplastid) 的线粒体基因 mRNA 的编辑 , 涉及上百个尿嘧啶的缺失和插入。 由于 RNA 编辑是基因转录后在 mRNA 中插入、缺失或核苷酸的替换而改变 DNA 模板来源的 遗传信息,翻译出多种氨基酸序列不同的蛋白质, RNA 编辑的结果不仅扩大了遗传信息,而且使生 物更好地适应生存环境。有些基因的主要转录产物必须经过编辑才能有效地起始翻译,或产生正确 的可读框 (ORF) 。 4、什么是转座子?转座子标签法转移基因的原理是什么? Transposon a segment of DNA that can become integrated at many different sites along a chromosome (especially a segment of bacterial DNA that can be translocated as a whole) 转座因子或转座子是一类在很多后生动物中(包括线虫、昆虫和人)发现的可移动的遗传因子。 一段 DNA 顺序可以从原位上单独复制或断裂下来,环化后插入另一位点,并对其后的基因起调 控作用,此过程称转座。这段序列称跳跃基因或转座子,可分插入序列( Is 因子),转座( Tn ), 转座 phage 。 转座子是一类在细菌的染色体 , 质粒或噬菌体之间自行移动的遗传成分 , 是基因组中一段特异 的具有转位特性的独立的 DNA 序列 . 转座子是存在于染色体 DNA 上可自主复制和位移的基本单位。最简单的转座子不含又任何宿主 基因而常被称为插入序列( IS ),它们是细菌染色体或质粒 DNA 的正常组成部分 转座 ( 因 ) 子是基因组中一段可移动的 DNA 序列,可以通过切割、重新整合等一系列过程从基因 组的一个位置“跳跃”到另一个位置。 复合型的转座因子称为转座子 (trans ― poson , Tn) 。 这种转座因子带有同转座无关的一些基因, 它的两端就是 IS ,构成了“左臂”和“右臂”。两个“臂”可以是正向重复,也可以是反向重复。 这些两端的重复序列可以作为 Tn 的一部分随同 Tn 转座,也可以单独作为 IS 而转座。 转座子是细菌细胞里发现的一种复合型转座因子,这种转座因子带有同转座无关的一些基因, 如抗药性基因;它的两端就是 IS ,构成了“左臂”和“右臂”。两个“臂”可以是正向重复,也可 以是反向重复。这种复合型的转座因子称为转座子 (trans ― poson ,Tn) 。这些两端的重复序列可以 作为 Tn 的一部分随同 Tn 转座,也可以单独作为 IS 而转座。Tn 两端的 IS 有的是完全相同的,有的 则有差别。当两端的 IS 完全相同时,每一个 IS 都可使转座子转座;当两端是不同的 IS 时,则转 座子的转座取决于其中的一个 IS 。 Tn 有抗生素的抗性基因, Tn 很容易从细菌染色体转座到噬菌体 基因组或是接合型的质粒。因此,Tn 可以很快地传播到其他细菌细胞,这是自然界中细菌产生抗药 性的重要来源。 两个相邻的 IS 可以使处于它们中间的 DNA 移动,同时也可制造出新的转座子。 Tn10 的两端是 两个取向相反的 IS1O ,中间有抗四环素的抗性基因 (TetR) ,当 TnlO 整合在一个环状 DNA 分子中间 时,就可以产生新的转座子。当转座子转座插人宿主 DNA 时,在插入处产生正向重复序列,其过程 是这样的:先是在靶 DNA 插入处产生交错的切口,使靶 DNA 产生两个突出的单链末端,然后转座子 同单链连接,留下的缺口补平,最后就在转座子插入处生成了宿主 DNA 的正向重复。已知的转座因 子的转座途径有两种:复制转座和非复制转座。 1 .复制转座 (replicative transposition) 转座因子在转座期间先复制一份拷贝,而后拷贝 转座到新的位置,在原先的位置上仍然保留原来的转座因子。复制转座有转座酶 (transposase) 和 解离酶 (resolvase) 的参与。转座酶作用于原来的转座因子的末端,解离酶则作用于复制的拷贝。 TnA 是复制转座的例子。 2 .非复制转座 (non-replicative transposition) 转座因子直接从原来位置上转座插入新的 位置,并留在插入位置上,这种转座只需转座酶的作用。非复制转座的结果是在原来的位置上丢失 了转座因子,而在插入位置上增加了转座因子。这可造成表型的变化。 保留转座 (conservative transposition) 也是非复制转座的一种类型。其特点是转座因子的切 离和插人类似于入噬菌体的整合作用,所用的转座酶也是属于入整合酶 (integrase) 家族。出现这 种转座的转座因子都比较大,而且转座的往往不只是转座因子自身,而是连同宿主的一部分 DNA 一 起转座。 非复制转座可以是直接从供体分子的转座子两端产生双链断裂,使整个转座子释放出来, 然后在受体分子上产生的交错接口处插入,这是“切割与黏接”(“cut and paste&)的方式。另一 种方式是在转座子分子同受体分子之间形成一种交换结构 (crossover structure) ,受体分子上产 生交错的单链缺口, 与酶切后产生的转座子单链游离末端连接, 并在插入位点上产生正向重复序列; 最 后,由此生成的交换结构经产生缺口 (nick) 而使转座子转座在受体分子。供体 DNA 分子上留下 双链断裂,结果 或是供体分子被降解,或是被 DNA 修复系统识别而得到修复。 在复制转座过程中,转座和切离是两个独立事件。先是由转座酶分别切割转座子的供体和受体 DNA 分子。转座子的末端与受体 DNA 分子连接,并将转座子复制一份拷贝,由此生成的中间体即共 整合体 (cointegrat , ) 有转座子的两份拷贝。 然后在转座子的两份拷贝间发生类似同源重组的反应, 在解离酶的作用下,供体分子同受体分子分开,并且各带一份转座子拷贝。同时受体分子的靶位点 序列也重复了一份拷贝。 酵母接合型的相互转换也是复制转座所产生。酿酒酵母 (Saccharomvcescerf ― visiae) 的生命 周期中有双倍体细胞和单倍体细胞两种类型。单倍体细胞则有 a 型和 α 型两种接合型 (mating type) 。 单倍体酵母是 a 型还是 α 型, 由单个基因座 MAT 所决定。 MAT 有一对等位基因 MAT 。 和 MAT α , 在同宗接合 (homothallic) 的酵母菌株中,酵母菌十分频繁地转换其接合型,即从 a 转换成 α ,然 后在下一代又转换为 a 。这种转换和回复的频率已远远高于通常的自发突变,表明这不是通常的突 变机制。现在已经知道,在 MAT 基因座两侧有两个基因带有 MAT α 和 AT α 的拷贝,这就是 HML α 和 HMR α 基因。这两个基因贮存了两种接合型等位基因,当转座给 MAT 基因座时就发生了接合型的 转换。因此, MAT 基因座是通过转座而转换其接合型的。 MAT 基因座的序列转换成另一个基因的序 列,这种机制称为基因转换 (gene convertion) 。 1951 年 Barbara Mclintock 首先在玉米中发现了控制元件,后来命名为转座元件或转座子 (transposon) 。转座子是基因组中一段可移动的 DNA 序列,可以通过切割、重新整合等一系列过程 从基因组的一个位置“跳跃”到另一个位置。这一元件不仅可用于分析生物遗传进化上分子作用引 起的一些现象,还为基因工程和分子生物学研究提供了强有力的工具,可以在不了解基因产物的生 化性质和表达模式的情况下,分离克隆植物基因,即转座子标签 (transposon tagging) ,又称为转 座子示踪法。其原理是利用转座子的插入造成基因突变,以转座子序列为基础,从突变株的基因文 库中筛选出带有此转座子的克隆,它必定含有与转座子序列相邻的突变基因的部分序列,再利用这 部分序列从野生型基因文库中获得完整的基因〔 1 〕。 1984 年,用转座子标签法首先在玉米中分离 了 bronze 基因,该基因编码了玉米花色素合成途径的关键酶 ―― UDP- 葡萄糖类黄 3-O- 葡萄糖基转 移酶〔 2 〕。此后还利用转座子标签技术分离了许多植物基因。 1 转座子概述 转座子可以分为两大类:以 DNA-DNA 方式转座的转座子和反转录转座子 (retrotransposon) 。 第一类转座子可以通过 DNA 复制或直接切除两种方式获得可移片段,重新插入基因组 DNA 中。根据 转座的自主性,这类元件又可以分为自主转座元件和非自主转座元件,前者本身能够编码转座酶而 进行转座,后者则需在自主元件存在时方可转座,以玉米的 Ac/Ds 体系为例, Ac(Activator) 属于 自主元件, Ds(Dissociation) 则是非自主元件,必需在 Ac 元件存在下才能转座〔 1 〕。第二类转座 子又称为返座元 (retroposon) 〔 3 〕,是近年新发现的由 RNA 介导转座的转座元件,在结构和复制 上与反转录病毒 (retrovirus) 类似,只是没有病毒感染必须的 env 基因,它通过转录合成 mRNA, 再 逆转录合成新}

我要回帖

更多关于 反向重复序列 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信