RNA自拼接
出处:按学科分类—自然科学总论 北京出版社《现代科技综述大辞典上》第850页(3799字)
自1926年萨默(J.B.Summer)结晶出脲酶并发现它是一类蛋白质以来,酶是蛋白质的概念便深深植入生物学家的脑海。
1968年克里克(F.H.C.Crick)开始思索关于蛋白质合成复杂性生化机制起源的问题。他设想,原始核糖体很可能完全由RNA组成,最初的酶也可能是一种肯复制酶活性的RNA分子。1974年首次测定出tRNA结构,发现它本身能折叠成三维结构。然而,四种碱基组成的RNA似乎无法与20种氨基酸构成的蛋白质的巨大灵活性比拟。所以,克里克的远见卓识很难为科学共同体接受。
1981年切赫等在纤毛原生动物四膜虫细胞中发现,前体rRNA内含子(又叫插入序列,IVS)的离体自拼接现象。
IVS由414个苷酸组成,其一级结构有4个保守的碱基配对区〔P(1~9),Q,R,S〕,P3~4和P6~7区形成一个高度保守的核心结构,其中U310是鸟苷的结合位置。IVS自催化过程包括两个顺序的转醋酰反应:溶液中的一个GTP或鸟苷首先攻击5′拼接位点;与内含子的第1个核苷酸形成一个磷酸二酯键,释放出具5′末端的外显子;5′外显子的3′-OH末端继而攻击IVS3′端拼接位点,释放出这个内含子后将两个相邻的外显子连接在一起。经过自拼接的内含子就获得一个5′末端非基因编码的G残基。
为此,切赫把自拼接的IVS定名为“核酶”。
70年代奥尔特曼把一个pre-tRNATyr的突变分子与E.coli提取液混和时发现,后者存在明显的酶活性,它可以从pretRNA分子5′和3端切除“多余”的核苷酸。奥尔特曼把这种具5′端内切和3′端外切活性的酶命名为核糖核酸酶P(RNaseP)。
经过10年的研究,终于在1983年揭示了此酶的本来面目。RNaseP由两个亚单位组成,一个是377个核苷酸组成的RNA分子(M.RNA),另一个是分子量为14,000的蛋白质(C5pr)。
离体条件下参与pre-tRNA催化作用的是M1RNA,在活体内则需C5pr的辅助。
M1RNA的二级结构上有两个互补的寡核苷酸序列,推测它在三级结构上有助于M1RNAC92残基与底物pre-tRNA之间形成交联而完成离体条件下MRNA的催化反应。RNaseP的催化机理不详,已提出两种假设:(1)SN2线性取代机理的变形;(2)RNaseP分子上的一些官能团衍生出亲核物质,然后与Mg2+联合完成催化过程。
继切尔奥尔特曼之后,在脉孢菌酵母的线粒,T4噬菌体、类病毒、玉米及衣藻的叶绿体中又陆续发现许多具有自拼接功能的内含子。
已经发现的各种内含子分两种:一类内含子和二类内含子。在二级结构上,前者的显着特征是有两个高度保守的寡核苷酸序列,5′-PYUCA.GACUA-3′和5′-U.A.GA.AUAGUC3′。这两个互补序列借助二级结构在空间上相距很近。一类内含子3′端始终为G,5′端则终止于U之后。后者3′端均有一个高度保守的序列(约100个核苷酸)5′-PUAGCPYGUAUPu..PU.GAA.U,.PYACGUACPUGUUPY-3′。该序列大都能折叠成一个14BP组成的发荚结构,其上有一个GAAA末端环,位于环的3′侧有一个CG形成的凸臂。
在催化机理方面,四膜虫Pre+rRNAIVS的自拼接过程即是一类内含子的催化机制。二类内含子通过“索套(1ariat)”结构进行自身剪接,它不需鸟苷或其他任何苷酸的辅助。
位于内含子3′端高度保守的A7或A8的2′-OH对5′拼接位点亲核攻击,通过转酯酰基使内含子先从5′端拼接位置上剪切下来,形成具2′,3′,5′磷酸三酯键的套索状;然后游离的外显子3′-OH再次对内含子3′端拼接位点亲核攻击,一个完整的分支套索状内含子被切除,两个外显子连接在一起完成自拼接过和程。
1983年布朗(R.S.Brown)等阐明Pb2+催化酵母tRNAphe糖一磷酸骨架链的断裂机制。
Pb2+在tRNAphe上有3个吸附位点〔Pb(1),Pb(2),Pb(3),〕,Pb(1)位于TYC环区,Pb2+吸附于U5g的O-4原子上;Pb(2)位于额外环区,Pb2+吸附于G45原子上;Pb(3)位于反密码子区,Pb2+吸附于Y37的N-7原子上。在Pn(1)位点上,结合在Pb2+上的-OH先攻击二氢尿嘧啶(D17)核糖2′-OH的质子,产生的2-O再对G18的磷原子发动亲核进攻。
结果D17~G18之间的磷酸二酯键断裂,D17核糖形成2′,3′-环化磷酸酯,G18末端形成5′-OH。此外,位于Pb(2)处的G22~A23之间也发生缓慢断裂,但机理不详。
Pb(3)处未发生断裂。
1984~1985年,一些实验表明核pre-mRNA的拼接是通过称为拼接体(spliceosome)的过程完成的,拼接体是由核内小分子核糖核蛋白(snRNP),一些必需的蛋白因子和pre-mRNA3部分组成复合体,其中snRNP又是snRNA和一些核蛋白的复合物。
已知snRNA有10种(U1-10),而参于与pre-mRNA拼接的snRNA至少有U1和U2。U1snRNA在其5′端有一段高度保守序列,它与pre-mRNA5′端拼接位点上有9个核苷酸一致序列精确配对,并与拼接体其它组分联手完成PRE-mRNA的加工。
拼接机理依第2类内含子的套索结构进行,只是3′端高度保守的A碱基在其上游较远的20~50位置处。
1986~1987年陆续证实植物病原RNA自断裂现象。这些病原RNA有拟病毒,病毒正链卫星RNA〔(+)sTRSV〕和类病毒(ASBV)它们的二级结构都有一个“郎头(hammerhead)”结构即碱基配对形成的3个臂组成。Ⅱ和Ⅲ臂上各有8~10个高度保守的寡核苷酸序列,5′-CUGA.GA.G.C-3′和5′-G.CGAAAC3′,Ⅰ和Ⅱ臂间的C残基3′侧是自断裂位点.5′-GUC↓..-3′。
目前,自断裂机制不详,推测是转酯酰作用,断裂处形成5′-OH和2′.3′-环化磷酸酯。
如果说RNA在自拼接过程中因本身发生变化不能说是真酶的话,Ⅰ类内含子所具备的po1yC聚合酶活性则于1987年被实验证实。
IVS近5′端有一段6个碱基组成的富G内部指导序列(1GS),5′-GGAGGG-3′,可与5′端外显子序列配对后构成底物结合部位。IGS可选择寡聚C前体做底物,由内含子核心结构通过与自拼接相同的转酯酰机制完成polyC的聚合反应。
1989年汉普尔(A.Hampel)等在病毒负链卫星RNA〔(-)sTRSV〕中发现了催化RNA/底物RNA自催化复合体。
在(+)sTRSV经滚环复制产生的(-)sTRSVRNA分子,催化区与(+)sTRSV的自断裂区结构不同。它有两个最短序列,14个碱基(53-40)的底物序列(5′UGACA↓GUCCUGUUU-3′)和50个碱基(224-175)的催化序列。(5′-AAACAGAGAAGUCAACCAGAAACACACGUUGUGGUAUAUUACCUGGUA-3′)。
后者催化前者在ApG(48~47)处断裂,形成5′-OH和2′,3′-环化磷酸酯。同年在蝾螈细胞卫星DNA转录本中也发现了这种郎头结构的自断裂催化机制。
RNA自拼接现象为科学家重新认识RNA在生命活动中的作用奠定了基础。首先,近来有实验表明,用富A序列取代内含子IGS,polyC聚合功能则转变为polyU聚合功能,这是否意味IGS相当于原初RNA复制酶的模板?换言之,若借遗传工程技术切除内含子的IGS,用一个不同的能起外部引导序列功能的单链RNA模板取而代之,这样获得的依赖模板的RNA聚合酶也许能复制其他RNA分子。
其次,在RNA复制过程中保证复制错误的校对机制是什么?近来在低等填核生物线粒体mRNA中发现了类似校正的机制——RNA编辑(RNAediting)。然而,在RNA聚合酶起源以前,该过程最初是否代表了RNA顺序变化和修复的一般机制?此外,在锥虫线粒体中还发现,RNA编辑能将潜在的起始密码子从阅读框架中断开,这是否暗示RNA编辑是一种基因表达的正负调节系统?或代表着一种信息?第三,与DNA和蛋白质分子比较起来,因为自拼接和自复制特性,RNA似乎无疑会成为生命大分子起源的第一个产物。
那么,最初无蛋白质的“RNA世界”的图象是什么?自复制的RNA究竟是怎样产生的?第四,RNA自拼接功能预示一个基于RNA新基因工程时代的到来。用RNA工具酶剪切引起人类和动植物病源的RNA分子就有可能达到治愈顽症的目的,但这需要克服技术上的挑战,即台何使RNA工具酶进入细胞并能长期保持其稳定性;它是否剪切错误的部位以及是否能在活细胞内发挥正常剪切功能等问题。
(河南大学生物系张大卫教授、李荣撰)