知道氨基酸序列如何算蛋白质 氨基酸的pi值

热门产品分类:
电话:029-27906
您现在的位置: >
>通过n端的pi值控制生产可溶性重组蛋白的制作方法技术领域本发
通过n端的pi值控制生产可溶性重组蛋白的制作方法技术领域本发
来源:E网赢 &日期: 0:09:22 &&浏览次数:&&&&
通过n端的pi值控制生产可溶性重组蛋白的制作方法技术领域本发明涉及用于提高重组蛋白的分泌效率的方法。技术背景现代生物工程中的关键技术之一是生产重组蛋白。特别地,生产处于天然形式的 水溶性蛋白很重要。水溶性蛋白的生产对于活性蛋白的生产和回收、其用于功能研究的结 晶以及工业化很重要。已经进行了关于利用大肠杆菌(E. coli)生产重组蛋白的研究。利用 大肠杆菌具有许多优点,诸如易于操作,培养时间短,安全表达,低成本和易于规模化调控。因为大肠杆菌中生成的异源重组蛋白不经过翻译后蛋白伴侣陪伴或翻译后加工, 因此重组蛋白中不存在折叠或其变成不溶的蛋白内含体(Baneyx,Curr. Opin Biotechnol. (当前生物技术观点)10 =411-421,1999)。由于公开了信号序列诱导蛋白在周质外的胞外分泌,所以关于信号序列的结构 和功能的研究已经集中在氨基端碱性区域(Lehnhardt等,J. Biol. Chem.(生物化学杂 志)263
,1988),疏水区域(Goldstein 等,J. Bacteriol.(细菌学杂志)172
90)和分裂区域(Duffaud 和 Inouye,J. Biol. Chem.(生物化学杂志)263
,1988)。同时,已经通过使用不同信号序列开发了多种载体,以生产水溶性蛋 白质(ompA :Ghrayeb 等,EMBO J. 3 :,1984 ;Duffaud 等,Methods Enzymo 1.(酶学 方法)153 :492-507,1987 ;phoA =Dodt 等 FEBS Lett. 202 :373_377,1986 ;Kohl 等,Nucleic Acids Res.(核酸研究)18 : ;eltA =Morika-Fujimoto 等,J. Biol. Chem.(生物 化学杂志)266
,1991 ;bla :0ka 等,Agric Biol. Chem.(农业生物化学)51
,1987 ;eltllb-B Jobling 等,Plas (质粒)38 :158_173,1997)。然而,使用 信号序列的载体目前限于表达水溶性蛋白和甚至是作为重组融合蛋白形式的表达的蛋白, 其在裂解后包括位于N端处的信号肽酶或蛋白酶的裂解位点,因此很难获得具有天然氨基 末端的重组蛋白。导致很难利用信号序列生产重组蛋白的原因是1)不可能预测水溶性 蛋白的产生且许多研究者认为重组蛋白的水溶性取决于整个蛋白的氨基酸序列的特征;和 2)存在太多的作用为信号序列的不同序列且尚不存在用于研究SecA/信号肽的相互作用 的适当分析方法(Triplett 等,J. Biol. Chem.(生物化学杂志)276
,2001)。本发明人提供包含由多核苷酸构成的基因构建体的表达载体,所述多核苷酸各自 编码包含N区和/或内含N区的疏水片段作为方向信号的平截信号序列和/或内含由亲水 多肽构成的分泌增强子的平截信号序列,这记述在韩国专利公开号10-中, 并且以前还验证了黏着蛋白Mefpl的可溶性表达可以通过将编码黏着蛋白Mefpl的核苷酸 加入至包含上述基因构建体的载体而得到提高。本发明人还分析了 Pl值取决于信号序列 的N区片段长度,并证实,从OmpASPn至OmpASPh21的全长的片段具有相等的P〗值(10. 55) 对于表达黏着蛋白Mefpl很重要。在韩国专利公开号10-中,本发明人报告 了包含两亲性结构域的蛋白诸如牙鲆(olive flounder)Hepcidin I,在单独使用信号序列 的N区片段条件下仅限于可溶性表达,且进一步构建通过将亲水性分泌增强子序列加入至基因构建体来提高水溶性形式的牙鲆Hepcidin I的表达的方法。因此,本发明人构建了包含由多核苷酸构成的基因构建体的重组表达载体,所述 多核苷酸编码具有不同Pl值的信号序列,证实了重组载体中包含的信号序列的N端pi值 在异源蛋白的可溶性表达中起一定的作用,并证明了当由于异种蛋白的结构特征而需要分 泌增强子时,信号序列的N端pi值和分泌增强子的pi值之间的相互关系,并且进一步验证 了在为表达异源蛋白而构建的重组表达载体中的信号序列的N端的pi值的控制在提高异 源蛋白可溶性表达中很重要,从而导致完整本发明。公开内容技术问题本发明的目的是提供用于生产关于外源基因的水溶性重组融合蛋白和回收在氨 基端具有天然形式的蛋白的有效方法。技术解决方案为了实现以上目的,本发明提供用于提高异源蛋白的分泌效率的表达载体,所述 表达载体包含基因构建体,其包括(i)启动子和(ii)与所述启动子操作性相连接的编码 多肽片段或其变体的多核苷酸,所述多肽片段中影响Pi值的氨基酸之间的距离受到调控, 所述多肽片段包含信号序列、和/或异源蛋白的前导序列的N区和/或前导序列的N区。本发明还提供用于提高异源蛋白的分泌效率的表达载体,所述表达载体包含基因 构建体,其包括(i)启动子;(ii)与所述启动子操作性相连接的编码多肽片段或其变体的 多核苷酸,在所述多肽片段中Pl值受到调控,所述多肽片段包含信号序列和/或前导序列 的N区;和(iii)与编码所述多肽片段或其变体的多核苷酸操作性相连接的编码分泌增强 子的多核苷酸,所述分泌增强子包括具有受控Pl值的亲水性增强序列。本发明还提供通过用以上表达载体转化宿主细胞制备的转化体。本发明还提供利用所述转化体提高重组蛋白分泌效率的方法。本发明还提供用于生产重组融合异源蛋白的方法。本发明还提供通过以上方法生产的重组融合异源蛋白。本发明还提供药物组合物,其包含以上重组融合异源蛋白和药用载体。本发明还提供用于生产处于天然形式的异源蛋白的方法。另外,本发明提供用于生产靶物质的胞内载体的方法。有利效果本发明的方法有利于防止重组蛋白作为不溶蛋白沉淀和提高蛋白在胞质外或进 入周质中的分泌效率,由此其可以有效地用于生产重组异源蛋白和用于通过利用强分泌增 强子增加膜通透性来转导治疗性蛋白。附图说明参考附图更好地理解本发明优选实施方案的应用,其中图1是图示通过信号序列OmpASPte及其变体前导序列进行的粘黏着蛋白 Mefpl (可溶级分约20 μ g)的比较可溶性表达的图表(箭头重组Mefpl)。获自密度计分 析的数值表示三种不同克隆中蛋白表达的比较平均值(A) SDS-PAGE ;[0025]⑶蛋白质印迹;和,(C)密度计分析Ia M 标记;泳道1 =Met-Ala-Lys (pi 9. 90) (SEQ. ID. NO 15);泳道2 =Met-Lys-Ala-Lys (pi 10. 55) (SEQ. ID. NO 16);泳道3 =Met-Lys-Lys-Ala-Lys (pi 10. 82) (SEQ. ID. NO 17);泳道4 =Met-Lys-Lys-Lys-Ala-Lys (pi 10. 99) (SEQ. ID. NO 18);泳道5 =Met-Lys-Lys-Lys-Lys-Ala-Lys (pi 11. 11) (SEQ. ID. NO 19)泳道6泳道=Met-Lys-Lys-Lys-Lys-Lys-Ala-Lys(pi 11. 21)(SEQ. ID. NO 20); 7 =Met-Lys-Lys-Lys-Lys-Lys-Lys-Ala-Lys(pi 11. 28)(SEQ. ID. NO 21)和,泳道 8 :Met-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Ala-Lys(pill. 41) (SEQ. ID. NO22);lb M 标记;泳道1 =Met-Ala-Lys (pi 9. 90) (SEQ. ID. NO 15);泳道2 =Met-Arg-Ala-Lys (pi 11. 52) (SEQ. ID. NO 23);泳道3 =Met-Arg-Arg-Ala-Lys (pi 12. 51) (SEQ. ID. NO 24);泳道 4 =Met-Arg-Arg-Arg-Arg-Ala-Lys (pi 12. 98) (SEQ. ID. NO 25);泳道 5 =Met-Arg-Arg-Arg-Arg-Arg-Arg-Ala-Lys(pi 13. 20)(SEQ. ID. NO 26) 和,泳 道 6 :Met-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Ala-Lys(pI13. 35)(SEQ.ID. NO27)。图2是图示通过在重组载体pET22b(+) (ompASPi-7Xmefpl)的前导序列中修饰 的克隆进行的黏着蛋白Mefpl (可溶级分约20 μ g)的比较可溶性表达的图表(箭头重组 Mefpl)。获自密度计分析的数值表示三种不同克隆中蛋白表达的比较平均值(A) SDS-PAGE ;⑶蛋白质印迹;和,(C)密度计分析M 标记;泳道 1 :Met-Asp-Asp-Asp-Asp-Asp-Ala-Ala(pI 2. 73) (SEQ. ID. NO 35);泳道2 =Met-Asp-Asp-Asp-Ala-Ala(pi 2. 87) (SEQ. ID. NO 36);泳道3 =Met-Glu-Glu (pi 3. 09) (SEQ. ID. NO 37);泳道4 =Met-Ala-Glu (pi 3. 25) (SEQ. ID. NO 3 8);泳道5 =Met-Ala-Ala(pi 5. 60) (SEQ. ID. NO 39)泳道6 =Met-Cys-His (pi 7. 13) (SEQ. ID. NO 40)泳道7 =Met-Ala-His (pi 7. 65) (SEQ. ID. NO 41)泳道8 =Met-Ala-Lys (pi 9. 90) (SEQ. ID. NO 15);和,[0058]泳道 9 =Met-Arg-Arg-Arg-Arg-Ala-Lys (pi 12. 98) (SEQ. ID. NO 25)。图3是图示由在前导序列区Met-Glu-Glu (pi 3. 09)和因子Xa识别位点(Xa)之 间具有不同距离的克隆获得的重组Mefpl融合蛋白(可溶级分约20yg)的可溶性表达的 图(箭头重组Mefpl)(A)SDS-PAGEjP(B)蛋白质印迹;M 标记;泳道1 =Met-Glu-Glu (pi 3. 09) (SEQ. ID. NO 37);泳道2 =Met-Glu-Glu-Xa (pi 4. 01) (SEQ. ID. NO 46);泳道3 =Met-Glu-Glu-Pro-Ser-Xa (pi 4. 01) (SEQ. ID. NO 47);泳道4 =Met-Glu-Glu-Pro-Ser-Tyr-Pro-Xa(pi 4. 01) (SEQ. ID. NO 48);和,泳道5 =Met-Glu-Glu-Pro-Ser-Tyr-Pro-Pro-Thr-Xa (pi 4. 01) (SEQ. ID. NO 49)。图 4 是图示由通过修饰 pET_22b(+) [ompASP^- Xmefpl] ( :Ra_6XHis)克隆 从而在Lys-Lys之间具有不同长度而设计的前导序列克隆获得的重组Mefpl融合蛋白(可 溶级分约20 μ g)的可溶性表达的图(箭头重组Mefpl)(A)SDS-PAGEjP(B)蛋白质印迹;4a:M 标记;泳道 1 :Met-Lys-Lys-Thr-Ala-IIe-Ala-IIe-Ala-Val-Ala-Ala-Lys(pi10. 82) (SEQ. ID. NO 56);泳道 2 =Met-Lys-Lys-Thr-Ala-IIe-Ala-IIe-Ala-Val-Ala-Ala-Ala (pi 10. 55,Cl1 =0) (SEQ. ID. NO 57);泳道 3 =Met-Lys-Ala-Thr-Lys-IIe-Ala-IIe-Ala-Val-Ala-Ala-Ala (pi 10. 55,Cl1 =2) (SEQ. ID. NO 58);泳道 4 =Met-Lys-Ala-Thr-Ala-IIe-Lys-IIe-Ala-Val-Ala-Ala-Ala (pi 10. 55,Cl1 =4) (SEQ. ID. NO 59);泳道 5 =Met-Lys-Ala-Thr-Ala-IIe-Ala-IIe-Lys-Val-Ala-Ala-Ala (pi 10. 55,Cl1 =6) (SEQ. ID. NO 60);和,泳道 5 =Met-Lys-Ala-Thr-Ala-IIe-Ala-IIe-Ala-Val-Lys-Ala-Ala (pi 10. 55,Cl1 =8) (SEQ. ID. NO 61);4b M 标记;泳道1 =Met-Lys-Lys-Ala-Lys (pi 10. 82) (SEQ. ID. NO 17);泳道2 =Met-Lys-Ala-Thr-Ala-Ile-Lys-Ala-Lys (pi 10. 82,Cl1 = 4,d2 = 1) (SEQ. ID. NO 106);泳道 3 =Met-Lys-AIa-Thr-AIa-Ile-Lys-AIa-AIa-Lys(pl 10. 82,Cl1 = 4,d2 = 2) (SEQ. ID. NO 107);泳道 4 =Met-Lys-AIa-Thr-AIa-Ile-Lys-AIa-AIa-AIa-Lys(pl 10. 82,Cl1 = 4,d2=3) (SEQ. ID. NO 108);和,泳道 5 =Met-Lys-AIa-Thr-AIa-Ile-Lys-AIa-AIa-AIa-AIa-Lys(pl 10. 82,Cl1 = 4,d2 = 4) (SEQ. ID. NO 109)。图5是图示氨基酸序列pi值和为了提供信号传导功能和分泌增强功能而作为前 导序列插入的Met-7X同源氨基酸的疏水性值对ofifepcidin I可溶性表达(可溶级分约 20 μ g)的影响的图(箭头ofH印cidin I的重组体)(A)SDS-PAGEjP(B)蛋白质印迹;M 标记;泳道1 :MRRRRRRR(pI 13. 28,hy+1. 97) (SEQ. ID. NO 70);泳道2 :MKKKKKKK (pi 11. 28,hy+1. 97) (SEQ. ID. NO 71);泳道3 :MHHHHHHH(pI 8. 08,hy-0. 35) (SEQ. ID. NO 72);泳道4 -MYYYYYYY (pi 5. 59,hy-1. 55) (SEQ. ID. NO 73);泳道5 :MCCCCCCC (pi 4. 57,hy-0. 69) (SEQ. ID. NO 74);泳道6 :MEEEEEEE (pi 2. 78,hy+1. 97) (SEQ. ID. NO 75);和,泳道7 :MDDDDDDD (pi 2. 52,hy+1. 97) (SEQ. ID. NO 76)。图6是图示在由具有受控的pi值的OmpASP片段(Met_2aas) -OmpASP4^10-分泌增 强子候选序列-Xa构成的前导序列中N端pi值对分泌增强序列和可溶性表达(可溶级分 约20 μ g)的影响的图(箭头=Offepcidin I的重组体)(A)SDS-PAGEjP(B)蛋白质印迹;M:标记;泳道1:ΜΑΗ(ρΙ 7. 65)-OmpASP4^10(pi 5. 70)-6XArg(ρI 13. 20 ;hy+1. 75)-Xa(pi 7. 05) (SEQ. ID. NO 86);泳道2 :MAH-0mpASP4_10-6 X Tyr (pi 5. 55 ;hy-1. 33) -Xa (SEQ. ID. NO 87);泳道3 :MAH-0mpASP4_10-6 XGlu (pi 2. 82 ;hy+1. 75) -Xa (SEQ. ID. NO 88);泳道4 :MAA (pi 5. 60) -0mpASP4_10_6 X Arg-Xa (SEQ. ID. NO 89);泳道5 :MAA-0mpASP4_10-6 X Tyr-Xa (SEQ. ID. NO 90);泳道6 :MAA-0mpASP4_10-6 X Glu-Xa (SEQ. ID. NO 91);泳道7 :MEE (pi 3. 09) -0mpASP4_10-6 X Arg-Xa (SEQ. ID. NO 92);泳道8 :MEE-0mpASP4_10-6 X Tyr-Xa (SEQ. ID. NO 93);和,泳道9 :MEE-0mpASP4_10-6 X Glu-Xa (SEQ. ID. NO 94)。最佳模式本发明中使用的术语记述在下文中。“异源蛋白”或“靶异源蛋白”是本领域中技术人员为了进行大规模生产所靶定的 蛋白,其包括可能利用包含编码该蛋白的多核苷酸的重组表达载体在转化体中表达的各种 蛋白。“融合蛋白”指向原始异源蛋白的N端或C端添加另一种氨基酸序列或融合另一种 蛋白而生产的蛋白。[0114]“信号序列”是帮助在病毒、原核细胞或真核生物中表达的异源蛋白有效通过胞内 膜进行胞外或周质外分泌的有效序列。信号序列由带正电的N区、中间特征性疏水区域和 具有裂解位点的C区构成。本发明中使用的信号序列指包含带正电区域、中间特征性疏水 区域和具有裂解位点的C端的序列的全长或一部分。“前导序列”指异源蛋白的N端的氨基酸序列。“多肽片段”指具有特定多肽功能和最小长度或较大尺寸的多肽序列。除非另外指 出,全长多肽不包括在本发明的“多肽片段”中。例如,“包含信号序列N区的多肽片段”指 起信号序列功能的缩短的信号序列,且不包括完整的信号序列。“多核苷酸”指这样的聚合物分子,其中两个以上核酸分子通过磷酸二酯键相连 接,其包括DNA和RNA。“分泌增强子”指由亲水性氨基酸构成的亲水性多肽,其在信号序列或前导序列之 后,起增加亲水性的作用。“信号序列N区”是一般信号序列中保留的一部分,其是强碱性序列,位于N端并根 据信号序列,包含1-10个氨基酸。“中间特异性疏水区域”指在一般信号序列中在N区后的区域,其显示强疏水性,这 归因于许多个疏水性氨基酸。“信号序列片段”指信号序列的一部分,且除非另外指出,其是具有C端缺失的信号 序列片段。“信号序列片段变体”指通过改变信号序列中除第一个氨基酸Met以外的任何序列 区域而制备的片段。“蛋白酶识别位点”指由蛋白酶裂解的特定氨基酸序列区域。“两亲性结构域”是具有亲水性和疏水性两种区域的结构域,其是具有与跨膜结构 域相似的结构的蛋白内部区域。在本发明中,其在含义上等同于“跨膜样结构域”。“跨膜样(TM样)结构域”指在多肽氨基酸序列分析中预期具有与跨膜蛋白的跨 膜结构域相似的结构的区域(Brasseur等,Biochim Biophys Acta(生物化学生物物理学 学报)1029 (2) :267-273,1990)。通常,通过各种预测跨膜结构域的计算机软件容易地预测 所述跨膜样结构域。并且所述软件例如TMpred,HMMTOP, TBBpred, DAS-TMf iIter (//www. enzim. hu/DAS/DAS. html),等。本文中的“跨膜样结构域”包括被验证具有真正跨膜特征的 “跨膜结构域”。“表达载体”是由与用于载体转录的另外的片段操作性地连接的编码靶多肽的片 段构成的线性或环形DNA分子。所述另外的片段包括启动子和终止密码子序列。所述表达 载体包含一个或多个起点,一个或多个选择标记,增强子,多腺苷酸化信号和其他。所述表 达载体一般源自质粒或病毒DNA或包含来自这二者的元件。“操作性地连接”意指排列片段以使其起到它们应该起到的功能,例如,一旦在启 动子处开始转录,它经过编码片段到达终止密码子。在下文中,详细描述本发明。本发明人通过将OmpASP1 (Met)和OmpASPn (Met-Lys)的编码序列融合于编码黏着 蛋白 Mefpl 的 7 Xmefpl 的 5,末端,构建了 pET_22b (+) (OmpASP1-
Xmefpl)和 pET_22b (+) (ompASPn-7Xmefpl)克隆(见表 1),所述 OmpASP1 (Met)禾口 OmpASPn (Met-Lys)是作为在大肠杆菌中诱导蛋白分泌的信号序列的OmpA信号肽(OmpASP)的一部分。用构建的克隆 载体转化大肠杆菌BL21(DE3),随后进行表达。结果,仅一个氨基酸(赖氨酸;Lys ;K ;pi = 9. 72)的改变使得蛋白 Met-7XMefpl(SEQ. ID. NO 15)和Met-Lys_7XMefpl(SEQ. ID. NO
16)由以上两种克隆的可溶性表达显著不同(见图la,泳道1和泳道2)。因此,验证了位于N 端的影响Pl值的Lys在可溶性表达中起重要作用。然后,确定范围为从OmpASPte WMet末端 到N端的倒数第二个氨基酸Lys (Ala-L^)的序列作为用于计算前导序列Pl值的标准。从 OmpASP片段(Met[M]或Met-Lys)到Mefpl蛋白的前两个氨基酸(Ala-Lys)的pi值通过利 用计算机程序DNASIS (日立(Hitachi),日本)来分析。结果,Met-Ala-Lys的pi值为9. 90 且Met-Lys-Ala-Lys的pi值为10. 55 (见表1)。为了验证以上结果,通过融合与OmpASP^ 相比具有另外一个Lys的信号序列片段OmpASPh3 (Met-Lys-Lys) (SEQ. ID. NO 17)的编码序 列构建pET-22b(+) (ompASPn-7 Xmefpl)克隆,随后通过与上述相同的方式研究可溶性表 达。结果,从OmpASP1^到前导序列前两个氨基酸(Ala-Lys),即Met-Lys-Lys-Ala-Lys的pi 值是10. 82,这支持与可溶性表达增加的良好关联性(见图la,泳道3)。为了验证pi值的控制是否能够影响可溶性蛋白表达,通过将Lys插入到 OmpASPh3片段和Mefpl的第一个氨基酸Ala之间从而增加pi值来构建pET_22b (+) (OmpASP1^-Lysn-TXmefpl)克隆。且还通过将 Arg 插入到 Met (OmpASP1)和 Mefpl 的第一 个氨基酸Ala之间从而增加pi值来构建pET-22b(+) (OmpASP1-Argn-TXmefpl)克隆。分析 了上述蛋白从N端到Mefpl的前两个氨基酸(Ala-Lys)的pi值(见表1)。用构建的克隆 载体转化大肠杆菌BL21 (DE3),随后表达。该表达与蛋白Met-7XMefpl(SEQ. ID. NO 15), Met-Lys-7 XMefpl (SEQ. ID. NO 16)和 Met-Lys-Lys-7 XMefpl (SEQ. ID. NO 17)的表达进 行比较。结果,其中pi值通过额外的Lys增加至10. 99-11. 21 (SEQ. ID. NO :18_N0 20)的蛋 白的可溶性表达与Pl值为10. 55 (SEQ. ID. NO 16)的对照相似(见图1,泳道4-泳道6),但 是从Pl值11. 28 (见图1,泳道7)开始减少的表达。特别地,当pi值为11. 41 (SEQ. ID. NO
22)时,表达显著减少(见图1,泳道8)。以上结果表明,当前导序列的pi值是10. 55以上 时,Pl值特别涉及膜通透性。当前导序列的Pl值通过Lys增加至10. 82-11. 41时,即前导 序列具有额外的Lys,即为OmpASPh3-Lysn-Ala-Lys时,预测该序列具有与具有pi值10. 55 的OmpASP等价的跨膜通道。通过添加ArgpI值增加为11. 52-13. 35 (SEQ. ID. NO :23_N0 27)的蛋白的可溶性 表达随Pl值增加而减少,例外是当与两个Arg相连接的前导序列的pi值是12. 51时,该 表达略微增加。且当Pl值为13. 35时,该表达显著减少(见表1和图lb)。在Arg的情形 中,推测两个Arg相连接(见图lb,泳道3)的区域的减小的分子量是由通过蛋白酶裂解前 导序列的一部分引起的。因此,假定在其序列OmpASP1-Argn-Ala-Lys中包含额外的Arg的 前导序列普遍具有Arg特异性膜通透性。然而,本文中没有解释Arg特异性膜通透性机制 和TAT (双-精氨酸-易位)系统的信号序列(Berks,Mol. Microbiol.(分子微生物学)22
393-404,1966)之间的相互关系。为了研究具有低可控的pi值的前导序列的N端对靶蛋白可溶性表达的影响, 将pET-22b(+) (OmpASP1- Xmefpl)用作对照,并区别性修饰前导序列Met-Ala-Lys的 Ala-Lys,以将pi值调节至2. 73-7. 65 (SEQ. ID. NO :35_N0 :41),由此形成前导序列变体 (MDDDDDAA ;ρΙ2· 73,MDDDAA ;ρΙ2· 87,MEE ;ρΙ3· 09,MAE ;ρΙ3· 25,MAA ;ρΙ5· 60,MCH ;ρΙ7· 13,MAH ;pI7. 65)的构建(见表2),随后研究它们的表达。结果,当pi值为2. 87-7. 65时,黏着 蛋白Mefpl的可溶性表达类似或高于pi值为9. 90的对照的可溶性表达。特别地,该表达在 Pl值为3. 09 (SEQ. ID. NO 37)时最高(见图2,泳道3)。表达模式如下存在两种类型的表 达(在Pl值2. 73-3. 25时的Asp/Glu特异性表达和在pi值3. 25-9. 90时的表达的适度增 加)。因此,验证了在由具有下调的(down-controlled)pi的前导序列中的N端pi值诱导 的黏着蛋白Mefpl可溶性表达中存在2种不同的型谱。即,N端的pi值控制影响可溶性蛋 白表达。前导序列 N 端变体,MAA (ρ15. 60) (SEQ. ID. NO 39),MCH(ρ17. 13) (SEQ. ID. NO 40) 和MAH(pI7. 65) (SEQ. ID. NO :41),是与电荷具有弱相互关系的序列。由于变体的短序列,不 太可能存在记述在韩国专利公开号10-中的分泌增强子。因此,表达通过前 导序列N端变体的pi值来调节。如前文所述,由pET-22b (+) (OmpASP1^-Lysn-TXmefpl) 或pET-22b(+) (OmpASP1-Argn-TXmefpl)表达的、在前导序列中具有高+电荷的黏着蛋白 Mefpl的表达,和在前导序列MDDDDDAA(SEQ. ID. NO 35)中具有强-电荷的黏着蛋白Mefpl 的表达与电荷无关。基于以上结果,研究了 pi依赖性可溶性表达模式。在黏着蛋白Mefpl在高pi下 的可溶性表达的情形中,①在Pl值约10. 82(9. 90-11.41)时涉及Lys特异性膜通透机制, 且②在Pl值约12.51,其中具有Arg(11.52-13.35)时,涉及Arg特异性膜通透机制。在宽 的Pl低范围(2. 73-9. 90)内,③在低pi值(2. 73-3. 25)时涉及Asp/Glu特异性膜通透机 制和④在Pl值3. 25-9. 90时涉及相当的非特异性膜通透机制。因此,假设具有高pi值的 前导序列具有Lys特异性OmpASP Sec系统(pi 9. 90-11.41)和Arg特异性膜通透机制(pi 11.52-13. 35),具有宽的pi低范围(pi 2.73-9.90)的前导序列具有Asp/Glu特异性膜通 透机制(pi 2. 73-3. 25,最适pi 3. 09)并具有相当的非特异性膜通透性,即在无3. 25-9. 90 范围内的中点Pl值条件下的一种被动膜通透机制。以上四种膜通透机制与表达和电荷增 加无关。因此,Pl值与蛋白膜通透性之间相互关系的分析结果可以有效用于基于膜通透机 制对可溶性重组蛋白表达的进一步研究。在11.41和13. 35的高pi值下表现出低表达率的前导序列(SEQ. ID. NO :22和 SEQ. ID. NO 27)具有相当高的亲水性值1. 93,且在低pi值2. 73下表现出低表达率的前导 序列(SEQ. ID. N0:35)也具有相当高的亲水性值1. 09。前导序列中显著增加的亲水性可能 通过诱导具有脂双层膜的亲水性跨膜样结构域的结合而导致膜通透性的减小,这与以前的 专利申请(韩国专利公开号10-)中提出的假说相一致,该假说认为亲水性 跨膜样结构域抑制牙鲆H印cidin I的可溶性表达。然而,当添加Lys时,前导序列(SEQ. ID. NO 18-21)的亲水性可以在一定程度上被抵消,尽管该前导序列仍具有高亲水性。因 此,非常有趣的是,添加Lys导致膜通透性的增加。由关于由MEE(pI 3. 09) (SEQ. ID. NO :37)增加的表达的研究,判断黏着异源蛋白 Mefpl的前导序列的最适pi之一是3. 09。为了最优化前导序列变体和与其相连接的异源 蛋白之间的距离和为了生产具有天然氨基端的蛋白,将因子Xa识别位点(Xa)插入序列中, 由此形成MEE (i = n)-Xa,并将不影响pi值的0mpASP4_9的氨基酸作为插入物插入到0中 (i) =n(0,2,4,6)。结果,构建了 pET-22b(+) (MEE-(i = n)-Xa-7Xmefpl)(见表 3)。当 没有氨基酸插入到MEE和Xa之间时,和当有2个氨基酸插入其中时,可溶性蛋白的表达最 高(见图3)。即,前导序列和因子Xa识别位点之间的距离在i = 0-2时最适合。本文中的可溶性蛋白包含因子Xa识别位点,因此通过按照本领域中技术人员已知的常规方法用因 子Xa蛋白酶处理,其可以作为具有天然N端形式的重组蛋白而产生。在验证信号序列的N端的pi值可以影响黏着蛋白Mefpl的可溶性表达后,本发 明人试图验证影响Pl的氨基酸(例如Lys)的距离是否可能是影响蛋白可溶性表达的因 素。在蛋白的N端中,前导序列MKAK和MKK具有相同的pi值,但当2个Lys-Lys由于在 Lys-Lys之间插入非pi特异性氨基酸诸如Ala (丙氨酸;A)而远离时,可能存在功能差异。 因此,基于信号序列OmpASP片段的氨基酸序列,构建MK1- (d = n) -K2- (8-η),并将不影响pi 值的 OmpASPH1 的氨基酸以 Cl1 = n(0,2,4,6,8)插入(),由此形成 pET_22b (+) [MK1-((I1 = η )-K2-(8-n)-AA-mefpl3-10-6Xmefpl]克隆的构建(见表 4)。结果,当(I1 = 4 时,说明 2 个 Ks之间的距离W1 = K1-K2的距离)是4,可溶性蛋白的表达最显著(见表4和图4a)。即, 当Cl1 = 4时,氨基酸的距离是最优化的。另外,当Cl1 = 4时,该克隆的Ala(下划线部分) 被Lys(K3)取代并且将Ala(d2 = n(l,2,3,4)插入到K2和K3之间,由此导致pET_22b (+) [MK1-((I1 = 4) -K2-(d2 = η)-AK3-Hiefp 13_1(Γ6 Xmefpl]的构建(见表 4)。结果,2 个 Ks 之 间的最适距离(d2 = K2-K3的距离)是d2 = 2 & 1 & 4 & 3。这些结果表明距离与黏着蛋 白Mefpl的可溶性表达直接相关。以上结果还提示表达中的重要因子不是序列而是pi值 和前导序列中Lys-Lys之间的距离(见表4和图4b)。如图Ia泳道1中所示,黏着蛋白Mefpl是这样的蛋白,其能够通过使信号序列的 仅Met与蛋白的N端附着而被可溶性表达。黏着蛋白Mefpl的可溶性表达可以通过调节信 号序列和前导序列的Pl值和Pl特异性氨基酸之间的距离来增加。牙鲆!fepcidin I蛋白 包含两亲性结构域或跨膜样结构域。根据韩国专利公开号10-,该蛋白仅在 添加具有信号序列功能和亲水性足够高以至于抵消内部TM样结构域的分泌增强子时,可 以被可溶性表达。为了牙鲆!fepcidin I蛋白的可溶性表达,本发明人将N端的前导序列设 计为M-7X同源氨基酸,从而起信号序列的作用且同时起分泌增强子的作用,并然后构建 pET-22b (+) (ompASP「7X 同源氨基酸-ofhep I),以表达具有 2. 52-13. 28 的受控 pi 值 和-1. 55-+1. 97的疏水性的蛋白(见表5)。本文中的同源氨基酸选自由精氨酸(Arg ;R), 赖氨酸(Lys, K),组氨酸(His ;H),酪氨酸(Tyr ;Y),半胱氨酸(Cys ;C),谷氨酸(Glu ;E)和 天冬氨酸(Asp ;D)组成的组,其应该具有7个重复。疏水性由DNASIS (日立(Hitachi), 日本),以Hopp & Woods等级(窗尺寸(window size) :6,阈值0. 00)来测量。如果疏水 性值是+,则意味着肽是亲水性的,而如果疏水性值是_,则肽是疏水性的。这时,随着绝对 值增加,亲水性或疏水性增加。研究了那些蛋白的表达。结果,仅在具有MRRRRRRR序列(pi 13. 28,亲水性值 +1. 97) (SEQ. ID. NO 70)和 MKKKKKKK 序列(pi 11. 28,亲水性值 +1. 97) (SEQ. ID. NO 71)的那些克隆中观察到H印cidin I的可溶性表达(见图5)。这些前导序 列保持作为信号序列(MRRRRRRR和MKKKKKKK)的高pi值和作为分泌增强子(RRRRRRR和 KKKKKKK)的高pi值和高亲水性。该结果与韩国专利公开号10-的说明书相一 致,该说明书认为牙鲆ifepcidin I的可溶性表达需要信号序列的高pi值和比该序列中包 括的两亲性结构域或跨膜样结构域更高的亲水性值。然而,尽管与那些前导序列(MRRRRRRR 和MKKKKKKK)相似的序列,MKK (K) η (η = 6) AK和M (R) η (η = 8) AK序列与作为对照的MAK 相比,几乎不能增加黏着蛋白Mefpl的可溶性表达。韩国专利公开号10-还 描述黏着蛋白Mefpl的可溶性分泌可以通过用与6XArg或6XLys相对应的核苷酸取代pET-22b (+) (OmpASP1^8-SmaI-Xa-TXmefpl)的Sma I而略微增加,但是该增加不如在牙 鲆Hepcidin I的分泌增强子序列中所示的显著(数据未显示)。因此,非常难以判断牙鲆 Hepcidin I的这些前导序列(MRRRRRRt^PMKKKKKKK)是起信号序列或分泌增强子或二者的 作用(在单独的Met起前导序列作用的情形中,pi :5.70)。为了研究修饰的信号序列的低pi值对牙鲆H印cidin I的可溶性表达的影 响,本发明人制备了这样的蛋白,在该蛋白中信号序列变体(MAH;pI7.65,MAA ;pI5. 60 或MEE ;ρ13. 09),OmpASP4_10-6 X同源氨基酸和Xa识别位点(Xa)与蛋白的N端中的 QfHepI相连接,并然后利用具有受控pi和疏水性/亲水性值的前导序列构建了用于表 达该蛋白的克隆(见表6)。由研究所述克隆的可溶性表达的结果,证实该可溶性蛋白在 pET-22b(+) [ΜΑΗ(ρI 7· 65)-OmpASP4_10_6 X Arg-Xa-ofHep I]和 pET_22b (+) [MAA (pi 5. 60) -OmpASP4_10-6 X Arg-Xa-ofHep I]中充分表达,而该蛋白表达在 pET_22b (+) [MEE(pi 3. 09)-OmpASP4_10-6XArg-Xa-ofHep I]中很弱。然而,可溶性表达在 pET-22b (+) [MEE (ρ13. 09) -OmpASP4_10-6 XGlu-Xa-ofHep I]是中等的(见图 6)。以上结果 表明,牙鲆H印cidin I的可溶性表达可能不仅在将蛋白的N端设计为具有高pi值(10. 55) 的信号序列片段(OmpASP1,)和高pi值和高亲水性的6XArg和6XLys作为分泌增强子的 情形中(韩国专利公开号10-),而且在将蛋白的N端设计为具有低pi值的信 号序列片段和低Pl值但高亲水性的6XGlu作为分泌增强子的情形中被诱导。通过观察牙鲆H印cidin I的可溶性表达,公开了信号序列片段的pi值与分泌增 强子序列的Pl值和亲水性紧密相关。即,当信号序列的Pl值是5. 60,7. 65和10. 55时, 需要包含具有高Pl值和高亲水性的氨基酸的分泌增强子,而当信号序列片段的Pl值低如 3. 09时,不仅可以使用包含具有高pi值和高亲水性的氨基酸的分泌增强子,而且可以使用 包含具有低Pl值但高亲水性的氨基酸的另一种分泌增强子。因此,非常可能的是,信号序 列片段的Pl值决定分泌增强子的特性,诸如控制Pl值和亲水性,并且因此信号序列片段的 Pl值与分泌增强子紧密相关。以上结果仅限于这样的情形,所述情形是当分泌增强子候选序列与N端中的Met 直接相连接时,可溶性表达由Arg和Lys,即具有高pi值和高亲水性的氨基酸诱导。当控制 包含疏水区域的信号序列片段的N端的pi值时,不仅包含具有高pi值和高亲水性的氨基 酸的序列而且包含具有低Pl值但高亲水性的氨基酸如Glu的序列,可以用作分泌增强子序 列,这提示分泌增强子序列具有广泛范围的可用性。因此,亲水性分泌增强子序列的范围可 以通过将疏水性片段与具有受控Pl值的前导序列的N端相连接来降低N端的亲水性而得 到扩展。该结果还提示信号序列片段的pi值和修饰的信号序列片段的pi值在牙鲆 Hepcidin I中具有它们各自的型谱。信号序列片段的pi值的范围影响分泌增强子的功能。 因此,当控制信号序列中Pl值为低至3.09时,!1印(^肚11 I的可溶性表达被具有高pi值和 高亲水性的起分泌增强子作用的6XArg和具有低pi值但高亲水性的起另一种分泌增强子 作用的6 X Glu诱导。在其他pi值诸如5. 60,7. 65,和10. 55时,该蛋白的可溶性表达仅被 具有高Pl值和高亲水性的起分泌增强子作用的6XArg诱导。然而,当前导序列的pi值为 3. 09,5. 60,和7. 65时,如图2中所示,推定该pi值参与膜通透过程,这与由黏着蛋白Mefpl 的前导序列的宽Pl谱诱导的膜通透机制类似。然而,当前导序列的Pl值为10. 55时,如图1中所示,所述可溶性表达受OmpASP片段特异性pi值控制。总之,信号序列片段pi值和前导序列片段的Pl值在黏着蛋白Mefpl的可溶性表 达中起关键作用,但与电荷无关。本发明人首先证实了黏着蛋白Mefpl的可溶性表达和 前导序列的Pl值之间的相互关系。具体地,本发明人发现了 Lys特异性膜通透机制(pi 9. 90-11. 41),Arg特异性膜通透机制(pi 11. 52-13. 35),Asp/Glu特异性膜通透机制(pi 2.73-3.25)和非特异性膜通透机制(pi 3.25-9.90)。然而,当将分泌增强子序列多聚Lys 和多聚Arg(韩国专利公开号10-)与黏着蛋白Mefpl的前导序列相连接时, 蛋白的表达没有增加很多,这提示前导序列和分泌增强子之间的结合不影响不包含跨膜样 结构域的所述蛋白的表达。本发明人还首先证实了对表达最适的条件是当前导序列与因子 Xa识别位点相连接时和当适当控制信号序列中Lys-Lys之间的距离时。在具有跨膜样结构域的牙鲆H印cidin I中,可溶性表达在仅有信号序列片段的 Pl值和前导序列的Pl值的条件下非常弱或或不可能。然而,当分泌增强子候选序列与Met 直接相连接时,可溶性表达受具有高Pl值和高亲水性的Arg和Lys诱导,且当具有高pi值 和亲水性的分泌增强子序列与具有受控Pl的信号序列片段相连接从而具有宽Pl谱时,可 溶性表达被诱导。当具有低Pl值的前导序列与包含具有高Pl值和亲水性的氨基酸的分泌 增强子和包含具有低Pl值但高亲水性的氨基酸的分泌增强子相连接时,也检测到表达。该 结果支持以前的结果,即黏着蛋白Mefpl的表达可以在信号序列片段和前导序列的宽pi谱 中被诱导。但是,分泌增强子序列通常需要具有高亲水性的氨基酸,与Pl值无关。因此,为 了诱导可溶性表达,亲水性必须高于牙鲆ifepcidin I中的跨膜样结构域的亲水性。与当分泌增强子候选序列与Met直接相连接时相比,当改变包含疏水区域的信号 序列片段的N端pi值时,可用的分泌增强子序列的谱变宽。该结果提示与信号序列相连 接的疏水区域降低前导序列(在信号序列的N端中具有受控pi值的序列)的N端的亲水 性,这使得前导序列自由地起锚定物的作用,从而使亲水性分泌增强子序列的膜通透范围 增大。而且,推定前导序列的N端pi值和分泌增强子序列之间存在特定的相互作用。在下文中,详细描述本发明的优选实施方案。
更多相关信息:
关于企业公告的相关资讯
阅读排行榜
保留所有权利
陕ICP备号-1 经营许可证编号:陕ICP备号}

我要回帖

更多关于 蛋白质氨基酸序列分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信