nfkb的经典途径和非经典途径的c3转化酶区别

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
Calpain及抑制剂对小鼠RAW264.7细胞RANKL-RANK通路诱导破骨细胞形成机制及研究.pdf 68页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:200 &&
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
你可能关注的文档:
··········
··········
临床医学专业学生毕业论文(八年制)原创性、真实性
及知识产权声明
本课题属于北京市自然科学基金项目:骨癌痛治疗新靶点Calpaill的机制研究, 编号:7092083。 m~NK.凡悄KL通路诱导的破骨细胞形成的机制研究》,是本人在导师指导下,在 北京协和医学院临床学院一北京协和医院麻醉科进行临床医学专业八年制科研训练 期间进行研究工作所取得的成果。据本人所知,论文中除已注明及致谢的部分外不 包含他人已发表或撰写过的研究成果;对本文的研究工作做出重要贡献的个人和集 体,均已在文中作了明确说明或致谢。本人对论文中所有实验数据和结果的真实性 负责。
本论文的研究成果(包括申请的专利)归北京协和医学院所有,本论文的研究 内容不得以其它单位的名义发表。本人完全了解北京协和医学院关于保存、使用学 位论文的规定,同意学校保留并向有关部门送交论文的复印件和电子版本,允许论 文被查阅和借阅。本人授权北京协和医学院,可以采用影印、缩印或其它复制手段 保存论文。论文的全部或部分内容将根据论文所承担国家或地方级课题的要求,与 导师商定后,予以公布。论文相关的所有实验材料归课题组所有,未经课题组长和 导师同意,不得提供给他人。
目录……………………………………………………………………………………………………………….3 英文缩略词表………………………………………………………………………….4
中文摘要………………………………………………………………………………5 Abstract…………………………………………………………………………………………………………6 前言……………………………………………………………………………………………………………….7甘lIii;....….……….…….……..….….….……….….….….……….……………...….………………….……7 研究路线设计…………………………………………………………………………..9 材料和方法………………………………………………………………………….1O
第一部分实验材料……………………………………………………………lO
第二部分实验方法………………………………………………………………14 实验结果……………………………………………………………………………..26
第一部分破骨细胞诱导分化模型建立………………………………………26
第二部分Calpain活性与黜谢l江诱导的破骨细胞活化关系………………32 讨论……………………………………………………………………………………………………………。42 结论……………………………………………………………………………………………………………一51 参考文献………………………………………………………………………………52 综述……………………………………………………………………………………………………………..55 致谢……………………………………………………………………………………………………………。69 个人简历………………………………………………………………………………70 英文缩略词表
CaIpain及抑制剂对小鼠RAW264.7细胞
RANKL.RANK通路诱导的破骨细胞形成机制的研究
(中文摘要)
Calpain是一种与破骨细胞活化相关的蛋白水解酶,可能是抑制破骨细胞活 导的破骨细胞分化的作用机制,以及抑制Calpaill对RANKL诱导的破骨细胞活 化的作用。 方法
在小鼠洲264.7细胞中,分为以下6组:RAM(I,O
n∥llll,20n∥IIll,50n∥nll, 70
n咖l,loo 进行T&廿染色和阳性细胞计数、破骨细胞骨凹陷分析,验证破骨细胞是否分化 Westem 前后两种蛋白表达量的变化。 结果 RANKI,诱导相比,可以使T凡&阳性细胞数和骨凹陷面积显著降低。此外,随 着RANKI,诱导时间的延长,NFKB和c-Fos的蛋白表达水平均呈递增趋势。而 达量显著降低。 结论 胞活化程度呈正相关。抑制calpain可以有效抑制小鼠凡≮、Ⅳ264.7细胞在RANKI, 蛋白表达
正在加载中,请稍后...干湿实验结合预测及鉴定转录因子DNA结合靶点和靶基因
东南大学 硕士学位论文干湿实验结合预测及鉴定-转录因子DNA结合靶点和靶基因”■■■■,本论文受国家自然科学基金项目(No.60871014)资助。 j/JllIJIllllF/lllf l Jl l l fl l rlJUl J l l lrUlY1 76 1 939PREDICTION AND IDENTIFICATION OFDNA.B INDING SITE S AND TARGET GENE S OF TRANS CRIPTION王0~CTORS BY A PIPELINE OF DRY ANDCOMBINATION OFWET EXPERIEMNTStoA Thesis SubmiRedSoutheast University For the Academic Degree of BiophysicsMaster ofBY ZHANG Chen.guang一 一Supervised byⅥ硷NG Jin.keSchool of Biological Science andMedical EngineeeringSoutheast UniversityJune 2010 东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽 我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研 究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:量筮就EI菇J-型里生至旦c7东南大学学位论文使用授权声明13东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件 和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文 的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括以电子 信息形式刊登)论文的全部内容或中、英文摘要等部分内容。论文的公布(包括以电子信息形 式刊登)授权东南大学研究生院办理。研究生签名:耋瞄师签名递生仞 A结合靶点和靶基因研究的核心问题之一。构建基冈表达 调控网络最重要的首先是鉴定基因组编码的所有转录因子蛋白以及它们在基因组中全部的 DNA结合靶点(TFBS)及靶基因。目前已经在人的基因组鉴定出近3000种转录因子,而其中 能够和DNA直接结合的转录因子约700多个。在这些DNA结合转录因子中,几乎没有一个转 录冈子在人基因组中的全部功能性DNA结合靶点(也称为结合谱)及其靶基因得到彻底明确 地描述。因此,成为构建基冈表达调控网络面临的最大障碍。 为了解决这一问题,近年来已经发展了多种高通量预测及鉴定TFBS的新技术,如双链 DNA微阵列芯片(dsDNA microarray)(也称为蛋白结合微阵列,PBM)、染色体免疫沉淀.芯片 (CHIP-chip)、染色体免疫沉淀.测序(CHIP.seq)。另外,还出现了大量生物信息学预测技术。 目前把基于生物学实验的技术统称为湿实验(wet experiment),把基于生物信息学的技术 统称为干实验(dry experiment,in 的研究。 本研究希望建立一种“湿实验一千实验_湿实验”紧密结合的研究思路,快速高效鉴定一 个转录因子蛋白的TFBS及靶基因,进而构建一个转录因子控制的基因表达调控网络。本研究 希望通过具体的实验研究证实这一思路是可行的,是有效的。 本论文首先设计出“湿实验.+干实验_湿实验”的基本思想,即首先以湿实验手段获得一 个转录因子与大量人工设计DNA结合序列的结合特异性及亲合性数据,筛选出所有能够与转录 因子结合的DNA序列;然后以干实验手段扫描人全基因组,定位这些序列在基因组中的分布, 将它们推定为转录因子在基因组中的假定结合位点(putative binding sites,PBSs),并依据这些 位点提取附近的基因,将这些基因推定为转录因子在基因组中的假定靶基因(putativetargetsilicoexp嘶merit)。大量新颖的研究表明,要在全基因组范围鉴定转录因子的TFBS及靶基因,必须将干湿实验技术有机结合。为此,本论文展开了这一方面genes,PTGs);最后,以此为蓝图,再以湿实验手段快速验证这些假定结合位点及假定靶基因 是否是转录因子的功能性(functional)结合位点及靶基因。其中第一次湿实验手段是dsDNA微 阵列芯片,第二次湿实验手段主要是染色质免疫沉淀(Chromatin PCR等。 其次以著名的转录因子NF-r,B为研究对象,用单碱基突变dsDNA微阵列芯片研究了NF.r,B 对所有单碱基突变DNA序列的结合,筛选出具有较高亲合性的10个序列(GGGACTTTCC、GGGACTTCCC、 GGGArnrTCC、 GGGGClTTCC、 immuno.precipitation,CHIP)、GGGTClT,rCC、GGGACTTTAC、GGGACTGTCC、GGGAC唧C);在本论文的干实验部分,对人基因组进行了这10个序列的全基因组扫描,定位了这些序列的分布,发现这些序列在基因 组中确有分布,并且大量位于已知基因附近(上游、下游、内部),因此将这些位点预测为NF-r,B 的假定结合位点,将与之联系的基因预测为NF-r,B的假定靶基因;扫描共得到42017个靶点,其GGGAAr】rrCC、GGGAGTTTCC、中22170个靶点10kb内有基因,被预测为PBSs,相应的预澌U9869个PTGs;通过文献检索,发现在PTGs中有135个经实验研究鉴定的NF.r,B靶基因。对PBSs在基因组中的分布进行统计分析, 发现有11%的位点在基因5’端10kb内(其中0.1kb内1%,1-5kbl勾5%,5.10kb内5%),27%的位 点在基因内部(其中第一内含子内10%,其他内含子内24%,外显子内3%),10%的位点在基因的3 7端10kb内,42%的位点在基因10kbSb;这些分布特征与ChIP.chip等实验研究取得的结果相似。对PBSs和PTGs的染色体分布分析发现,两者都有成簇分布的现象。对PTGs进行功能聚 类分析,并与文献报道的确证靶基因的GO聚类分析结果进行比较,发现PTGs的33个聚类条目 中,有8个条目与确证靶基因组的聚类条目重叠。干实验部分的研究为进一步大规模实验鉴定 NF-心的DNA结合靶点和靶基因提供了行动蓝图。在湿实验部分,我们挑选了具有代表性的7个靶基因(TNIPl、IL-6、HFE、MIA、RARG、STATl、LTBPl),对其相应DNA靶点进行了湿实验分析,采用染色质免疫沉淀技术配合PCR技术验证了7个典型基因附近预测的DNA结合靶 点,12个新预测DNA靶点中9个靶点与NF.r,B结合,湿实验部分的研究不仅发现了新的NF.r,B DNA结合靶点,同时也印证了干实验预测的可靠性。 通过这些研究,论证了本论文提出的干湿实验结合预测及鉴定转录因子DNA结合靶点和靶 基因研究思路的可行性,为转录因子DNA结合靶点和靶基因的研究提供了一种新的思路。关键词:转录因子、DNA结合靶点、靶基因、干湿实验结合Ⅱ 东南大学硕士学位论文Prediction and identification of DNA―binding sites and target genes of transcription factors by a pipeline of combination of dry and wet experiemntsAbstractThe characterization of gene regulatory network(GRN)isoneofcoreproblem of functionalgenomics and system biology.The most important work for GRN construction is to identify alltranscription factors and their DNA?binding sites(TFBS)and target genes.At present,about3000transcription factors were found in human genome,among which about 700 are DNA-bindingtranscription factors.However,the complete functional DNA-binding sites and target genes ofnoneof these transcription factors were identified,this hampers the construction of GRN.To address the problem,multiple new techniques for predicting and identifying TFBS genes of transcription factors were developed in revent years,including dsDNAand targetmicroarray(alsocalled protein-binding microarray,PBM),choromotin immunoprecipitation associated with DNA microarray(ChiP-chip),choromotin immunoprecipitation associated with next generation DNA sequencingtechniques(CHIP-seq).In addition,manyonbioinformatical prediction methods were alsodeveloped for this purpose.Atpresent,the experiments basedbio-technologies are calledarewetorexperiment,incomparison,the experiments finished with computercalled dry experimentin silico expedment.Mostnovel researches revealed that it is necessary to combine the wetand dry experiments forglobal predictionand identificationof DNA-binding sites and target gem of transcription factors.Forourthis purpose,this paper did the studies in this field in This study expect to establisha researchlab.route which combines wet experiment closely with dryexperienmt for effective prediction and idenfication of DNA-binding sites and target gens of transcriptionfactors.Thispaper aims toverify thefeasibility of this research pipeline by performingaproof-of-concept study. At first,the author designed the experiment”.The first step isaaresearch pipeline of‘'wet experiment---,dry experiment---,wetwet experiment which is used to study the interaction of a transcriptionscreenfactor with large amounts of variants of a typical DNA-binding sites in order to sequences capable binding transcriptionout those DNAfactor.Theassecond step is bioinformatically mapping theseDNA sequences in human genome.If these DNA sequences exist in genome genes,these sequences will be predicted neighboring genes wound be predictedasand neighboringknown theputative TFBSs of this transcriptionfactor,andputative target genes of this transcription factor.Finally,theas alists of predicted TFBSs and target genes are usedblueprint to instruct further wet experiments forhi曲lyfirsteffective verification of fuctional TFBSs wet experiment is dsDNA PCR.andtarget genes.Among this research pipeline,the second wet experimentismicroarray,thechromatinimmunoprecipitation(CHIP)andThen,the author used transcription factor NF-'出to do proof-of-concept study.The authoranalyzed the relative binding affinity of NF-r,Bfrom10ato all possible single―nucleotide mutated sequencesknownbinding site(GGGACTTTCC)which obtained by dsDNAmicroarray,andscreenoutsequences(GGGACTrTCC,GGGACTTCCC,GGGAn广rTCC,GGGAAn广rCC,GGGAGl、TTCC,GGGGCT丫rCC,GGGTClTrCC,GGGACTTTAC,GGGACTGTCC,GGGAClTrrC)with highestIlI 27%sites were found in intragene(10%in 1st intron;24%in other introns;3%insites wereexons),and10%found in+10kb regionof known genes.The remaining 42%sites were found outside of all 东南大学硕士学位论文目录摘要……………………………………………………………………………….…..j………………………………………………..IAbstract………………………………………………………………………………………………………………………………..III第1章综述………………………………………………………………………………………….11.1背j豪…………………………………………………………………………………………………………………………11.2转录因子DNA结合位点及靶基因研究现状及重要技术………………………………….21.2.1转录因子DNA结合靶点和靶基因研究的湿实验方法……………………………21.2.2转录因子DNA结合靶点和靶基因研究的干实验方法……………………………81.3NF-r,B的研究现状……………………………………………………………………………91.3.1 1.3.2 1.3.3 1.3.4NF.r,B的生物学特性………………………………………………………………。9 NF.r,B复合物的组成……………………………………………………………….9 NF.r,B的激活………………………………………………………………………。9 NF.r,B的靶基因……………………………………………………………………101.4本论文研究背景……………………………………………………………………………15 第2章转录因子NF-r,B DNA结合位点全基因组扫描及靶基因预测………………………….17 2.1实验方法…………………………………………………………………………………….172.1.1 2.1.2 2.1.3 2.1.410个位点的人类全基因组扫描及周围基因提取…………………………………17 DNA靶点与基因位置关系的确定…………………………………………………17 NF.r,B靶基因的文献检索…………………………………………………………17 DNA靶点及靶基因在染色体上分布作图………………………………………。182.1.5功能聚类…………………………………………………………………………….18 2.2实验结果……………………………………………………………………………………..182.2.110个序列的基因组定位信息及其相关的基因信息………………………………182。2.2不同范围推测靶点及推测靶基因数目统计………………………………………20 2.2.3文献确证靶基因的统计……………………………………………………………2l 2.2.4预测DNA靶点及靶基因可视化………………………………………………….23 2.2.5基因的功能分类……………………………………………………………………242.3讨论……………………………………………………………………………………………………………………….30本章小结…………………………………………………………………………………………33 第3章典型靶基因预测DNA靶点的ChIP.PCR实验验证……………………………………..35 3.1实验材料……………………………………………………………………………………。35 3.2实验方法…………………………………………………………………………………….37 3.2.1细胞培养和NF-r。B的诱导………………………………………………………。37 3.2.2染色质免疫沉淀(ChIP)…………………………………………………………….373.2.3 3.2.4 ChIPDNA的PCR检测引物及反应体系…………………………………………39PCR产物电泳检测…………………………………………………………………403.3实验结果…………………………………………………………...……………………….4l 3.3.1超声效果检测………………………………………………………………………4l 3.3.2每个ChIP中使用的染色质的量的计算(3次不同实验)…………...………………4l3.3.3 ChIPDNA的PCR产物检测………………………………………………………413.4讨论……………………………………………………………………………………………………………………….45 本章小结………………………………………………………………………………………….47 全文总结………………………………………………………………………………………………48V ………………………….49………………………….59………………………….67 ………………………….68VI omeproject,HGP)的完成,生命)上,基因表达调控分析是基因功 能研究最重要的组成部分。从人类基因组全序列中探索基因的表达调控规律,进而揭示生命的 奥秘,将成为生命科学的研究热点,同时成为新学科的生长点【1.10】。在基因组序列中对各种 调控元件进行准确的预测是进行表达调控研究的前提和基础。 对转录过程的调控是表达调控的重要形式。而转录过程的激活、抑制和调节则主要通过转录因子(Trancripton factor,TF)与其在序列中对应的结合位点之间的交互作用来实现。作为一种重要的转录调控元件,转录因子结合位点(traaseription factorbindingsite,TFBS)的计算预测可作为传统实验识别方法的辅助手段,从而加速推动表达调控机理的研究和转录调控网络的构 建。转录因子结合位点通常是一段8.12bp的DNA序列,不同的基因表达需要特定的转录因子结 合到这段DNA序列上,对于某种转录因子,其结合的DNA序列比较相似,但又不完全一样,这 是由于对不同的基因需要不同的结合亲和力。通常,转录因子结合在基因上游启动子区域的结 合位点上称为近程作用。还有一些转录因子结合在距离基因很远的上游区域称之为远程作用。 另外也有一些结合在基因的下游。基因转录水平上的调控如图1.1【11】。GFIMF呐aximalT田S图l-1基因转录水平调控示意图【ll】 经过对人类基因组系统分析发现,蛋白质编码基因的数量只有3万左右(32000 个,30000.40000,20000―25000,26588)[3,12-14],而在这些蛋白编码基因中,调节基因表达的反式 因子占据了相当大的比例,估计约185017]至U 3000[12]。近几十年转录因子及其DNA结合位点l 第1章综述得到了广泛的研究,结果大都收录在TRANSFAC[15]和JASPAR[16]数据库中。2006年推出的 TRANSFAC专业版Rel.7.0中包含了6133个真核生物转录因子和7915个特异DNA结合位点, 其中人(Homo sapiens)有1040个转录因子【15】。 众多反式因子与大量顺式元件的相互作用控制着基因表达调控的一个重要环节一基因转录 调控,形成了精确而复杂的基因转录调控网络。因此,要解析基因转录调控网络,就首先要在 全基因组中鉴定所有的反式因子及其作用的所有顺式元件。 由于种类的繁多和功能的多样性,大多数转录因子以及结合位点的相关知识都还比较有限。 传统分子生物学技术只是零打碎敲地取得了非常有限的信息,为了解决这一问题,包括生物信 息技术大规模预测调控元件、染色体免疫沉淀(Chromatin Immunoprecipitation,CHIP)等技术手段 应运而生,对于大规模挖掘这类顺式调控信息取得了显著的效果。但截止目前还没有任何一个 转录因子的全基因完整DNA靶点及靶基因名单(1ist)得到阐明。1.2转录因子DNA结合位点及靶基因研究现状及重要技术转录因子(,rF)对真核生物的转录调控有着举足轻重的作用,转录因子的相互作用,对生物 的生长发育是至关重要的,因为几乎所有的基因在表达时都要受到转录因子的调控,要解析基 因转录调控网络,就首先要在全基因组中鉴定所有的反式因子及其作用的所有顺式元件;目前 只有一部分转录因子蛋白得到鉴定,而其余的转录因子的鉴定成为功能基因组和蛋白质组研究 的重要内容之一;然而对于已知转录因子蛋白作用的顺式元件及其靶基因的鉴定仍然不完整。 近年来随着生物学实验技术和生物信息学技术的发展,出现了大量高通量转录因子DNA靶点 和靶基因的生物学实验鉴定技术和生物信息学预测技术【17】。 目前把基于生物学实验的技术统称为湿实验(wet experiment),把基于生物信息学的技术 统称为干实验(dryexperiment,in silico experiment)。1.2.1转录因子DNA结合靶点和靶基因研究的湿实验方法1…21 1dsDNA微阵列芯片(PBM)DNA microarray,dsDNA双链DNA微阵列芯片(double.strandedmicroarray)(也称为蛋白结合微阵列,protein.binding micmarray,PBM)是一种新型DNA微阵列芯片,最早报道于1999年,当时美[]Harvard大学Bulykr研究小组在Affymetrix公司原位合成单链DNA微阵列芯片的基础上, 采用引物退火再进行在片DNA聚合酶延伸的办法制备双分子双链DNA微阵列芯片[18】(图1.2), 用于研究序列特异性DNA结合蛋白与DNA靶点的作用特征,通过研究限制性内切酶和锌指转录 因子蛋白与dsDNA微阵列芯片上dsDNA探针分子的相互作用,论证了dsDNA微阵列芯片用于体 外研究序列特异性DNA结合蛋白与其DNA靶点相互作用的可行性。 Bulyk研究小组通过改变对应于一个锌指结构的三连核苷酸,研究了锌指转录因子蛋白与所 有可能三连核苷酸组合DNA靶点的相互作用,以此评价不同位置上核苷酸对转录因子蛋白结合 的重要性及其转录因子蛋白与DNA靶点相互作用时,氨基酸与碱基的对应关系,以期借此高通 量筛选发现一个转录因子蛋白在全基因组范围内的结合位点,并研究这些位点的核苷酸组成特 征,进而建立生物信息学模型,以便在全基因组范围内预测一个转录因子蛋白的靶位点【19】。 这一研究证实了dsDNA微阵列芯片在DNA结合质研究中的应用前景。 Mukherjee等(2004)用此法分离酵母转录因子Abfl、Rapl、Migl的靶基因时,筛选到的靶 基因不仅包括用其他方法已经证实的靶基因,而且又筛选出Abfl转录因子107个新的靶基因, Rapl转录因子有90个新的靶基因,Migl转录因子有75个新的靶基因。许多靶基因是一些不典型 的开放阅读框的上游序列[20】。Berger和Bulyk(2006)在Methodsin MolecularBiologyqb介绍了这种高通量的方法【2l】。目前,Bulyk实验室已经完成大规模地鉴定酵母转录因子的靶位点的工作, 并认为可以将此方法与其他方法整合后用于高等真核生物转录因子及顺式作用元件的鉴定2 东南大学硕士学位论文【22】。 Bulyk研究小组的研究表明PBM技术可高通量鉴定转录因子蛋白的顺式调控元件和转录调 控网络;通过PBM技术与ChiP-on-chip技术的比较,发现PBM获得的in vitro结合位点信息能够精确地反映ChiP-on-chip获得的in vivo结合位点信息,而且PBM还发现了大量ChiP-on-chip不能够显示的结合位点信息【20】。dsDNA微阵列芯片还用于测定细胞核中转录因子蛋白的表达和活化 水平等【23】。图1-2Bulyk等的双链DNA芯片的制备原理图[18】鉴于双链DNA微阵列芯片在研究DNA/蛋白质的相互作用方面极大的应用潜力。我们实验 室从2000年就开始了双链DNA微阵列芯片的研究工作[24.26]。针对当时国际上已经出现的双分 子(bimolecular)dsDNA微阵列芯片的不足之处,我们提出了单分子dsDNA微阵列芯片 (uni.moleculardsDNAmicroarray)概念(图1.3),并发展了几种单分子dsDNA微阵列芯片制备 技术[24.26】(图1.4)。同时制备了针对重要转录因子NF.rB的全单核苷酸突变dsDNA微阵列芯 片,用该芯片研究了NF.r,B对大量单核苷酸突变DNA位点的结合特异性和亲合性[24.26】(图 1.5)。我们的研究表明,单分子dsDNA微阵列芯片为DNA/蛋白质相互作用的研究提供了一种 新的高通量实验技术。 图1-4单分子dsDNA微阵列芯片制备原理图1?5针对NF―r,B的单核苷酸突变单分子dsDNA微阵列芯片与NF.r,B蛋白的结合反应Wild―type Ig-KB:5'-GIG2G3A4C5T6TTT8C9C!o-3’;Nn:n位置上突变的碱基。运用dsDNA微阵列芯片可以非常有效在体外实验环境中研究两个重要的问题,一是评价顺 式元件中每个位置核苷酸对反式作用因子结合特异性及亲合性的所发挥的作用,揭示反式作用 因子对顺式元件每个位置核苷酸的偏好性;这些信息对设计具有转录治疗作用的转录因子诱骗 子、siRNA及反义寡核苷酸非常重要。二是高通量鉴定基因组中反式作用因子的顺式元件,绘 制转录调控网络:这对解析真核生物高度复杂而精确的基因表达调控过程非常重要。 1.2.1.2染色质免疫沉淀分析技术(CHIP)1.2…1 2 1原理和方法ChIP技术由Orlando[27]等-于1997年创立。该技术综合利用了甲醛交联及免疫沉淀方法的优 点,即用甲醛交联固定处于结合状态的蛋白质.DNA复合物,再用免疫沉淀分离DNA.蛋白质交 联复合物,最后分析复合物@DNA。其基本原理是:在活细胞状态下,用1%的甲醛溶液处理使4 东南大学硕士学位论文DNA/蛋白质发生共价交联,固定DNA/蛋白质复合物,然后将细胞裂解,提取DNA/蛋白质复合 物,并将其随机切断为一定长度范围内的染色质小片段,通过免疫沉淀法特异性地富集目的蛋 白结合的DNA片段,除去蛋白质,与DNA结合蛋白特异性结合的DNA片段经PCR扩增后进行电 泳检测,从而得出蛋白质结合位点信息(图l_6)【2Sl。上+’%~~⑧CeII Lysate with Cmss,4inloKI Protein-DNAComplexes圪ofCdloDeb懦磅气竺…吖~i孓Q\。I删№饼P删n鹏~n杂k\1Ir一0:~鹏◆DNAIsolation&AnalysisSouthern Slot Blotorby PCR图l-6染色质免疫沉淀分析的原理示意图【28】 ChIP技术其操作步骤可大致分为固定、沉淀和检测三步。第一步为固定,即在活细胞状态 下,通过甲醛交联作用固定DNA/蛋白质复合物,然后用化学微球菌酶或者机械超声波的手段5 第1章综述将其随机切断为一定长度范围内的染色质小片段。第二步为免疫沉淀,即利用目的蛋白质的特 异抗体通过抗原抗体反应形成DNA.蛋白质.抗体复合体,然后沉淀此复合体(常用蛋白A修饰 的磁珠),特异性地富集目的蛋白结合的DNA片段。第三步为目的DNA片段的纯化与检测, 即经过解偶联,纯化DNA片段,再用聚合酶链式反应PCR或Southern印迹等方法分析DNA(图1.6)。1.2…12 2注意事项(改进优化)在上述ChIP过程中,甲醛能够进入细胞并使蛋白质与DNA或蛋白质与蛋白质之间通过希 弗(Scihf0键交联,形成稳定结合的复合物。如果交联效果不太好,可以先用交联剂DMA(Dimethyl adipimidate)[29]或DSG(Disuccnimidyl glutarate)[30]处理细胞,以加强后续甲醛交联的效果。破碎DNA可采用超声物理破碎或特定酶切消化,以获得所需长度的DNA片段。 由于DNA片段长度将影响抗体免疫沉淀效率,因此破碎DNA是CMP实验成功与否的重要因 素。超声效果与细胞裂解是否充分、细胞浓度及裂解液成分等因素有关。超声处理后的液体应 从浑浊状态变为透明状态【31】。 选择专一性及亲和力较高的抗体是ChIP成功的关键。非特异性抗体将增加大量的非目标靶 点DNA片段信息,从而掩盖了真实的蛋白质结合位点信息;而亲和力较差的抗体,则无法获得 高信噪比靶点DNA片段[321。1.2…1 2 3染色质免疫沉淀的DNA的分析方法染色质免疫沉淀的DNA的分析方法有许多种。如果目的蛋白的靶序列是已知的或者怀疑 某个序列是目的蛋白的靶序列,可以采用狭缝杂交和PCR分析[33.34】;如果目的蛋白的靶序列 未知或者高通量的(high-throughput)研究目的蛋白在基因组上的分布情况,找出反式作用因子 的结合位点,可以采用Southern杂交[27,351、ChIP克隆(CHIP.cloning)[36]、DNA芯片方法 (CHIP。chip)(染色质免疫沉淀后的DNA片段的基因芯片分析)【37.44]、高通量测序法(ChIP.seq) 【31,43,45-53】(图l?7)。 近年来,染色质免疫沉淀(CHIP)技术与DNA微阵列芯片(DNA microarray chip)相结合产生 的“ChIP.chip”技术,极大促进了在全基因组水平上高通量鉴定DNA结合蛋白质(DNA.binding protein)的DNA结合靶点(DNA.binding sites)的研究137-43,54】。ChIP.chip技术中,染色质免 疫沉淀富集的微量DNA(通常只有几个ng),用LM.PCR(Ligation-Mediated PCR)扩增并荧光标 记,再与各种DNA微阵列芯片【基因表达芯片、CpC岛DNA微阵列芯片、启动子DNA微阵 列芯片、叠连(tiling)DNA微阵列芯片】杂交,就可以确定ChIP DNA的序列、丰度及在基因 组中的位置,依此识别出DNA结合蛋白质在全基因组DNA中DNA结合靶点,进而确定附近 基因信息(靶基因)。 与ChiP.chip比较而言,ChIP.seq避免了ChIP.chip依赖于DNA微阵列芯片而造成的偏向 性(bias),即DNA微阵列芯片上探针数量的有限和对全基因组DNA覆盖度的不完全,造成部 分ChIP DNA信息的丢失,而ChIP.seq只需要将ChIP DNA进行高通量测序,在将所测序列在 参考基因组(reference genome)定位(mapping)即可获得转录因子蛋白在全基因中结合位点的 分布,因此ChIP.seq是一种对ChIP DNA的无偏检测技术(unbias),能够完整地显示ChIP DNA 包含的信息[43,55.56】。随着DNA高通量测序技术的快速发展,测序成本快速降低,使得 ChIP.seq能够被普通科研人员承受,变成常规实验技术,因此,CMP.seq代表了转录因子全基 因结合靶点定位的最新前沿技术。1.2…1 2 4发展及应用ChiP技术已得到广泛应用,并在此技术基础上发展出了一系列实验技术平台[571。如早期 基T-PCR技术的ChIP技术与DNA微阵列芯片技术结合后产生的“ChiP-on-chip”技术,取得了6 东南大学硕士学位论文关(的 卑 定分 笙!皇箜堕ChIP技术显著的优点在于它是一种在体内(in VOVO)研究DNA与蛋白质相互作用的理想 的方法[66.70],但这也是它的不足之处,原因是ChIP实验获得的只是一个转录因子在一种人工 培养的特定细胞的一个瞬间与其结合的顺式元件信息,而实际情况是培养细胞不同于活体组织 细胞,也很难反映不同组织细胞在不同发育阶段或不同生理、病理状态下一个转录因子所作用 的全部顺式元件。另外,CMP实验需要很好的抗体,但是否能找到好的抗体仍然是一个不小的 挑战。此外,目前分析ChIP技术捕获的DNA序列信息所使用技术主要是各类高密度DNA微 阵列(如promotermicroarray,genomicDNAtiling microarray,CpG islands mieroarray,gcnomic intergenicmicroarray)和基于芯片的DNA高通量测序技术(Illumina Solexa),这些技术都是专利技术,其使用成本非常高昂,其设备和经费不是一般的科研工作者所能够企及的。而且值得注意的是, 单纯用ChIP方法尚不能够判断目的蛋白是以直接还是以间接的方式来与DNA作用的。1.2.2转录因子DNA结合靶点和靶基因研究的干实验方法生物信息学分析是研究特定基因表达调控机制的重要手段。近年来,随着人类基因组测序 的完成,以计算机为工具,用数理及信息科学的理论和方法研究生命现象,对生物信息进行储存、 检索和分析的方法获得了越来越多的应用。目前。许多综合转录因子结合位点的数据库已经形 成。最常用的是TRANSFAC数据库【71】,这个数据库可将真核生物的转录因子和它们已知的结 合位点进行分类,提供位点加权矩阵(positionweight matrix,PWM)。类似的数据库还有很多,如MatInd and Matlnspector[72]、MATRIX SEARCH[73]、SIGNAL SCAN【741、rVISTA【75]、JASPAR[76]、TESS[77]、TFSEARCH[78]、TRRD[791、DBTBS[80]。有关基因转录因子结合位 点的识别和预测的方法和软件也有很多,如VOMBAT[81I、GAME[S2]、Stubb[83】、POXO[84]、 jPREdictor[85]、CEAS[86]、oPOSSUM[S7]和"I F Target Mapper[88]。 对于数据库中数据进行更深一步的研究和分析是富有挑战性的工作之一。它在计算机和国 际互联网的发展使对大规模数据的存贮、处理和传输成为可能的基础上得以实现。大量DNA结 合蛋白质等生物大分子数据的存在和生物信息学技术发展的结合,使in silico生物学研究成为生 物医学发展的一个重要方向,通过综合已有的信息和预测技术,发现新的DNA结合蛋白质或 DNA上的特异蛋白结合位点,有助于进行DNA结合蛋白质的相关研究。 但生物信息学的方法仍然存在一定的局限性,其中生物信息学预测所能依赖的可靠的实验 数据并不多,基于这些非常有限的实验数据建立起来的预测模型其可靠性、精确性还有待大量 的实验研究去证实;这类生物信息学研究最初所依赖的实验数据还主要是传统分子生物学技术 所获得的零零碎碎的知识,如建立一个转录因子蛋白共有基序所使用的最典型的加权矩阵法, 依靠的就是传统分子生物学实验获得的数个调控元件的碱基信息;虽然目前生物信息学研究也 使用了来自基因组测序、比较基因组、DNA微阵列芯片等方面的大量信息,但真正来自实验 的数据资料还是不多[89―98]。 其次,现有的生物信息学软件存在局限性。由于用传统的实验方法鉴定功能元件是极其费 力的,生物学家开发了一系列的生物信息学软件去预测调控序列中的功能元件。这些软件的原 理都是用已知的功能元件的数据库去扫描待研究的调控序列中可能的功能元件。但是由于功能 元件的核苷酸长度较短,可能仅仅由于随机性产生了与功能元件相同的核苷酸序列,所以软件 预测出的功能元件往往是不具备生物学活性的。基于功能元件在进化中是比较保守的性质,补 救的措施是选取近缘物种的相应调控序列进行比对,如果这几条序列中都共同存在一些生物信 息学预测出的潜在的功能元件,那么就可以比较肯定它在转录调控中发挥一定的作用。这项方 法也确实成功鉴定了~些以前未知的功能元件。但是,它也有其自身的局限性:(1)核苷酸序列 的保守可能仅仅是由于随机性;(2)真正的功能元件的序列可能会发生改变,而其功能不变;(3) 一些功能元件是具有种属特异性的。这些局限性会造成假阳性和假阴性结果[991。所以尽管近8 东南大学硕士学位论文年来预测软件日趋复杂和成熟,这些预测结果大都只能被当作后续实验鉴定的靶点,而不能当作可靠的功能元件。但生物信息学具有快速、经济的优点,仍然会在基因表达调控研究方面发挥重要作用。它的 形成为分子生物学家提供了一条寻找和研究转录调控靶点的新思路,用网络资源进行分析,发现 新线索和新规律,指导实验工作的设计,可避免实验的盲目性和不必要的重复。 1.3NF.KB的研究现状NF.KB的生物学特性kappa B,NF-r,B),又叫Rel/NF.r.B,是一类多功能核转录因子,Sen1.3.1核因子r,B(nuclear factor和Baltimore于1986年首次在B淋巴细胞中发现,因能与免疫球蛋白轻链基因增强子r,B序列 特异结合而得名【100】。大量研究表明NF.KB是一类广泛存在于真核细胞的核转录因子,能识别 并结合靶基因上游特定的1cB调控序列,从而促进靶基因的转录[101]。 NF.r.B已经是一个典型的调控性转录因子,在众多细胞中表达并发挥作用,具有广泛的生 物学作用。NF.KB参与调控众多基因的表达,是机体免疫应答和炎症反应的主要调节因子[1021, 同时也参与胚胎发育[103]、细胞凋亡[104]、细胞周期[105]的调控。NF.rB的异常活化与多种疾 病的发病机制相关[106】,包括炎症、血管疾病、肿瘤、病毒感染、脑血管疾病、阿尔茨海默病、 帕金森氏病、过敏性脑炎、感染性休克、风湿性关节炎、支气管哮喘、动脉粥样硬化等病理过 程。NF-r,B是目前进行转录治疗药物开发的一个重要靶点。1.3.2NF.KB复合物的组成NF-r,B是由Rei/NF.r,B家族的多肽成员组成的一组转录因子,哺乳动物细胞中发现的NF.r,B/Rel 家族包括NF―r,B1(p50及其前体p105)、NF-rB2(p52及其前体p100)、RelA(p65)、RelB、Rei(c-Rel) 5位成员[107】。这些蛋白质都有一个大约由300个氨基酸组成的N末端,称为Rel同源区(Relhomologydomain,RHD),其中包括DNA结合部位、二聚体化部位及核定位信号(nuclearlocalization signal,NLS)。Rel/NF.r.B家族成员借助疏水性相互作用介导的二聚化作用,形成二聚体结构。Rel/NF.rB 家族的成员之间几乎可以形成所有理论上可能组合形式的同源和异源二聚体(其中, RelB/RelB、RelB/RelA和RelB/Rel到目前为止尚未检测到)。不同的NF.r,B/Rel蛋白二聚体具 有不同的结合序列,而且具有各自的特性。就人类而言,最先被确认的、且为唯一生存所必需的NF.r,B是p50/RelA(p50/p65),通常所说的NF.r,B即指此。该二聚体与相应DNA的心位点具有较高的亲和力。其中,p65的羧基端含有转录活化域;p50则与DNA结合有关[108]。标 准NF.r,B pS0与p65二聚体的结合序列为GGGRNNYYCC(其中R为嘌呤,Y为嘧啶,N代表 任意碱基)。 在静息状态下,NF.1cB主要形成p50和p65异源二聚体并与其抑制蛋I兰t(inhibitorofr,B,Ir,.B) 结合而存在于细胞质当中。Ir33主要包括Ir,.Ba、I'cBB、It,B7、Ir,B£及Bcl-3等[109],它们同样含有一段锚蛋白重复序列,从而覆盖了p65当中的NLSBlO],进而阻止NF.心核易位并与其调 控基因启动子上心保守序列结合,阻止转录的进行。1.3.3NF.KB的激活炎症因子、化学因子、免疫应急、细菌感染、化学药物、凋亡介质及自由基等因素均可使Ⅻ?柚激活【111―112](图1?8)。NF―l(B信号通路有两种激活途径:经典途径和非经典途径。在经典途径的激活中,比如依赖促炎症细胞因子肿瘤坏死因子afTNF―q)刺激的信号通路,将导 致Ir,B激酶(IKK)复合物p亚基的激活,然后使Ir,B蛋白的N末端两个丝氨酸残基磷酸化(图 l一9)。在非经典途径中,IKKa被激活并磷酸化p100(图l-8)。磷酸化的Ir,Bs被遍在蛋白连接9 第1章综述酶识别,导致它们的聚泛素化及随后的降解,或者在p100存在的情况下通过蛋白酶体k隗(forreview,see Karin and Ben-Neriah2000)。游离的NF―r,B二聚体移位入核,结合到靶基因的启动子或增强子上的特多两旁列上。激活的NF-诏可通过多种机制被下调,包括凭借新合成的Ir,Bot蛋白结合核内的NF.1歪并将其输出到胞质。1.3.4NF.KB的靶基因 东南大学硕士学位论文A ClassicalNF-KB PathwayB AlternativeNF-一:B Pathway图1.9 NF-1d3激活信号通路的经典途径和非经典途径【125】 表1-1已报道的NF―r,B的全部靶基因(包括直接靶基因和间接靶基因)Regulators of apoptosisASCBaxCytokines/Chemokines andtheir modulatot's BAFFMMP-9.matrixmetailoproteinaase-9 MeCK iNOS n-NOS ●PDE7AlBLIMP.1CCL5 CCLl5/Leukotactin/SC、&~15 CCLl7 CCLl9 CCL20 CCL22 CCL23/SY-气23 CCL28 CINC.1 *CXCL 1 1Bnl/Al Bcl-xL Bcl-2 B7-Hl BNIP3 Caspase-I I Nrl3 e-FLIPPIM-lPlk3 PIK3CA *PP5 PKCdelta PLCdelta l *PTGIS,prostaglandinsynthaseCD95(Fas)CIDEA +Fas-associated phosphatase-Ill 第1章综述Eotaxin Fractalkine Gro alphaCJrOFas-Ligand IAPsIEX-IL+PGES,prostaglandinE synthase PTPlBbeta即RAF―lTRAF-2PTHrP RACKl ●REV3 Sl丘l-2 Serpin 2AGro gamma CJrO-1 ’ICOSIFN-g IL-la’TRAF-2 binding protein(Carp)XL气PGrowth factors,ligands,and their modulatorsantagonist Activin A Angiopoietin BCAP BDNFSI―盯l SNARK SS√虹’ ‘SUV3 1飞RT Transglutaminase TTG TypeⅡ-secreted phospholipase A2 Uridine phosphorylase●XanthineIL-lb也-lIL-2 IL,.6 IL.8 Ⅱ,9receptorBL必BUfK BMP-2BIVlP?4 CGRP FGF8 FLRG G.CSFIL-lO儿-ll ILl2B(p40) 也-12A(p35)IL-13?IL-15DehydrogenaseIL-17 IL-23A Cp l外l垤isceUaneous ?ABCG5(bovine) ABCG8(bovine)AbetaH-J-JGM-CSF+HGF/SF EPO ●IGFBP-lIGFBP-2IL-27(p28)EBl3/I]L-27B beta-InterferonIP-10aIpha.1 acidglycoprotein alpha-fctoprotein AMH +beta-amyloid APOBEC2 Apolipoprotein C III Apolipoprotcin D Apolipoprotein EKC IiGplM―CSF(CSF-D Midkine(neurite growth promoting factor-2)NGF NK-lR NK4 Nrgl OPN PDGFB chain PIGF+LIX(mouse);ENA-78(CXCL5)and GCP.2(CXCL6)(human) LymphotoxinaLymphotoxin bMCP.1,JE MIO MIP.1a,bAQP4 oBiglycanBRCA2 Cal¥arcin.1 ?CaveoliIl-l ●Clone 330 ?Clone 156 ?Clone 68aka(LAG-1)Procnkcphalin Mm-2 MP-3alpha/CCL20‘mobl Neutrophil activating peptide-78 RANTES TCA3,T-cell activation gene 3TNFalphaProlactin Stem Cell Factor+Thrombospondin-I(TSP?1) ‘ThromboSpondin-2(THBS2)VEGFC ’WNTlOB‘p2l-CIPI?Claudin-2- ●_ ■_● - _ ●■ _ _■ _■ ■ ●_■ ●_- ■_ -●_■ ●■●_ ●_ ●_ ● -_ I- _ ● -_● ■●- _一I ― 一― I― Il _■ -_ ■ _ ●■ ■一TNFbetaTranscription factors and their12a2(I)collagen 东南大学硕士学位论文TRAIL(aka Ap02 ligand) TFF3(Treefoil factor)VEGImodulatorsA20+Connexin32Cyclin DI Cyclin D2+Cyclin D3ABIN-3Androgen receptor Immunoreeeptors B7.1(CD80)BIU.-1 CCR5CCR7 CXCRBcl.3DIF2BMI―lCDXlDMTlElatin Endothelin l Ephrin-Al?C-fos(fish gene)c-myb c。mycc-relF∞tor VIIIFcrritin Heavy Chain Gadd45beta (}alpha i2 ●GIF Galectin 3 GBP.1 epsilon-Globin zcta-Globin *GS3686 Hair K5 keratin ‘HCCSlCXCR2 CDl37 CDl54 CD39amma CD21 CD38 CD40 CD48 CD83 CD86 CD98 CDl34+FI 1-receptorC/EBPdelta ?DC.SCRIPT Dmpl E2F3a Elf3宰ELyS?ETRl01 Gata-3 ?Glucocorticoid receptorHIF-laipha HOXA9 IRF-l IRF-2 IRF-4 IRF一7 a-chain IkB-a IkB-cHMGl4IBABP lM咿2 K3 Keratin K6b Keratin K15 Keratin *Lactoferrin Laminin B2 Chain Lipocalin-2FcRnFcepsilon receptor II(CD23)HLA-GIL-2 receptorImmunoglobulin Cgammal Immunoglobulin gammal Immunoglobulin gamma4 ImmunoglobulinejunB jmjD3Len LZlPheavy chainMtsl Mirl25b Mirl46a,b Mirl55MNElImmunoglobulin k light chain Invariant Chain II Kinin B1 Receptor MHC class I(H-2Kb)Majlnfkb2 nfkbl NLRP2 NURRl Osterix p53 Progesterone receptor relb Snail Sox9 StatSaMHCClassI札A-B7I)2 Microglobulin Nod2 Polymeric Ig receptorMucin(MUC-2) Myelin basic proteinMCTl Nan Neutrophil gelatinase-assoeiateM lipocaiin NLFlPGI心一ST-cell receptor b chain T-cell receptor/CD39amma 11 R-2 TLR9.pllPA28 alpha *TNF?Receptor,p75/80(CDl 20B)Tfec _●l●__-I●_-_I-_I●●-_-_ll_-I--__-l-_-●l_--●-_●--__-lll_I-●Il-l●I●●I-●_ll-I_l●ll●I__I―II一 131●I_ +Ⅳb【lBtl【’RICKNAD(P)H quinone oxidoreductase (DT-diaphorase)Vhospholipasc SEPSlA2Cathepsin B ‘Cathepsin L cdk6 ’Ceramide glycosylWansferase Chitinase 3-like proteinScrpinE2 S 100A6(caleyclin) SH3BGRL SK2 channels Skp2 ‘Spergen-1Cell-surface receptors ABCAl ABCC6A1’cis-retinoid/androgen dehydrogenasc type l(CRAm)。cis-retinoid/androgen dehydrogenase type 2SWSlSyncytin-I Syndecan-4 1:AUT 1'ASK.2 ’Tissue factor pathwayadenosine receptor(CRAD2)Collagenase l ’Dihydrodiol dehydrogenase●DYPDA2A+ADAMl9Amiloride-sensitive sodium channel ●alpha2B?adrenergic receptor Bradykinin Bl-Receptor ●CD23 CD69DNASIL2 EL ●EN02●GAD67inhibitor-2(Ⅱ甲I-2)*Transfcrrin(mosquito)TRIF 东南大学硕士学位论文(GRINI gene)Oxytocin receptor PAF receptor l P-gP RAGE-receptor for advanced glycationend+Soluble Guanylyl cyclase alpha(1)Avian Leukosis VirusBovine Leukemia Virus‘HeparanaseHO-I Hyaluronan synthase1 1bHSD2CMV EBV(Wp promoter) HBV(pregenomic promoter)HIV-Iproducts‘17bHSD H+-K+ATPase alpha2。Early response genes’B94 +Egr-I p22/PRGI +p62 +TIEGIodothyronine deiodinase(type 2)HSV(ICP90,ICPO) Lipocalin-type prostaglandin D synthase(L-PGDSl Lysozyme Jc Virus HPV type 16 SIV SV-40Mthfr+^皿(P?lMMP-3.matrix metalloproteinaase-3串代表基因在启动子区有心位点但尚未被证实受NF.KB的调控;或者基因的表达与增强的NF.KB活性相关但尚未被证实为其直接靶基因。参考文献见:http://people.bu.edu/gilmore/nf-kb/target/index.hmal1.4本论文研究背景经过几十年的发展,鉴定转录因子结合靶点及靶基因的研究取得了很多的成果,不仅诞生了很多重要技术,对很多重要转录因子(如NF.佃、p53、GR、STAT等)的全基因组DNA靶点及靶基因的研究也取得了显著的进展,越来越多的转录因子靶基因被鉴定出来。但截止目前 还没有任何一个转录因子的全基因完整DNA靶点及靶基因名单(1ist)得到阐明。因此,需要 创新研究思路,发展新的转录因子靶基因研究策略,以便高效识别转录因子靶基因,鉴定出一 个转录因子所有的靶基因(可称为“靶基因谱”),为转录因子靶基因转录调控网络的绘制奠 定基础。 近年来,大量转录因子DNA靶点及靶基因预测生物信息技术以及生物学实验技术得到发 展。但生物信息技术和生物学实验技术各有优缺点,单纯依靠哪种技术都不能完全胜任转录因 子的全基因完整DNA靶点及靶基因的鉴定识别研究。因此,将生物信息技术与生物学实验方 法如染色体免疫沉淀(Chromatin Immunoprecipitation,CHIP)等相结合,成为该领域研究的显著特 征,并因此取得了显著的成果[36,42,126.1351。大量新颖的研究表明,要在全基因组范围描述 转录因子的TFBS及靶基因,必须将干湿实验技术有机结合,才能尽快弄清一个转录因子的功 能性TFBS及靶基因[136―140】。 dsDNA微阵列芯片是体外研究DNA结合蛋白与DNA相互作用的一种重要技术【18】。因此, 我们实验室从2000年就开始了dsDNA微阵列芯片的相关研究。针对当时国际上已经出现的双分 子(bimolecular)dsDNA微阵列芯片的不足之处,我们提出了单分子dsDNA微阵列芯片(uni.molecular dsDNAmicroarray)概念,并发展了三种单分子dsDNA微阵列芯片制备技术【24.26,141】。同时制备了针对重要转录因子NF.rB的全单核苷酸突变dsDNA微阵列芯片,用该 芯片研究了NF.1cB对大量单核苷酸突变DNA位点的结合特异性和亲合性,发现有些核苷酸的突 变对亲合性影响不大,而有些核苷酸的突变会导致亲合性的剧烈下降,因此筛选出9个具有较高 亲合性的单核苷酸突变位点【26】,并且推断这些突变位点若在基因组存在,有可能是NF-r,B的结 合位点,其临近基因也可能是NF-r,B的靶基因。 基于这些研究,我们构思出一种转录因子DNA靶点及靶基因研究的新思路,即“湿实验 _÷干实验_湿实验”紧密结合技术体系。首先以湿实验手段获得一个转录因子与大量人工设计 DNA结合序列的结合特异性(specificity)及亲合性(affinity),筛选出那些具有较高亲合性的结15 第1章综述合序列(湿实验技术);然后以干实验(生物信息学技术)手段扫描人全基因组,定位这些序列 在基因组中的分布,将它们推定为转录因子在基因组中的假定结合位点(putative binding sites), 并依据这些位点找出附近的基因,将这些基因推定为转录因子在基因组中的假定靶基因(putative targetgenes);最后,以干实验预测的假定结合位点及靶基因名单为蓝图,指导新的湿实验研究,以便快速高效鉴定转录因子的功能性(functional)结合位点及靶基因。 在新的研究思路中,第一次湿实验是dsDNA微阵列芯片(dsDNA microarray)实验,第二次 湿主要是染色质免疫沉淀(Chromatin immuno-precipitation,CHIP)、荧光定量PCR、转录因子诱 骗子(decoy)、凝胶迁移实验(EMSA)、RNA干扰、过表达技术等。干实验是基于第一次湿实 验数据的生物信息学分析、归纳和预测。 我们已经用转录因子蛋白NF.r,B的单核苷酸突变dsDNA微阵列芯片研究证明了该技术体系 中第一次湿实验的有效性和可行性【26】。因此,本论文希望通过进一步的“干实验-÷湿实验”结 合,证明该技术体系的可行性。16 东南大学硕士学位论文第2章转录因子NF.KB DNA结合位点全基因组扫描及靶基因预测NF.r,B是由Rel/NF.rd3家族的多肽成员组成的一组转录因子。1986年,NF-心首次被确认为一种能与免疫球蛋白Iglc的轻链基因的增强子元件(5'-GGGACTTTCC-3’)相结合的核因子[100】。 王进科等根据这一序列设计了单碱基突变的寡核苷酸探针,并用双链DNA微阵列(dsDNA microarray)技术检测了它们与NF.rB的亲和性,研究表明NF-rd3对野生型结合位点 GGGACTTTCC以及9个引入单核苷酸突变的人工序列都具有很高的亲合性【26】。并且推断这些 突变位点若在基因组存在,有可能是NF.r.B的结合位点,其临近基因也可能是NF-r,B的靶基因。 因此,本章中我们将这10个序列做为全基因组扫描的对象,提取了这10个序列在基因组中的定 位信息,以及附近的基因信息,并对基因组存在序列的分布特征、附近基因的功能聚类等进行 了细致分析。 以前,在有关转录因子蛋I刍DNA结合位点鉴定研究中,常常仅将基因上游短距离DNA序列 (启动子)做为转录因子DNA结合位点研究的范围。近年来的研究却表明,转录因子的DNA结 合位点常常与其靶基因转录起点(TSS)距离很远,将这类DNA结合位点称为长程位点(10ng-range bindingsite)[142]。实验研究表明,这类结合位点通常形成噜哺(100p)结构使结合其上的转录因子与基本转录机器(基础转录因子与RNA聚合酶形成的复合物)发生相互作用, 调控基因的表达水平[143]。染色质免疫沉淀(CHIP)研究表明,NF.rB的不少靶基因受长程位 点的调节,最远的达40kb;同时很多位点还定位于基因内元(intron)和基因下游(3’region)[1 18, 144.145】。基于这些新的认识,在本研究中,我们将位点附近基因信息的提取范围从传统的 .1kb--2kb扩展到基因上下游lO kb及整个基因DNA序列,以便尽可能避免遗漏有价值的信息。2.1实验方法2.1.110个位点的人类全基因组扫描及周围基因提取S等设计的一个BLAST搜索工具:TF-TargetMapper[88】使用Horsman(http://tftargetmapper.erasmusmc.nl/)在人全基因组序列中检索以_EIO个位点,并提取周围 (10kb)已知基因的EnsemblgeneID。共得到42017个靶点,其中22170个靶点10kb内有基因。binding sites,我们将上下游lOkb内有已知基因的位点视为NF.r,B的推测结合位点(putativePBSs),将附近10kb内的基因视为NF-r.B的推测靶基因(putative taget genes,PTGs)。 BLAST/Ensembl参数设置:Program Name:blastn;Database:human;e-value:10000;Wordsize:10;Ensembl window:10000。2.1.2DNA靶点与基因位置关系的确定通过Ensembl Biomart获取PTGs的详细基因信息(基因官方名称、基因全名、染色体定位、 转录本信息、基因类型及状态等信息),并确定PBSs相对于PTGs的定位。DATABASE:Ensembl 47;DATASET:Homo sapiens genes(NCBl36);Filters-ID list limit: Ensembl Gene ID(RI]TF.TargetMapper提取的位点周围(10kb)已知基因的Ensemblgene ID)。2.1.3NF.r,B靶基因的文献检索查找关于NF.r,B靶基因的文献报道。主要参考美国波士顿大学托马斯教授创建并维护的TheRel/NF.kappaB TRANSFAC 7.0 TranscriptionFactor网站(http://people.bu.edu/gilmore/nf-kb/index.html)和Public数据库的信息。 GENES栏目收录了文献报道的FactorThe Rel/NF.kappaB Transcription Factor网站的TARGETNF.r,B相关靶基因,包括直接靶基因和间接靶基因。在TRANSFAC的TranscriptionClassification栏目下,依次进入4.1.1 Family:aeVankyriIl条目下的人相关NF.r,B亚型的factor17 查看相将不同位点及其对应的靶基因标记在染色体上,以图谱的形式展现出来。然后利用Cruz)提供的交互式基因组可视化浏览器―Geno―me ―Brow―ser,查看感兴趣区域靶点及基因分布的详细信息。ucsc(the University of California Santa2.1.5功能聚类利用Vanderbilt University开发维护的在线基因聚类分析工具WebGestalt(WEB.based GEneSeTAnaLysisToolkit,http://bioinfo.vanderbilt.edu/webgestalt/)对位点位于-lkb的推测靶基因进行Institute ofAllergy and InfectiousGo功能聚类。 然后利用NIAID(National Diseases)开发维护的基因功能注for Annotation。Visualization and Integrated Discovery,释及可视化数据库工具DAVID(Databasehttp://david.abcc.ncifcrf.gov/home.jsp)6.7,通过它的基因统计分类功能,对文献报道的确证靶 基因(471个)和lO个位点的9869个PTGs分别进行功能分类的统计分析,并分别绘制功能分 类条形图。2.2实验结果2.2.1Mapper,在人全基因组对序列(GGGAC肌C、GGGACTTCCC、 GGGAClTrAC、GGGACTGTCC、GGGAC唧C)进行扫描,并提取周围(0kb、o ̄lkb、1 ̄2kb、利用"IT.TargetGGGATTTTCC、10个序列的基因组定位信息及其相关的基因信息GGGA Arr]陀C、GGGAGTrrCC、GGGGCTITCC、GGGTCllTCC、2~5kb、-10k)基因信息。然后用Ensembl Biomart获取PTGs的详细基因信息,确定PBSs相对于 PTGs功能区的定位。部分扫描结果如表2.1、表2.2,位点位于.1kb内的NF.r.B假定靶基因见附录。 表2-1 序列GGGACTTTCC在Y染色体上的扫描结果(TFTargetMapper)18 东南大学硕士学位论文3645 3646 3646 3647 3648 3649 3650 365 l 3652 3653 3654 3655 3655 3656 3656 3657 3658 3659 3660 366l 3662GGGACTTTCC GGGACTTTCC GGGACTTTCC GGGACl、TrCC GGGACTllCC GGGACllTCC GGGACTTTCC GGGACl’TTCC GGGACTTTCC GGGACl’TTCC GGGACTTTCC GGGACllTCC24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 2420440263 22081049 2208 1 049 22 l 04590 2245 1615 22496214 22535578 2274007l 2283345 l 22909777 23161879 23201242 23201242 24106006 24106006 24144869 2480283 l 24882710 25898501 25978373 2604704220440272 22081058 2208 l 058 22 l 04599 2245 1624 22496223 22535587 22740080 22833460 22909786 23161888 23201251 2320125 l 24106015 24106015 24144878 24802840 24882719 258985 10 25978382 2604705 1.1 l l l .1 .1 .1 .1 .1 l l l 1 .1 .1 .1 .1 l .1 1 .1 ENSG000001 72294 ENSG00000205995 ENSG000002 l 5558 ENSG00000215540 ENSG00000197955 ENSG000002060 11 ENSG00000169800 ENSG0000016981l ENSG00000 l 74622 ENSG00000 l 74622 ENSG00000206046 ENSG00000206046GGGACTnCCGGGACl_ITCC GGGACTTTCC GGGACTITCC GGGACTITCC GGGACTTTCC GGGACTTTCC GGGACTTTCC GGGACTTTCC表2.2序列GGGACn可CC在Y染色体上10kb内的基因(10kb内含有序列GGGAcllmCCEnsembl Gene ID ENSG000000997 1 5 ENSG0000021560l ENSG00000197038 ENSG0000018868l ENSG00000129864 ENSG00000165246 ENSG00000l 65246 ENSG00000215579 ENSG00000099749 ENSG00000l 74622 ENSG00000l 698 1l ENSG00000l 74622 ENSG00000206046 ENSG00000206046 ENSG00000169800 ENSG000002060 1 1 ENSG00000215558 ENSG00000205995 ENSG000002 1 5 540 ENSG0000019795519的基因)(Ensembl Biomart)Hit ID 3630 3634 3636 3638 3641 3643 3643 3644 3644 3646 3646 3647 3648 3649 365l 3653 3655 3655 3656 3656 Gene Name PCDH 11 Y Gene location chr24:4928267.5670256 ehr24:8208239.8210243 NR 001547.1 ehr24:9214670.9220483 chr24:11769481.11830682 VCYl HUMAN NLGN4Y NLGN4Y chr24:14607046.14607786 chr24:15144026.15466924 chr24:1 5 1 44026.1 5466924 chr24:20197283.20197456 CY6rfl 5A chr24:20 l 88624.202 11 564 chr24:22082646.22 120600 chr24:22064793.22073242 chr24:22082646.22 1 20600 chr24:22435611-22494683 chr24:22435611-22494683 chr24:22724079.22738483 chr24:22864383.229734 16 chr24:23208154.23212545 chr24:23204780.23204884 chr24:240947 1 2.24099 1 03 chr24:24102373.24102477 Hit Location other intron other intron .3560.5 other intron 9502.5 1st intron other intron 292.5 l st intron .1 592.5 78 11.5 other intron other intron -1535.5 -1592.5 1 st intron .6907.5 ―3533.5 一6907.5 ―3533.5RBMYlB Q l 5378HU删RBMY l BRBMYlERBMYlE NP 689798.1RBMY l F 第2章转录因子NF.1cBDNA结合位点全基因组扫描及靶基因预测3662ENSG00000172294Q96RM9HU^嗄A小ichr24:26038443.260422404806.52.2.2不同范围推测靶点及推测靶基因数目统计对不同范围的推测靶点进行统计,统计结果如下。表2.3chr ups打eam l 2 3 4 5 6 7 8 9 lO 11 12 13 14 15 16 17 18 19 20 2l 22 23 24 Sum 240 152 141 105 106 13l 114 10l 101 87 150 105 44 94 91 98 162 28 134 7l 33 72 73 14 2447 ups仃eam 196 136 120 81 90 107 116 69 113 80 127 99 34 70 92 75 116 30 130 5l 24 58 80 10 2104 ups打eam 5l 37 23 26 32 42 29 26 22 33 44 21 8 31 23 37 46 7 45 15 3 15 18 l 63510个TFBS(PBSs)的统计结果(相对于gene)10kb 5kb lkb 一1St.other intron intron 504 319 275 221 233 300 292 218 219 272 271 189 138 174 162 146 199 92 161 126 94 98 219 10 4932 1066 813 823 532 596 619 694 503 547 689 533 509 289 352 371 392 448 260 338 334 167 237 390 34 11536eX0n3?10kb蚰锄notatcd437 308 252 18l 195 215 273 194 190 184 275 231 70 159 167 220 282 71 263 13l 68 134 201 22 4723 1228 1753 1317 1436 1364 1199 978 1147 854 944 868 902 723 607 480 591 371 638 211 430 244 210 1143 209 19847154 90 91 48 52 63 50 41 41 58 75 69 19 31 42 50 74 14 64 41 18 30 54 0 1269表2.4推测靶点(PBSs)分布总体统计(相对于gene)5-10kb TFBS up up upi‘ntronl一5kbO-lkb1stothereX0n0~1 0kb d‘owntlllanno tatea‘iIliron m 东南大学硕士学位论文GGGACTllTCSum214 2447182 210461 635486 49321 1581 17 1269440 47232005 1984711536表2。5推测靶基冈(PTGs)分布统计.5-10kb1-5kb0-lkb1stotherexon10kbTFBs GGGAClnTCC GGGACTTCCC GGGATl_ITCC GGGAATll℃C GGGAGl’TTCC GGGGCTTrCC GGGTC下IvrCC 307 275 289275intro Intron intro Intron p un up wo ddown up 204 220 29423576 79 6972448 423 566508897 889 125 ll 129128 1 56 133 102 90 190 l 16 59 175 118560 562 652 564 576 653 661 233 5 19 492281 278 285 122 265 227227 247 307 94 220 18841 100 61 28 68 62499 508 525 242 407 4521080 1066 l 198 590 874 1003GGGACT丌ACGGGACTGTCC GGGACTTITCPTGs in Putative TFBS 10kbunchecked PTGsCmhecksed篡尊陋G―enes如b惋yB2M,BCL2,BCL3,CCL5,CD3G,CR2,CSFl,CSF2,CSF3,ENG,FAS,ICAMl,GGGAClvITCC 242 1 2393 28ILll,ILl5,几lB,IRFl,LTA,LTB,NFKB2,NOD2,NOS2,OPItMl,PLCDl,PSMA2, PSMB9,TAPl,TNF,TNFAIP3ALOXl}

我要回帖

更多关于 经典途径的c3转化酶 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信