neegvin组成英语单词是怎么组成的什么快

下载作业帮安装包
扫二维码下载作业帮
1.75亿学生的选择
英语怎么记单词最快
每天早晨读半个小时到一个小时的单词
为您推荐:
其他类似问题
不断重复,读写并用。
读+写。看着音标分开音节背
扫描下载二维码生物信息学导论Introduction to Bioinformatics研究方向—— 基 因 组 结 构与序列 —— 比 较 基 因 组学和生物进 化 —— 蛋 白 质 分 子动力学模拟朱怀球工学院生物医学工程系 湍流与复杂系统国家重点实验室 理论…1、分别写出2010年以来,国际上与Ovarian cancer、Breast cancer、Leukemia相关的文献有多少篇?写出3篇研究性论文标题和摘要,写出5篇综述性论文标题和摘要;数据库:科学引文索引数据库(SCI:Science Cita…中山大学硕士学位论文用生物信息学方法预测水稻新的miRNA前体及其成熟miRNA姓名:翁露晖申请学位级别:硕士专业:生物信息学指导教师:施苏华中山大学硕士学位论文用生物信息学方法预测水稻新的miRNA前体及其成熟miRNA用生物信息学…
古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计 作 者 姓 名
生 物 技 术指导教师姓名
波专业技术职务 (目录格式)
录(三号、黑体、居中、目录两字空四格、与正文空一行) 摘
……………………………………………………………1第一章(空两格)☆☆☆☆☆(小三号、黑体字)………21.1☆☆☆(四号黑体) ………………………………………………21.1.1☆☆☆(四号黑体)………………………………………………41.1.2☆☆☆ ……………………………………………………………71.2☆☆☆ ………………………………………………………………91.2.1☆☆☆……………………………………………………………151.2.2☆☆☆……………………………………………………………24第二章(空两格)☆☆☆☆☆…………………………… 292.1☆☆☆………………………………………………………………292.2☆☆☆………………………………………………………………35 ……………… 摘
要 葡萄糖通过―中心代谢途径‖降解为丙酮酸的过程对于生物体物质及能量的代谢具有重要的作用。古细菌的葡萄糖酵解过程具有与真核生物以及细菌葡萄糖代谢显著不同的特征。随着基因组学和蛋白质组学的发展,生物信息学在数据处理中的应用已经越来越广泛。作为数据处理中越来越重要的分析手段,蛋白质组学数据库是蛋白质组学的主要内容之一。生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。序列比对是生物信息学中的一个基本问题, 设计快速而有效的序列比对算法是生物信息学研究的一个重要内容, 通过序列比较可以发现生物序列中的功能、结构和进化的信息, 序列比较的基本操作是比对。本文介绍了序列比对算法的发展现状, 描述了常用的各类序列比对算法, 并分析了它们的优劣。本实验通过生物信息学分析,运用GenBank、ClustalX、ClustalW、Swiss-Model、BLAST等数据库和工具,得到与古细菌糖酵解途径酶类的 关键词:生物信息学ABSTRACT Glucose is degraded to pyruvate via the so called ―central metabolic pathways‖ that play vital roles in the carbohydrate and energy metabolism of organisms. Some variances to the classical glycolytic pathways in bacteria and eukarya are presented in the glycolysis of archaea.Bioinformatics plays an important role in genomics and proteomics to analyze the vast data from experiments. Recently , many labsestablished a lot of proteomic databases. Bioinformatics is the subject of using computer to store, retrieve and analyze biological information. Sequence alignment is a basic problem in3Bioinformatics, and its main research work is to develop rapid and effective sequence alignment algorithms. We may discover functional, structural and evolutionary information in biological sequences by sequence comparing. This paper introduces the development actuality of sequence alignment algorithms, describes variety of sequence alignment algorithm and analyses the advantages and disadvantages of them.The experiment through the bioinformatics analysis,use GenBank, ClustalX, ClustalW, Swiss-Model, BLAST and other databases and tools, has been with the ancient ways of bacterial enzymes of glycolysis.Key words:Bioinformatics4第一章
前言1.1古细菌概述古细菌(archaeobacteria)(又可叫做古生菌、古菌、古核细胞或原细菌)是一类很特殊的细菌,多生活在极端的生态环境中。具有原核生物的某些特征,如无核膜及内膜系统;也有真核生物的特征,如以甲硫氨酸起始蛋白质的合成、核糖体对氯霉素不敏感、RNA聚合酶和真核细胞的相似、DNA具有内含子并结合组蛋白;此外还具有既不同于原核细胞也不同于真核细胞的特征,如:细胞膜中的脂类是不可皂化的;细胞壁不含肽聚糖,有的以蛋白质为主,有的含杂多糖,有的类似于肽聚糖,但都不含胞壁酸、D型氨基酸和二氨基庚二酸。自古细菌被分为一个单独域以来,随着其新类群的不断发现,现在古细菌可分为广古细菌(Euryarchaeota)、泉古细菌(Crenarchaeota)、古古细菌(Korarchaeota)以及纳米古细菌(Nanoarchaeota)4个门古细菌介于细菌和真核生物之间,它的结构较真核生物简单,类似于细菌,而很多信息处理过程的组分更接近于真核生物,在DNA复制装置中该现象尤其显著。因此,很多古细菌可以作为研究真核生物DNA代谢过程的模型,是较好的模式生物。然而,古细菌发现比细菌晚,它的结构又与细菌有所区别,很多在细菌中可以使用的遗传操作技术无法在古细菌中使用。1.1.1掘越氏热球菌(Pyrococcus horikoshii)掘越氏热球菌(Pyrococcus horikoshii)生存于冲绳岛附近海底约1395米的火山口,发现并报道于1998年。其最适生长温度为摄氏95-105℃,分类上属广古细菌。该菌的完整基因组已测序。1.2糖酵解途径在机体缺氧条件下,葡萄糖经一系列酶促反应生成丙酮酸进而还原生成乳酸的过程称为糖酵解‘亦称糖的无氧氧化。糖酵解途径是指细胞在细胞质中分解葡萄糖生成丙酮酸的过程,此过程中伴有少量ATP的生成。这一过程是在细胞质中进行,不需要氧气,每一反应步骤基本都由特异的酶催化。在缺氧条件下丙酮酸被还原为乳酸,有氧条件下丙酮酸5可进一步氧化分解生成乙酰CoA进入三羧酸循环,生成CO2和H2O。糖酵解总共包括10个连续步骤,均由对应的酶催化。总反应式为:葡萄糖+2ATP+2ADP+2Pi+2NAD+—>2丙酮酸+4ATP+2NADH+2[H]++2H2O1.2.1古细菌的糖酵解途径迄今,对于真核生物与细菌的糖酵解过程已经进行了深入的研究,其糖酵解途径可分为:经典的EM途径与ED途径以及氧化的磷酸戊糖途径。古细菌,作为生命的“第三种形式”,其生理习性、代谢途径、遗传机制等均呈现出不同于真核生物与细菌的特点。研究古细菌的代谢过程不但有可能揭示生命起源的机制,而且对于有效的利用这种微生物以及来自其中的极端酶类等也具有重要的现实意义。古细菌糖酵解的研究在Woese等提出生命三域学说的90年代初开始起步。目前,国际上关于古细菌糖酵解代谢的综述多报道于2005年前,而近年来随着许多新的研究成果的出现,古细菌中心代谢途径已成为极端微生物研究的一个热点领域。与真核生物与细菌不同,古细菌中仅存在EM途径与ED途径,而缺少氧化的磷酸戊糖途径。古细菌EM与ED途径具有与真核生物及细菌经典的EM与ED途径显著不同的特点。这主要体现在:第一,糖酵解过程中的部分路径即经过的中间代谢物转化过程不同;第二,许多新的酶或酶家族催化糖酵解过程中的同一或不同代谢步骤。1.3生物信息学生物信息学中途径的发展背景伴随着人类基因组计划的启动,生物信息学这一新兴交叉学科的蓬勃发展,目前已经产生了大量的以核酸和蛋白质等生物大分子数据库及其相关的文献、资料图书。从1994年开始,《核酸研究》杂志每年第一期是生物数据库专辑。国际上3大核苷酸、蛋白质数据库分别是:美国国家生物技术信息中心(NCBI)的GenBank数据库、欧洲生物信息学研究所(EBI)的核酸序列数据库EMBL和日本信息生物学中心(CIB)的DNA数据库DDBJ。随着生物信息数据库的不断发展,生物信息学的研究方向划分的越来越细致,代谢途径研究则成为其中的一个研究热点。途径作为一条维持生命的分子反应链,不同的生命过程有不同的途径。比如细胞对外界环境变化响应的途径、细胞代谢、凋亡途径和信号途径。一条途径功能的中断可能引起严重的疾病,如癌症。由多条途径整
6合起来可形成蛋白质和基因的调控网络。因此,理解途径是理解细胞过程和细胞过程药物的重要步骤。目前对于途径的研究已经成为一个非常活跃的领域。1.3.1生物信息学的研究领域生物信息学的研究领域包括:(1)大规模基因组测序中的信息分析;(2)大规模基因功能表达谱的分析;(3)序列片段的拼接;(4)新基因和新SNP的发现与鉴定;(5)非编码区信息结构分析;(6)密码起源和生物进化的研究,包括序列相似性比较,序列同源性分析和构建系统进化树。1.3.2主要的生物信息学数据库国际上主要的DNA序列数据库有GenBank、EMBL、DDJB、ESTdb、OMIM、GDB、GSDB等;蛋白质一级结构数据库有SWISS-PROT、PIR、OWL、ISSD、MIPS等;蛋白质二级结构数据库有PROSITE、BLOCKS、PRINTS等;蛋白质和其他生物大分子的三维结构数据库有PDB、NDB、CCSD等;与蛋白质结构分类有关的数据库有SCOP、CATH、FSSP等。1.3.3生物信息学的基本分析方法随着生物信息的急剧增长,如何从浩瀚的数据库中获取有用信息,怎样处理提取的数据,进而从中获得与生物结构、功能相关的信息是一个使理论生物学家感到棘手的难题。借助于计算机科学、信息科学及其它学科的共同参与,人们发展了生物信息的多种分析方法,其中最基本的方法有序列对比、结构对比及功能对比预测法等。(1)序列比对预测法序列比对是以核酸和蛋白质序列为依据,来比较两个或两个以上核酸或蛋白质在碱基(A、T、C、G)、氨基酸(20个氨基酸)水平上的相似性和不相似性。序列比对是生物信息学最基本的分析方法。常用的序列比对方法有两两序列比对和多序列比对。两两序列比对是比较两序列之间的相似性区域和保守位点来寻找两7序列可能存在的历史进化关系。两两序列比对又分为总体序列比对和局部序列比对。两个序列的比对有较成熟的动态规划算法:总体序列比对是以Needleman- Wunsch的算法为理论体系发展的完善的比对方法;当两个序列总体并不很相似,但某些局部片段相似性较高时,Smith-Waterman算法是解决局部比对的好算法,局部序列比对正是以Smith-Waterman动态规则算法为理论依据的比对方法。多序列比对是以两两序列比对为基础,逐步优化两条或多条序列比对结果的方法,其目的是建立两条以上序列可能存在的进化关系。最常见的多序列比对方法有Pileup算法和Clustal W算法。(2)结构比对预测法结构对比的基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性;蛋白质结构预测包括二级和三级结构预测。从方法学上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。以核酸和蛋白质的序列为基础来预测其生物学结构,是生物信息学的核心研究内容。基于核酸序列的预测分析方法就是以核酸序列为基础来分析预测其功能基因的位置。其分析内容常常包括:密码子的偏向、内部重复序列、特殊位点、编码蛋白区和二级结构的预测。(3)功能比对预测法组成蛋白质的氨基酸序列不仅决定着蛋白质的三维结构,而且也决定着它的功能。首先以蛋白质的序列为依据来预测蛋白质的物理性质,如分子量、等电点、亲水性和疏水性、跨膜区域、信号肽和蛋白定位等。蛋白质的功能预测是以目的蛋白为线索力图发现它和功能已知蛋白质的相似性。蛋白质的功能预测主要侧重在序列同源性和功能区序列的保守性。蛋白质二级结构预测有两种策略:以单一序列为基础和以多重序列对齐为依据的分析方法。常用的三级结构预测方法有同源模建和穿针引线算法。1.3.4与生物信息学关系密切的数学领域统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要
8应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;计算数学,如常微分方程数值解法是分子动力学的基本工具;群论,在研究遗传密码和DNA序列的对称性方面有重要应用;组合数学,在分子进化和基因组序列研究中十分有用。原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。1.3.5与生物信息学密切相关的计算机科学技术首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。其它诸如数据整合和可视化、数据挖掘(Data Mining)、基于Unix操作系统的各种软件包以及人工智能,和一些重要算法的复杂性研究。1.3.6生物信息学工业生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。它既属于基础研究,以探索生物学自然学自然规律为己任;又属于应用研究,它的许多研究成果可以较快或立即产业化,成为价值很高的产品。生物信息学的这一特点在现有的许多学科中几乎是独一无二的。这里仅举一个例子来说明生物信息学工业的潜力。据报导,只有50名员工的德国Lion生物信息学公司,将通过扫描公共数据库中的序列来发现500个可能的药物作用靶点,以一亿美元的价格预售给德国Bayer公司。又据报导,生物信息学产业的市场在1998年已经达到10亿美元,而到2002年估计可增长到2000亿美元以上。这是一笔巨大的财富,任何政府的科技决策人都不能对此视而不见。NIH已向美国国会建议投资160亿美元在美国建立5~20个将生物学与计算结合起来的中心。法国议会科技决策评估办公室,最近评估了基因工程、生物信息学和组合化学等学科的应用前景及法国的对策。美国出现了大批的基于生物信息学9的公司,实施了许多生物信息学研究计划,主要与药物设计,基因工程药物,生物芯片,代谢工程与化学工程密切相关。生物信息学工业是知识经济的一个典型,潜力巨大。1.3.7 NCBINCBI是National Center of Biotechnology Information的简称,既美国国立生物技术信息中心,NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。1.3.8 ClustalWClustalW是一种渐进的多序列比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。1.3.9 ClustalX在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。根据相似性分值继续分组比对,直到得到最终比对结果。在比对过程中,相似性程度较高的序列先进行比对而距离较远的序列添加在后面。1.3.10 Swiss-ModelSWISS-MODEL是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。同源建模方法预测蛋白结构一般包含以下四步:①模板选择;②目标序列模板序列比对;③构建模型;④评价。不断重复如上步骤直到找到一个令人满意的模型。SWISS-MODEL开发了几套不同的建模技术。SWISS-MODEL的预测方法可以被描述为以α-螺旋和β-折叠为基础的10 1.3.11 BLASTBLAST(Basic Local Alignment Search Tool)是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。现在常见的BLAST形式有五种,如下图1.3.12 ORF开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。111.3.13 FASTA格式FASTA算法是1985年由Pearson和Lipman提出并在1988年做了进一步改进的双序列比对启发式算法,采用了改进了的Wobir和Lipman算法以集中反映具有显著意义的比对结果。其基本思想是:一个能揭示出真实序列关系的比对至少包含一个两个序列都拥有的字(片段),把查询序列中的所有字编成Hash表,然后在数据库搜索时查询这个Hash表,以检索出可能的匹配,这样那些命中的字就能很快地被鉴定出来。算法过程简单描述为:(1)根据点阵图逻辑,从比对的所有结构中计算出最佳的对角线。(2)使用字符方法寻找查询字符和测试序列之间的精确匹配。(3)当所有的对角线发现之后,通过增加空位来连接对角线。(4)在最佳对角线区域中计算出比对结果。1.3.14序列比对算法评价目前生物信息学领域对于序列比对算法的评价有两个标准,一为算法的运算速度,二为获得最佳比对结果的敏感性。双序列比对中的典型算法Smith-Waterman、BLAST与FASTA,三者比较而言,Smith-Waterman敏感性最强,但算法的复杂度最高,需要在具有极高计算能力的超级计算机上实现。FASTA较mith-Waterman快速而精确性相近。BLAST运算速度最快,但敏感性最差。多序列比对的典型算法主要是Clustal算法,此算法敏感性比较差,但目前在多序列比对中,尚缺乏比之更快速更有效的算法。由此可见,目前序列比对中面临的问题就是如何研究和设计同时能满足高敏感性和高速度的算法。1.4多序列对比多序列对比就是把两条以上可能有系统进化关系的序列进行比对的方法。目前对多序列对比的研究还在不断前进中,现有的大多数算法都基于渐近的比对的思想,在序列两两对比的基础上逐步优化多序列对比的结果。进行多序列比对后可以对比对结果进行进一步处理,例如构建序列模式的profile,将序列聚类构建分子进化树等等。意义在于通过多个相关蛋白质的相似性,了解其在进化上亲缘关系的远近,推断分子起源的进化规律等。同时研究多个序列中的保守区域,就
12可以猜测这些区域对蛋白质结构、功能的重要性,从而进行分子设计。1.5与古细菌糖酵解途径有关的酶类与古细菌糖酵解途径有关的酶主要有(1)ST2037-glycerate kinase 甘油酸激酶(2)ST1212-Enolas 烯醇化酶(3)ST0064- aldehyde dehydrogenase 乙醛脱氢酶(4)ST1302- ribulose-5-phosphate isomerase 5-磷酸核酮糖异构酶(5)ST2268- transketolase 转酮醇酶(6)ST2269- transketolase 转酮醇酶(7)ST2245-Phosphoglucose isomerase 磷酸葡萄糖异构酶(8)ST2484-aldehyde oxidoreductase 乙醛氧化还原酶(9)ST2477- glyceraldehyde-3-phosphate dehydrogenase 甘油醛3磷酸脱氢酶1.6选题的目的与意义13第二章
材料与方法2.1.1 材料各物种与古细菌糖酵解途径有关的酶的基因及蛋白序列从美国国家生物技术中心(NCBI)GenBank下载。以下以烯醇化酶(ST1212)为例阐述方法步骤。2.1.2 方法(1)在NCBI网站(http://www.ncbi.nlm.nih.gov/)上方搜索栏中输入ST2037(如图1)。 图1(2)选择蛋白质序列数据库(Protein:sequence database)。(3)第一个既是ST1212基因在GenBank中的信息。其中ACCESSION:NP_377144为此基因在GenBank中的序列号,ORIGIN表示编码该蛋白的氨基酸序列,为MNDYFRIKKIKGYQILDSRGNKTIRVKIETYGGISETGDAPAGASKG SREAIELRDKDGGVTRAVELVNTLINDSLRDFDVRNQLGIDQTLIRMDGTPNKSRVGGNTTIATSIAVAKTAAKAMGLEIFQYIGGPRVRYLPIPLLNILNGGLHAGNELKIQEFIIIPLSFDSFHEALYAADEVYKQLKGIITEKYGKLYTMLGDEGGVAPPLSKTEDALDLVYTAIKNSGYEDKIVMGIDAASSDFFNGSQYEIDGKKLSPDEMIDYYIQLASRYPLLYIEDPFNENDFERFSILQQKLKKTIVTGDDLFTTNIEYLKKGIEKSSAKGTIVKPNQIGTLSETFEYIEFAKKNSIKIIVSHRSGETEDSFIADLAVGVQSDFIKTGAPARGERTSKYNRLLEIENDYGIEYYGKKIYLLEKVGRVIKTGYTFTNVNNVYVLEVT,ORGANISM为含有该蛋白的物种。(4)点击下方的CDS得到编码该蛋白的DNA序列,为5`-ATGAATGACTATTT CAGAATCAAAAAAATAAAGGGTTACCAGATTCTTGATTCTAGAGGAAATAAAACAATCAGAGTTAAAATCGAGACATATGGAGGAATATCAGAAACTGGTGACGCACCAGCTGGAGCATCAAAGGGTAGTAGAGAGGCGATAGAATTAAGGGACAAAGATGGAGGAGTAACTAGGGCAGTCGAGTTAGTAAATACCTTAATTAACGATTCCTTAAGGGATTTTGATGTAAGGAATCAACTAGGAATTGACCAAACATTGATAAGAATGGATGGAACACCTAATAAGTCAAGAGTAGGCGGAAATACAACTATAGCTACATCAATAGCTGTAGCTAAAACAGCTGCAAAAGCTATGGGGTTAGAAATTTTCCAATACATAGGTGGGCCAAGAGTAAGATATCTGCCAATACCATTATTAAATATTTTAAATGGAGGATTACACGCTGGAAATGAACTAAAAATTCAGGAGTTTATTATAATACCTTTAAGTTTTGACAGCTTTCACGAAGCCTTATATGCTGCCGATGAAGTATACAAGCAGTTAAAGGGAATAATAACAGAAAAATACGGAAAACTTTATACAATGCTAGGAGATGAAGGAGGAGTAGCGCCACCATTATCTAAAACAGAAGACGCATTAGATTTAGTATATACTGCTATAAAGAATTCTGGTTATGAGGATAAGATAGTAATGGGA
14ATAGATGCAGCTTCTTCTGATTTCTTTAACGGAAGTCAATATGAAATAGATGGGAAAAAATTAAGCCCAGATGAGATGATAGATTACTACATCCAATTAGCTTCACGTTATCCGTTATTATATATAGAAGATCCTTTTAACGAGAATGATTTTGAGAGATTTTCTATTTTACAACAGAAGTTAAAGAAAACTATTGTTACTGGAGACGATTTATTTACCACTAACATTGAGTATCTAAAGAAAGGGATAGAGAAAAGTTCTGCTAAAGGTACTATAGTTAAGCCTAATCAAATTGGTACTTTATCAGAGACATTTGAATACATAGAATTTGCGAAGAAAAATTCTATAAAAATAATTGTAAGTCATAGAAGTGGAGAGACAGAAGATTCTTTTATAGCTGATTTAGCTGTTGGAGTACAAAGTGATTTTATAAAGACTGGAGCACCAGCTAGAGGCGAAAGAACTAGTAAATATAATAGATTACTAGAAATAGAAAACGATTATGGAATAGAATATTACGGTAAAAAAATTTATCTTTAA-3`。(5)酶类等电点的查询。登陆expasy(http://www.expasy.ch/)点击右侧的Proteomics and sequence analysis tools,选择等电点、分子量查询(Compute pI/Mw)。然后将(1)步骤中搜索得到的氨基酸序列粘贴到对话框中运行即可得到结果,等电点:5.46;分子量:46304.64。(6)结构域的查询。完成上述步骤(1),选择基因数据库(Gene: gene-centered information),出现如图2所示。 图2点击基因片段选择保守结构域(Conserved Domains),如图3所示,得到其结构域。 图315 图4 图5162.2 结果与讨论2.1同源性blastp搜索登陆NCBI的blast网站(http://blast.ncbi.nlm.nih.gov/Blast.cgi)选择蛋白质blsat(protein blast),将步骤(1)中搜得的氨基酸序列粘贴到对话框中运算,默认所有参数,进行数据库相似性搜索,击中的序列有100条。结果如图2、图3。 图6 图7 172.2用ClustalW做多序列比对选择图7中的五个蛋白,得到其氨基酸序列,用fasta格式粘贴至文本文档。格式如下:>YP_ Sulfolobus acidocaldarius DSM 639MNDRFRIRKLKGYEIIDSRANRTIRVRVETYDGIVGFGDAPAGASKGANEAVELKDKNGRVIDAVELVNTVLSDSLKDYDVRRQRVIDTTLIRLDGTQNKSRIGGNTMIATSIAVLKTASRALGQEYFEYIGGPRAKYIPMPLLNILNGGLHAGNNLKIQEFIIIPKNFDKFTEAIQASIEVYKRLKDLITERYGKIYTALGDEGGFSPPLEKTMDALDLVYTSIKSLGYEDKIFMGMDAAASNFFHESHYELDGKRYTAGELIDYYKQLADMYPLMYIEDPFEENDYDSFSQLQSKLKKTIVTGDDLYVTNIEYLKKGIERMSSKGTIVKPNQIGTITETLDYIDFARRNAVKTIVSHRSGETEDSIIADLAVGTQSEFIKTGAPSRGERTSKYNRLIEIELDYGLEFYGKNFYL>YP_ Sulfolobus islandicus L.S.2.15MINRFSIEKVKGLEIIDSRGNPTIRVFVRTNDGVESFGDAPAGASKGTREAIEVRDENGLTVKRAVDIANYIIDPALHGIDVREQGIIDKILIDIDSTENKSKLGGNTIIATSIAALKTASKALGLEVFKYIAGPRLPKIPIPLLNIINGGLHAGNKLKIQEFIILPIKFNTFKEAFFAAIEVYRNLKGLISERYGKIYTAVGDEGGFSPPLEETREALDLIYTSINNAGYQGKIYMGMDAAASDFYDPKKEKYIIDGKELNPTQLLEFYLDLAKEYPIVYLEDPFEENSFDMFGELQNKLNSTIVTGDDLYTTNIKYLKIGIEKRSTKGVIVKPNQVGTISETFEFTNLARRNSIKLVTSHRSGETEDNFIAEFAVGIESDFIKTGAPARGERTSKYNKLLEIENKFGLEYGGKYFYL>|YP_ cMTMRYNMEDEFSITHVKARWVLDSRGNPTVEAEVRTFAGGYGSAIVPSGASTGTHEALELRDGGKRFHGKGVSKAVENVNKIIAPEILGEDSRKQEEIDSKMISLDGTPNKSRLGANAILSVSLAVAHAAADTYGLPLFQYLGGALASTLPVPLMNIINGGKHAGNELKIQEFLIVPVGASSFSEALAIGSEVYHSLRGYLKEKYGVSAINVGDEGGFAPPMSRTREALDALIHAVKNAGYEPGRDVVLALDAAASEFYDEKRGVYAIDGAELTREKLIEFYESLVEEYPIVSIEDPLYEEDFEGFAEVTRSLKIQVVGDDLFVTNVERLRRGIEAGAANALLLKVNQIGTLTEALSAARMALENNYSVIVS
18HRSGETEDVTISHIAVALNAGQIKTGAPARSERNAKYNELLRIEEYLGGRARYPGIKAFKAYKRTL>YP_Staphylothermus marinus F1MTYTTYTTVLDDMFKIKAVRGRYILDSRGNPTVQVKVVTEGLGVGVAAAPSGASTGIHEAVEVRDGGKEFHGKGVRKAVDNVNTIIAPAITGMDSRRQVEIDYKMIEIDGTENKSRLGGNAIIATSLAVAKAAASTMKIPLYYYIGGKQANILPVPMLNIINGGVHAGNKLDFQEFMIVPAGFNSFHEALRAAVETYHELKRILKEKYGSSAINVGDEGGYAPPLEKIRDALDLLMEAIKSAGYSPGKEIALALDAASSQFYNKEKKVYVVEGRELTRDQMIELYEELVNDYPIVSIEDPLYEEDYDGFAEITKRLGDKVLIVGDDLFTTNPKRLSKGIEVGAANAILVKVNQIGTLTETMEVVRLAHIHNYRTIISHRSGETEDTTIADLAVGLNAGLIKTGAPARGERTAKYNRLLEIEEELEKPMYLGFQLFPRKP>YP_ Campylobacter concisus 13826MVFIEDVEAHEVLDSRGNPTVRATVRLSDGTEASAIVPSGASTGKREALELRDKDDRYAGKGVLKAVSNVNEKIAEAVIGLDAYNQKAVDAEMLELDGTHNYSNLGANAVLGVSMAVARAAAKSLNIPLYRYLGGANASILPVPMFNIINGGAHANNSVDFQEFMIMPFGFSTFSEALRAATEIYHKLKSILNAAGHSTAVGDEGGFAPNLKDNEEPLKLISQAVKEAGYELGSQIKLALDVASSELYKDGKYELEGKKFSSAELISYYEKLCEKYPIFSIEDGLSEDDWSGWAELTKRLGSKVQLVGDDLFVTNEKILREGIEKNIANAILIKPNQIGSVTQTMQTVRLAQRNGYRCIMSHRSGESEDAFIADFAVALNTGEIKTGATSRSERNAKYNRLLEIELEAGEFLGDNI。登陆网页版Clustal W(http://www.ebi.ac.uk/Tools/clustalw2/index.html),将以上内容粘贴至对话框运算,默认参数,得到如下结果。SeqA Name
Score =================================================================================================1
YP_Staphylothermus
YP_Staphylothermus
YP_Staphylothermus
YP_Staphylothermus
55================================================================================================= 用Clustal W得到的多序列对比结果中,所有序列排列在一起,并以特定的符号代表各个位点上的残迹的保守型,―*‖号代表保守性极高的残基位点;―:‖号代表较相似的残基位点;―.‖号代表保守性略低的残基位点。202.3用Clustal X构建生物进化树将ST1212的氨基酸序列连同blastp搜索出的五个相似基因粘贴到文本文档。 用Clustal X计算做进化树如下。 图8 ST1212的进化树从图上可以看出,古细菌ST1212蛋白主要分为两个群,其中ST1212分布于B群,与Sulfolobus islandicus L.S.2.15和Sulfolobus islandicus L.S.2.15聚为一群。2.4用Swiss-Model模拟出该蛋白的结构进入Swiss-Model网站(http://swissmodel.expasy.org//SWISS-MODEL.html),选择左侧目录的First Approach mode,将ST1212蛋白粘贴至对话框中运算得到如图结果。 21
B参考文献[1]
刘波,倪金凤,申玉龙.极端嗜热古菌Pyrococcus horikoshii几丁二糖脱乙酰酶的克隆、表达及性质研究[J].微生物学报.):255–258[2]
张晓东,张传富,彭科峰等.生物信息学数据库研究进展[J].生物信息学,2006,(3):143-145[3]
张成岗,贺福初.生物信息学方法与实践[M].北京:科学出版社,2006[4]
刘蓉,刘军万.生物信息学中途径研究进展[J].生物技术通报.2008,(1),83-87[8]
张敏.生物序列比对算法研究现状与展望[J].大连大学学报,):75-78[6]
张永.生物信息学中的序列比对算法[J].计算机工程应用技术.(06):5-7[7]
曹顺良,张忠平,李荣等.BioDW——一个生物信息学数据集成系统[J].微计算机应用,2005,(1):59-62[8]
蒋彦,王小行,曹毅等.基础生物信息学及应用[M].北京:清华大学出版社,2003[9]
蔡小宁,陈茜,杨平等.磷酸烯醇式丙酮酸羧化酶的生物信息学分析[J].安徽农业科学2008 ,36(3) :914-916[10]
孙志茹,韩涛,杨文.生物信息学科学数据与科学文献的关联关系分析[J].图书情报工作,):88-91[11]
蒋明, 曹家树.白菜花药特异基因BcPRO的克隆及表达分析[J].浙江大学学报(农业与生命科学版),):1-6[12]
谢民主,刘新求.数据库技术在生物信息学中的应用[J]:吉首大学学报(自然科学版),):42-44[13]
陈铭. 整合生物信息学[J].计算机教育 , 2006,(09)[14]
王哲.生物信息学概论[M].北京:第四军医大学出版社,2002[15]
张阳德.生物信息学[M].北京:科技出版社,2004[15]
Schwede T,Kopp J ,Guex N, Peitsch MC. SWISS-MODEL[J].An automated proteinhomology-modeling server.Nucleic Acids Res.):33-35[14]
Peitsch MC,Jongeneel V.3-dimensional model for the CD40 ligand predicts that it is acompact trimer similar to the tumor necrosis factors. Int. Immunol. 5:233-238.[16]
Peitsch MC (1995) ProMod: automated knowledge-based protein modelling tool. PDBQuarterly Newsletter 72:4.[17]
BENSON D A ,KARSCH2MIZRACHI I ,LIPMAN D J ,et al. GenBank :Update [J ] .Nucl.
22Acids Res. , - 26.[18]
KULIKOVA T,ALDEBERT P ,ALTHORPE N ,et al. The EMBL Nucleotide SequenceDatabase [J ] . Nucl. Acids Res. ,-30.[19]
MIYAZAKI S ,SUGAWARA H ,IKEO K,et al.DDBJ in the Stream of Various BiologicalData [J ] . Nucl. Acids Res. ,- 34.[20]
BOECKMANN B ,BAIROCH A ,APWEILER R ,et al. The SWISS2PROT ProteinKnowledgebase and Its Supplement TrEMBL in 2003[J ].Nucl. Acids Res. ,2003 ,31(1) :365 - 370.23致
谢经过半年的忙碌和工作,本次毕业设计已经接近尾声,作为一个本科毕业生,由于经验的匮乏,毕业设计难免有许多考虑不周全的地方。如果没有老师的督促指导,以及一起工作的同学们的帮助支持,想要完成这篇论文是难以想象的。本论文是在导师刘波老师的悉心指导下完成的。导师严谨的治学态度,诲人不倦的高尚师德将积极影响我今后的学习和工作。刘老师平日里工作繁多,但在我做毕业论文的每个阶段,从外出实习到查阅资料,草案的确定和修改,中期检查,后期毕业论文的修改等整个过程中都给予了我悉心的指导。老师渊博的知识、严谨的学风、敏锐的洞察力和对事业孜孜不倦的追求深深地感染着我,将使我受益终生。我在此谨向刘老师表示崇高的敬意和衷心的感谢!本论文的顺利完成,离不开各位老师、同学和朋友的关心和帮助。在论文工作期间,山东轻工业学院食品与生物工程学院的各位老师给予了大力的支持和帮助,在此也向他们表示衷心的感谢。然后还要感谢大学四年来所有的老师,为我们打下专业知识的基础;同时还要感谢同学们的关心和鼓励,正是因为有了你们的帮助和支持,此次毕业设计才会顺利完成。在山东轻工业学院的这段经历,使我学到了很多东西,同时也使我明确了以后努力的方向,我将终生难忘。向评审论文的老师致以深深的感谢!24
古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计 作 者 姓 名 周海昌专 业 生 物 技 术指导教师姓名 刘 波专业技术职务 (目录格式) 目 录(三号、黑体、居中、目录两字空四格、与正文空一行) 摘 要 ………………链霉菌源次级代谢物的产生、分离和结构鉴定 有机化学, 2011, 硕士【摘要】 链霉菌源的次级代谢物是天然产物药物的重要组成部分,所谓次级代谢是微生物在一定的生长时期(一般是稳定生长期),以初级代谢产物为前体,合成一些对微生物的生命活动没有明确功能的…电 化教育研究 nvlHai nanel ot r o d浅谈 生物信 息学教学 中的几点建议① 张 玉 娟 ( 庆师范 大学 生命 科学学 院 重 庆 4 1 3 ) 重 O 1 3摘 要 : 生物 信息 学是 一 门新兴的 学科 。 目前 , 生… 本科课程论文 代谢网络结构特征的生物信息学研究xxx 学 号:xx专 业:xx班 级:xx 论文提交日期 日 代谢网络结构特征的生物信息学研究摘要:作为生物信息学的重要研究内容,近年来代谢网络结构特征方面的研究取得了许多成果。回…就爱阅读网友整理上传,为您提供最全的知识大全,期待您的分享,转载请注明出处。
欢迎转载:
推荐:    }

我要回帖

更多关于 字母组成单词 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信