gcbi怎么进行差异表达基因筛选基因的筛选

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
GCBI文献查询与基因分析.pptx 37页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:150 &&
GCBI文献查询与基因分析
你可能关注的文档:
··········
········
GCBI文献查询与基因分析撰写者:成东林上海其明信息技术有限公司常用连接文献查询:http://www.ncbi.nlm.nih.gov/pubmed/http://www.ncbi.nlm.nih.gov/pubmedhttp://www.ncbi.nlm.nih.gov/pubmed//基因查询:http://www.ncbi.nlm.nih.gov/gene/http://www.ncbi.nlm.nih.gov/genehttp://www.ncbi.nlm.nih.gov/gene//miRNA查询:http://www.mirbase.org/http://www.mirbase.orghttp://www.mirbase.org//lncRNA查询:http://www.noncode.org/http://www.noncode.orghttp://www.noncode.org//样本查询:http://www.ncbi.nlm.nih.gov/gds/http://www.ncbi.nlm.nih.gov/gdshttp://www.ncbi.nlm.nih.gov/gds//IF查询:/sciif.asphttp:///sciif./sciif.asp综合查询:.cn/.cn.cn//论文举例成文思路确定方向确定的方向查询文献展开不确定的因素开展实验文献查询NCBI:内容繁杂,头疼!!Google学术:不翻墙上不去!!怎么解?试试综合查询库.cn/.cn.cn//,更快、更简,更好的选择GCBI文献查询查询关键词DendriticCelldifferentiationandfunctionlncRNASTAT3RNAiChip-seqRNApulldown获取相关文献及基因信息,整理科研思路文献查询.cn/.cn简单易用、一键式搜索文献查询按发表日期、影响因子排序,直接查看更新更高分的文献输入关注基因,无效信息统统让道想看有样本数据的文献,一点鼠标,即刻呈现文献查询这么多有样本的文献,同时也是我关注的文献,这些样本能否为我所用??我们一起来试一试!!关注文献中的样本处理这个编号好熟悉,去NCBI下数据!这篇文章我很关注,且有这么多的样本!对于我的研究很有帮助,要好好利用?关注文献中的样本处理你out了,GEO数据库下下来你能直接用吗?一堆原始数据看得懂吗?接下来看我的关注文献中的样本处理.cn/.cn关注文献中的样本处理发送到我的实验室去看看?实验室是什么?赶紧去注册一个账号玩玩吧!.cn/.cn关注文献中的样本处理看看它在实验室里能发生什么GC-Lab?GC-Lab是什么?对生物数据进行信息学解读,你可以在线自己操作的实验室GC-Lab能做什么?设计具有可行性逻辑的思路对样本数据进行分析,想怎么玩就这么玩结果报告导出,为我所用GC-Lab数据处理中心GC-lab怎么用?创建个人实验室、加入别人实验室GSE28490样本:ninehumanimmunecellsubsets(neutrophils,eosinophils,monocytes,Bcells,NKcells,CD4Tcells,CD8Tcells,mDCsandpDCs)目的:identifycell-typespecificmRNA检测平台:AffymetrixHumanGenomeU133Plus2.0Array结果GC-Lab分析思路设计创建、编辑项目GC-Lab分析思路设计简便的方案设计,一键运行剩下的事交给实验室差异及聚类结果对运算结果不满意,参数任你调GC-Lab分析思路设计想看看差异表达基因参与那些功能、通路?小case,添加两个节点轻松帮你解决!GC-Lab本地数据上传对已有检测样本数据直接选择样本数据上传文献数据处理了,我的实验室数据还在本地呢!!放心,让你数据挖掘不求人实验数据Science实验数据处理样本编号说明GSM1308838human_monocytes_0dayinDCcultureGSM1308839human_cells_1dayinDCcultureGSM1308840human_cell
正在加载中,请稍后...关注今日:10 | 主题:190214
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【其他】差异基因筛选方法
页码直达:
这个帖子发布于2年零42天前,其中的信息可能已发生改变或有所发展。
大家拿到基因数据,一头雾水不知如何下手,别急,咱们从差异基因筛选开始,一步步掀开数据分析的那层神秘面纱!本文特别感谢GCBI算法工程师DoctorWang的倾情解答!对于基因的差异表达分析,能够发现一组在正常样本和患病样本中表达不同的基因,这为生物工作者进行实验验证提供了较好的候选基因。通常的检测是对两种不同实验条件下的差异基因表达的问题进行模式化,一种检验对应一种基因,如果基因的表达值是零假设,那么它是无差异的。差异基因的筛选方法有很多,最简单的是阈值法,用倍数分析基因表达水平差异,即计算基因在两个条件下表达水平的比值,确定比值的阈值,将绝对值大于此阈值的基因判断为差异基因。另外还有些方法包括统计学的T检验法和SAM等方法。倍数变化法倍数变化法(Foldchange),计算患病组和正常组的表达值的差异倍数,是用于检测差异表达基因的最基本的方法,由于其简单,易理解和不错的实验结果,使得其成为差异表达直观分析的首要选择。整体而言,FoldChange 方法在探测差异表达基因时,能够直接的得到差异变化值,因此在与差异表达绝对值相关的研究时具有优势。但是其较难选定其所需的阈值,在缺少假阳性的控制的情况下,其检测的基因假阳性结果比率相对较高。T检验法T-test 检验是差异基因表达检测中常用的统计方法,通过合并样本间可变的数据,来评价差异表达,用于判断某一基因在两个样本中是否有差异表达。由于芯片实验成本较高,样本量较少,从而对总体方差的估计不很准确,T检验的检验效能降低。SAM算法SAM算法就是通过控制FDR值纠正多重假设检验中的假阳性率。SAM方法检验差异表达,通过对分母增加一个常量T 检验过程减小了假阳性发生的概率。根据文献记载,相比较其他算法,SAM算法更为稳定,筛选出的结果也更为准确。SAM方法以q-value&0.05作为筛选差异表达基因的标准,从公式上来看,p-value和q-value较为相似,而差异筛选是一个典型的多重假设检验过程。对于多重假设检验,单次检验中差异显著基因的假阳性率(p-value较小)可能会较大,而q-value和FDR值较常见的BH校正方法得到的FDR值而言,改进了其对假阳性估计的保守性。其实什么算法、软件好烦人,还是GCBI简单方便,导入数据-设置参数-运行,分分钟拿到结果。为了得到可验证性的高质量差异结果,GCBI实验室推荐每个分组(Each Group)的样本数不少于3,当样本重复数少于3个使用倍数法,样本重复数大于等于3使用SAM法。前方高能请注意:1、如何设置参数?答:在GCBI进行差异筛选,通过选择(q-value/差异倍数、差异数量)和设置差异参数,筛选样本中的差异基因。(1) q-value越高,筛选出差异基因越多。q-value=0.05认为结果良好,可根据具体情况适当调整。(2) 差异倍数常用:1.2、1.5、2,其中1.5最常用。2、为什么GCBI采用q-value过滤差异结果?q-value较FDR有哪些好处?答:差异筛选是一个典型的多重假设检验过程。对于多重假设检验,单次检验中差异显著基因(p-value较小)的假阳性率可能会较大,而我们期望得到具有高可验证性的合适数量的差异结果,那么q-value或FDR更合适于用来过滤差异结果。FDR值与q-value都是用来衡量多重检验中的误判率的,而q-value较常见的BH校正方法得到的FDR值而言,改进了其对假阳性估计的保守性,即q-value一般会较FDR更低,从而提高了部分差异分析的可行性。3、差异基因数量太多或太少,怎么办?答:可以在适当范围内调整参数设定,可参考下一个问题。4、当q-value大于0.05还有意义吗?答:从q-value的定义与意义可知,q-value衡量地是某个基因假阳性的概率。显然如果q-value越低,那么挑选该基因出现假阳性的概率就越低,可验证性就越高。也就是说q-value从概率的角度对差异的结果进行了一个整体的可验证性判断,所以在差异很大的情形下,我们可以适当地减小q-value的过滤阈值,而在差异较小的情况下,我们完全可以适当增大q-value的过滤阈值。对于差异较小的情况,q-value大于0.05仍然具有意义,如q-value=0.3,就是说这个基因30%的可能性出现假阳性,即它的可验证性的概率(70%)仍然远高于不可验证性(30%)。5、为什么有些差异分析结果中的q-value全部相等?答:说明差异结果从假阳性方面看具有一致性,即使存在某些基因的p-value较小,但是其假阳性的概率与其他基因一致,就是说其验证差异的风险几乎相同。如果结果的q-value较大,那么说明输入的基因数据整体的差异不大,这种情形我们推荐采用合适的差异基因总数(即控制Rank值或dScore值)或者控制q-value来得到期望的可行性结果;如果得到的q-value较小,说明差异较大,可以通过更加严格的q-value或者差异倍数过滤来得到合理的差异结果。6、为什么有时候通过调整q-value进行差异基因过滤,而差异结果没有变化?答:一般来讲,我们首先建议用户对默认参数的结果进行查看(通过数据栏查看),通过对结果的预览做到“心中有数”,然后有针对性的进行q-value调整或差异总数的调整。举例来讲,如q-value变化区间较大时,通过微调可能就达不到预期结果;如果q-value全部相等(见Q5),那么过前端调整q-value的方法来过滤基因将不再会有效果。7、基因差异倍数大于2才是有意义的?答:对于1vs1样本,差异倍数大于2是一个较好的先验选择,但仍然不满足部分差异过大结果的分析要求。在样本数较多的条件下,判断一个基因是否有差异,不单单是通过差异倍数来判断,而是结合其他统计学参数(如p-value、q-value)来判断。8、为什么GeneSymbol的有些单元格时空白的?答:因为这段序列在NCBI上是没有正式基因名,可以通过查找结果中的Accession列中的编号,来得到该序列的信息。更多关于功能通路分析、网络分析的内容,请注意订阅号以后的文章推送。
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
谢谢,很厉害!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
王建勇 谢谢,很厉害! 嘿嘿
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
请问一下GCBI上传的文件格式是怎样的
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
陈婷姗在师大 请问一下GCBI上传的文件格式是怎样的
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
陈婷姗在师大 请问一下GCBI上传的文件格式是怎样的现在支持的格式是.cel
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
不服不行啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
什么时候不要钱啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园一文掌握GO和pathway分析
我的图书馆
一文掌握GO和pathway分析
上次1分钟系列介绍了差异基因结果解读,那如何从众多差异基因中筛选出目标基因呢?下面小编以一篇文章为例,来看看如何缩小差异基因范围,使目标基因挑选更有针对性。 文章案例 Identification of a novel biomarker, SEMA5A, for non-small cell lung carcinoma in nonsmoking women相关基因:&&&SEMA5A相关疾病 :&&&Carcinoma, Non-Small-Cell & & & L&Lung NeoplasmsPMID:
& & & & & &&影响因子&3.622&GEO 相关样本:&120文章作者使用Affymetrix U133plus2.0芯片检测了台湾地区非吸烟肺癌女性患者60对癌症和癌旁肺组织样本,利用配对T检验筛选了肿瘤组织中687个差异表达基因,并利用逆转录PCR和免疫组化进行了验证。如何将687个差异基因缩小范围呢?我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类群和代谢通路。文章作者利用IPA(Ingenuity Pathway Analysis)软件对差异基因进行了功能分析,筛选出了16条显著性代谢通路。在最显著的三条通路中,其中两条都和轴突导向信号通路(axon guidance)相关,作者很意外,于是选择了轴突导向信号通路,并在其中挑选了差异表达倍数最高的SEMA5A基因作为后续的研究对象。作者最后利用kaplan-Meier生存分析证明了SEMA5A基因的低表达和非吸烟女性肺癌的低生存率有关联,其可能成为非小细胞肺癌预后的一个有效的生物标志物,也可能代表台湾地区病人的性别特异性。归纳一下作者的整体思路,先找差异基因,并通过功能分析进一步缩小差异基因的范围,再从中有针对性的挑选基因。& & & & &&在差异基因的功能分析中,主要有GO功能分析和pathway分析,上面案例作者主要用了pathway分析。 名词解释 GOGO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行了简单注释。通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。PathwayPathway指代谢通路,对差异基因进行pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。&GO分析好比是将基因分门别类放入一个个功能类群,而pathway则是将基因一个个具体放到代谢网络中的指定位置。 文章分析结果 小编利用上述案例中的数据GSE19804&在GCBI在线实验室首先进行差异分析(|fold change|>2, P值将差异基因分别进行GO(P值和pathway分析(P值,富集得到351个GO term和110条pathway。结果如下图所示,表一和表二分别为部分GO富集结果和最显著的15条pathway分析结果。结果怎么看呢?表头的各个参数解释如下,其中,重点看三个指标, enrichment score、p值和FDR。Pathway分析主要看P值和FDR值,两者越小越好。GO分析还可看enrichment score,数值越大表示某个GO term越容易受到实验因素的影响。GO和pathway分析结果中都得到了文章中选定的axon guidance这个结果(红框)。如何定位到基因呢?将axon guidance通路中的所有差异表达基因全部挑选出来,列表如下。作者在文中挑选了显著性最高的SEMA5A作为后续的研究对象。在我们的分析中,当p值小于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。Ps:因参数设置和文章中不同,结果仅供参考。 教程:GO和pathway分析 目前有许多GO和pathway分析软件,GO分析软件有Avadis&(商业软件)、BiNGO(开源java)、DAVID(基于web的工具)等,pathway分析有IPA和MetaCore(商业软件)等。但这些软件学习成本高,且许多都是商业软件。有没有一种分析方法无门槛,直接上手就可以搞定的呢?GCBI平台, 伸手党的福音,生信分析方法直接加载了模块,你需要做的只是创建方案,拖动模块,单击运行即可。小编用样本GSE19804演示一下,倒数10min,GO富集分析,pathway分析全搞定。★&进入GCBI的在线实验室&.cn(需注册才能使用)建立项目——方案在方案界面,拖动模块,修改名字和参数,并用连接线将模块连接成一个方案,小编建立了如下差异分析和GO和pathway分析方案。选择样本数据样本数据GSE19804&直接来自于GCBI样本库,将样本发送到在线实验室。点击方案中样本模块,在样本分组管理中选择配对样本,配对好相应的对照组和实验组样。Lung normal **N为对照组,Lung cancer **T为实验组。&设置各模块参数差异分析&|fold change|>1.2&P值GO分析&分析类型 生物功能分析&p值Pathway分析p值(以上参数为建议值,仅供参考)运行方案点击运行,分析好后点击查看结果或下载结果即可。是不是毫无压力?下次课程我们将分享如何用通路网络分析来挑选核心pathway,敬请期待。& 附录 文献技术及参数:1、检测手段手:GeneChip Human Genome U133 Plus2.0 expression arrays (Affymetrix, Inc.)2、差异筛选:配对t检验 &(P3、pathway分析:IPA软件 费希尔精确检验(fisher’s exact test)P&检测工具选择可使用其他检测工具GeneChip?Human Gene2.0 arrays[VZ5]&GeneChip? Human Transcriptome Array 2.0(推荐)(查看芯片资料点原文链接)拓展知识点
TA的最新馆藏[转]&[转]&找基因的全步骤_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
找基因的全步骤
上传于|0|0|文档简介
&&测SNP前的位点确定,到后面的书库处理
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢}

我要回帖

更多关于 gcbi学院 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信