生物统计学,如何理解吸烟与肺癌的关系在一定程度上具有相关性

尽管如此,医学研究所生物统计学部门和皇家统计学社的希拉伯德教授就表示要谨慎对待。
Even so, Professor Sheila Bird of the MRC's biostatistics unit and the Royal Statistical Society, sounds a cautious note.
“只有这样人们才能正襟危坐地正视一个问题”StevenGoodman说道,他是霍普金斯大学肿瘤、儿科、流行病学、生物统计学的教授。
“It took that to make people sit up and take notice, ” said Dr. Steven Goodman, professor of oncology, pediatrics, epidemiology and biostatistics at Johns Hopkins University.
《城市环境下邻里、日常活动与健康风险度量》,卢克·A·巴斯塔等,宾夕法尼亚大学生物统计学与流行病学系
Neighborhoods, daily activities, and measuring health risks experienced in urban environments
应用生物统计学的方法,对7个供试平菇菌株的菌丝体生长速度与子实体产量进行了相关性分析。
The correlation between the mycelium growth rate and the fruiting body yield of 7 strains tested of Pleurotus was analyzed by the method of biological statistics.
Launer是资深研究员,也是国家老年流行病学、人口统计学、生物统计学实验室的神经流行病学部门的主管。
Launer is a senior investigator and the chief of the Neuroepidemiology Sectionat the National Institute on Aging's Laboratory of Epidemiology, Demography, and Biometry.
用生物统计学方法,对春小麦早熟性的遗传规律进行了研究。
We studied the genetic law of prematurity in spring wheat by using biostatistics method.
结论:在这项研究中大多数的住院医生都缺乏对于理解发表的临床研究结果所需的生物统计学知识。
Conclusions Most residents in this study lacked the knowledge in biostatistics needed to interpret many of the results in published clinical research.
在研究生医疗机构中教授生物统计学和流行病学:我们是否在正确的方向?
Teaching biostatistics and epidemiology in a postgraduate medical institution: are we going in the right direction?
指纹成像是一种名为“生物统计学”的相对较新的技术的组成部分,该技术通过个人的生物学特征识别身份。
Finger imaging is part of a relatively new technology called "biometrics", which identifies people by using their individual biological traits.
然而,创立一门崭新的生物统计学乃是一项艰巨的任务。
Establishing a new biometric, however, is a huge task.
虽然个人可以获取受人尊敬的大学校园生物统计学学士学位,这仅仅是开始。
Although an individual can earn a BS in Biostatistics at a number of well respected college campuses, this is just the beginning.
生物统计学介绍:第一部分。
Introduction to biostatistics: Part 1.
本发明允许进行活组织鉴别和生物统计学认证。
The present invention enables living-tissue discrimination as well as biometric authentication.
根据检测 的模式执行生物统计学认证。
Then, biometric authentication is performed based upon the detected pattern.
因此,借助英国英国工程与自然科学研究委员会提供的研究基金,Beeby的团队正在探索耳身发射的模式能否用于生物统计学,例如虹膜扫描或者指纹学等等。
So with funding from the UK's Engineering and Physical Sciences Research Council, Beeby's team is attempting to work out if OAE patterns can be used in biometry, like iris scans or fingerprints.
然后存储在卡中的生物统计学信息和出示安全许可卡的个人的生物统计学信息进行比较,以便验证卡的持有者是否是卡拥有者。
The biometric stored in the card is then compared with the biometric of the individual presenting the security clearance card to verify that the holder of the card is the owner of the card.
然后读卡器元件能够读出存储在安全许可卡上的加密数据的至少一部分,并接收来自个人的至少一个生物统计学信息。
Reader elements are then capable of reading at least a portion of the encrypted data stored on the security clearance card, and receiving at least one biometric from an individual.
生物统计学多媒体教学必须在教师的精心准备和学生的积极参与下才能获得预期的效果。
Practice has justified that better teaching effects can be obtained only by relying on the teacher's careful preparation and students' active joining in the biostatistics teaching.
在分子生物学和生物统计学领域中具有很强背景的一个生物信息学专家被雇用。
A Bioinformatics Specialist with a strong background in the fields of Molecular Biology and Biostatistics was hired.
这种技术被称为“生物统计学接口技术”,它也许会给人一种侵犯个人隐私的感觉,但人们期望它能加快顾客结账的速度,并防止利用假身份进行欺诈。
Biometric access, as the process is called, might have a Big Brother feeling, but it is expected to speed customer checkout and cut identity fraud.
自举法随机重抽样数据阐发是掩护生物学的重要组成部分,也是生物盘算机工程和生物统计学领域的热门研究课题。
The bootstrap resampling method is very important in Conservational Biology. And it is still concerned by the scientists in the fields of Biostatistics and Computational Biology.
生物统计学、心理测验学、计量经济学等一大批应用数学专业学科的出现,大大加强了数学和生命科学之间的联系。
The bond between mathematics and the life sciences has been strengthened by the emergence of a whole group of applied mathematics specialities, such as biometrics, psychometrics , and econometrics.
例如,生物统计学可能需要非常熟悉的临床研究分析。
For instance, a biostatics assignment might need someone who is very familiar with clinical study analyses.
在过去几年内,各种不同的生物统计学系统已经被发展克服这些缺点。
Over the past few years, various biometric systems have been developed to overcome these disadvantages.
学科课程包括生物统计学,健康研究的计算机应用,临床试验方法和相关科目。
The program is likely to include courses in biostatistics, computer applications for health research, clinical trial methodology, and related subjects.
在生物统计学方面的指导课已经成为一个有声望的怀利杂志,在医学(西姆)方面的统计的受欢迎的特徵。
The Tutorials in Biostatistics have become a very popular feature of the prestigious Wiley journal, Statistics in Medicine (SIM).
文章介绍了利用学校现有的校园局域网,构建生物统计学网络教学平台的关键技术和主要功能模块。
This paper introduces the key technologies and main modules of biostatistics network teaching platform based on campus regional network.
文章介绍了利用学校现有的校园局域网,构建生物统计学网络教学平台的关键技术和主要功能模块。
This paper introduces the key technologies and main modules of biostatistics network teaching platform based on campus regional network.
$firstVoiceSent
- 来自原声例句
请问您想要如何调整此模块?
感谢您的反馈,我们会尽快进行适当修改!
请问您想要如何调整此模块?
感谢您的反馈,我们会尽快进行适当修改!君,已阅读到文档的结尾了呢~~
广告剩余8秒
文档加载中
第1章__概论_ 生物统计学
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
第1章__概论_ 生物统计学
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口【图文】7第八章医学统计方法概述_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
7第八章医学统计方法概述
上传于||文档简介
&&统​计
大小:164.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢生物统计学 第一章 绪论21sj2006_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
生物统计学 第一章 绪论21sj2006
上传于||文档简介
&&生​物​统​计​学​,​一​整​本​书​的​都​有​,​其​他​的​在​我​空​间​的​文​库​里​,​有​需​要​的​可​以​去​光​顾​光​顾​,​是​我​从​淘​宝​网​买​的​,​希​望​看​了​后​能​够​喜​欢
大小:214.00KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢概率论与数理统计第16讲(夜大)
样本及抽样分布
一、什么是数理统计学
当我们用试验或观察的方法研究一个问题时,首先要通过适当的观察或试验以取得必要的数据,然后就是对所得数据进行分析,以对所提问题作出尽可能正确的结论,为什么说“尽可能正确”呢?因为数据一般总是带有随机性的误差。这里所说的数据误差,主要是指由于观察和试验所及,一般只能是所研究的事物的一部分,而究竟是哪部分则是随机的。例如师大学生身高问题,你从中抽出50人来研究,抽取的结果不同,所得数据就不同,这完全凭机会而定。我们说的随机误差重要是指这个来说的。由于数据带有这样的随机性,通过分析这些数据而作出的结论,也就难保其不出错了。分析方法的要旨,就在于使可能产生的错误越小越好,发生错误的机会越小越好,这就需要使用概率论的工具。
数理统计学就是这样一门学科:它使用概率论和数学的方法,研究怎样收集带有随机误差的数据,并在设定的模型(称为统计模型)之下,对这种数据进行分析(称为统计分析),以对所研究的问题作出推断(称为统计推断)。
例:某工厂生产大批电子元件。我们有理由认为假定元件的寿命服从指数分布,现在考虑:
1、元件的平均寿命如何?
2、如果你是使用单位,要求平均寿命能达到某个指定的数L,例如5000小时,问这批元件可否被接受?
在此,“元件寿命服从指数分布”提供了一个数学模型,即本问题的统计模型。如果你知道了该分布中参数?的值,那么上面的两个问题就解决了。但在实际当中?往往未知,于是我们就只好从这一批元件中随机抽出若干个,例如n个,并测其寿命分别为X1,?,Xn,这n个元件如何选取?主要是要保证这大批元件中,每一件有同等的机会被抽取,这并不容易,需要想一些办法(这不是我们这本教材讨论的内容)。
有了X1,?,Xn后,一个自然的想法是:用其算术平均值X?1?X1???Xn?去估计n
未知的平均寿命?。当然,X不一定等于?。但在实际问题中,我们不会也不可能要求所做的估计一丝不差。但是误差可能有多大?产生指定大小的误差的机会(概率)有多大?为了使这概率降至指定的限度(如0。1),抽出的元件个数n应到多少(n越大越精确)?这些问题的解决方法及有关理论,就是数理统计学的内容。
本例提出的第一个问题称为参数估计问题,因为?是元件寿命中一个未知的参数,而我们的问题是要估计参数本身(当然也可以是关于?的一个函数)。参数估计是最重要的统计问题之一。
现在来考虑第二个问题。可能认为:至少就本例而言,解决了第一个问题也就解决了第二个问题,因为,既然用X去估计平均寿命,那就看X是否小于指定的数L。若X?L,则接受这批产品,否则就不接受。
应当说,这是一个可以考虑的办法。但还应注意到,因为X估计平均寿命有误差,我们的根据实际需要进行一定的调整。即把接受的准则定为X?L1,L1是某个选定的值,可
以大于、小于或等于L。L1定的大些,表示我们检验更严格,这在对元件质量要求很高且供货渠道较多时可能是适当的。反之,L1定得小些,表示检验更宽,这在对元件质量要求不高或急需这些元件而供货渠道很少时,也可能采取。从统计上说,无论你怎么定L1,理论上你都可能犯两种错误之一:一是元件平均寿命达到需求而被你拒绝了,一是元件平均寿命达不道需求而被你接受了。这两种错误各有一定的规律,它们在很大程度上决定了接受准则 X?L1中L1的选择。
第二个问题与第一个问题不同:它不是要求对分布中的未知参数作出估计,而是要在两个决定(就本问题而言是拒绝还是接受)中选择一个。这类问题称为假设检验问题,也是最重要的统计问题之一。
我们主要介绍这两种统计问题。
关于数理统计学,我们补充两点说明。
一、统计学是一门实用性很强的科学,其生命力和发展动力,在于它与实用学科之间的密切联系。割断了这种联系,统计学就会变成无源之水、无本之木,产生不出有意义的问题和方法。因此,统计学与其他学科和领域所形成的边缘交叉学科也很多,如工业统计学、农业统计学,生物统计学,医药统计学,可靠性统计与生存分析,人口统计学,数量经济学等等。
从统计学家本身而言,为了更有效地将统计学方法应用于某一领域,有必要对该领域有关知识有一定的了解。在某种程度上,用统计学方法解决问题好比医生给病人治病。好的医生要根据实际情况灵活地使用他的专业知识,并具备丰富的实践经验。从这个角度看,虽然不能讲统计学本身是一门艺术,但可以说,在一定程度上,统计学方法的有效使用是一门艺术。正因为此,《不列颠百科全书》对统计学下的定义:“统计学是关于收集和分析数据的科学和艺术”。但同样,它也带来了一定的负面作用。但要说明,这种负面因素,并非出自方法本身,而是由于方法的不当使用。
有人说:“什么是统计学家?统计学家是一群骗子,他们可以用数据证明任何想要证明的事情”。这是指的对统计方法的滥用,如“官出数字,数字出官”,即使不伪造数据,只要通过有偏向地采取数据,也可以引导出所想要的结果。如医药宣传广告等。
二、统计规律与因果关系。一个最著名的例子就是吸烟与肺癌的关系。早在1948――1949年,英国的两位学者多尔和希尔就研究过此问题,自那时起他们发表了一系列报告,采集了大量的数据,经过统计分析,发现吸烟与患肺癌呈明显的正相关(即吸烟促进肺癌)。自那时以来,类似的统计资料发表了不少,几乎全部证实了二者有正相关的说法。这个说法现在已经深入人心。实际上这个正相关的结论是一个统计性的结论,或把它称为统计规律也可以。那么,统计规律有什么特点,怎样理解它的含义呢?
首先,统计规律是关于群体的规律。对群体中的个体,情况复杂多样,没有一定。拿上面的例子来说,有吸烟很多而终生保持健康者,也有不吸烟而很早就患肺癌者,但不能用这类个别的例子来否定二者有正相关的结论。
可能会有同学有疑问:群体是抽象的,每件事都必须落到其中的个体身上,患不患肺癌是每个人的事,这样一种关于群体中的趋势的规律有什么意义呢?对此可以这样理解:第一,这种规律反映了某种客观存在的事实,有科学意义和认识意义。本例就表明在抽烟的人群中,患肺癌人数的百分比,要高于不抽烟人群中的百分比,且这百分比还随着抽烟量的增加而上升。这个认识就很有实际意义。第二,对个人而言,有警戒的作用。
“统计规律”这个提法的启示是:教我们看问题不可绝对化,因而有思想方法上的教育意义。习惯于从统计规律看问题的人思想上不拘执一端:他既认识到一种事物从总的方面看有其一定的规律在,也承认存在例外的个案,二者看似矛盾,却是并行不悖,它反映了我们生活在其中的世界的多样性和复杂性。这说起来不过是一个简单的常识,但并非每一个人都能习惯于这种思维方式,使其成为一种本能。常听见这种争论:当甲提出某种说法时,乙就指出一个反例,证明其所说不实。统计学家对此的看法是:甲的说法可能是一个统计性的规律,它需要大量的统计资料的证明或证伪,乙指出的个别反例不一定能构成否定甲的说法的充分理由。
其次,统计方法只是从事物的外在数量表现上去研究问题,通过对数据的分析,揭示可能有某种规律性的东西存在,而不涉及事物质的规定性。换句话说,统计分析的结果可以告诉你,从观察和试验资料来看事情是怎样的,而不能告诉你为什么会这样。拿吸烟与肺癌的关系来说,统计分析不能告诉你为什么吸烟是患肺癌的危险因子,那是要由医学家去研究的问题。所以可以这样来形容统计规律:“知其然而不知其所以然”。就这一点而言也是有意义的,有时我们只知其然就可以了,如中药偏方、配方和治疗方法等;有时可以启发我们进行进一步的研究,并最终揭示内在的规律。许多重大发现,都是先通过观察或试验积累数据,在统计分析基础之上取得的。
通过表面上的数量关系的分析,而导致科学重大发现的一个著名的例子,是孟德尔遗传定律的发现。而对现代生命科学有决定性影响的基因学说的提出,就是建立在这个发现的基础之上的。孟德尔是奥地利生物学家,他的上述成果发表在1865年的一篇论文中。他用豌豆做试验,这种豆有黄绿两种颜色,孟德尔分别培养了一个黄色的纯系和一个绿色的纯系,其每一代所结的豌豆全部保持同一种颜色。孟德尔将这两个纯系进行杂交,发现这种杂交品种的豌豆全是黄色,看上去与黄色纯系并无不同,但在将这种杂交品种再进行一次杂交时,孟德尔发现这第二代杂交豌豆的颜色黄绿都有,其比例接近3:1。孟德尔将这个试验重复了很多次,每次都得到类似的结果。
如果他将这项工作进行到此为止,则这个3:1的统计规律也可以算是一项科学发现,但意义毕竟有限了。但这个表面上的统计规律启发了孟德尔去着手提出一种假说来解释这个现象。具体说,他假定有一种后来被称为“基因”的物质控制着豌豆的颜色,这中物质有两个状态(被称为等位基因)Y(黄)和G(绿),共组成YY,YG,GY,GG4种配合,称为基因型。前3种配合,既其中至少有一个Y的,就使豌豆呈黄色,只有第4种使豌豆呈绿色(遗传学上称Y为显性的,G为隐性的)。根据这个假说,孟德尔的试验结果就得到了圆满的解释。杂交第一代只有只有YG一种可能的基因型,但第2代杂交YG―YG,共有4种等可能的基因型,使得黄色豌豆与绿色豌豆数量之比为3:1。
最后再说明一点。统计之间的关联性(相关性)并非指的就是确定的因果关系(谁因谁果),这还需要进一步的研究。最有名的例子,恐怕要算前面讨论过吸烟与肺癌的关联问题。根据多尔和希尔的报告,《英国医学杂志》于日发表社论,肯定了吸烟对健康的损害作用,并认为有必要在公众中广为宣传此事。这招致了当时英国也是世界上最著名的统计学家和遗传学家费舍的质疑。费舍是20世纪现代统计学的主要奠基人,现在仍在使用的一大批重要的统计方法就是由他提出的。他因为在科学研究上的卓越贡献,于1929年被授予爵士称号,他的质疑当然非同小可。在两年间,他为此与一些人卷入了一场论战,论战是以在《英国医学杂志》上发表信件的形式进行的。
费舍从多尔―希尔数据的分析中,发现了一件有些出人意料的事:在吸烟者中,把烟吸入肺里者,其患肺癌的危险性,显著低于那些不把烟吸入肺里者。如果烟真的对肺有害,那么将烟吸入肺里者危险性理应更大,这是一个与“二者有因果关系”的论断矛盾之处。
这还不是费舍的主要质疑之处。他对吸烟与患肺癌的关联提出了一种可能的解释:二者
可能受到同一基因的控制,即某些人有一种基因,它同时注定了这些人:(1)爱抽烟;(2)易得肺癌。如果这一解释成立,则吸烟与否并不增加或减少得肺癌的危险,人们也就不必为此而戒烟。可见这并不是一个纯粹学究式的问题,而是有其巨大的现实意义。由于取样的困难,费舍也未能找到支持上述论点的充分证据。可以说,此问题在科学上讲至今仍悬而未决,不过大多数人包括医学家都倾向与相信吸烟确是导致肺癌的一个危险因子。
应当指出的是:统计规律未必含因果关系,这一点,是统计方法的本性而非其缺陷。寻找因果关系是各类专门学科的任务。
在数理统计中,将随机试验全部可能的观察值称为总体,或者说,将所研究的问题有关的对象的全体所构成的集合称为总体。而这里每一个观察值或者对象称为个体。如前面例子中“一大批元件”就是总体,而每一个元件就是个体。总体中所包含的个体的个数称为总体的容量。容量有限的称为有限总体,容量无限的称为无限总体。
在购买元件的例子中,我们关心的是元件的寿命,因而总体实际上就是一堆数,每一个数代表某一个元件的寿命。所以我们可以用指数分布来描述这个总体。也就是说,总体中每一个个体可以看作为随机试验的观察值,因此可以看成是某一随机变量X的值。这样,一个总体就对应于一个随机变量X。我们对总体的研究就是对一个随机变量X的研究,X的分布函数和数字特征就称为总体的分布函数和数字特征。今后我们将不区分总体与相应的随机变量,统一称为总体X。
在实际中,总体的分布一般是未知的,或只知道它具有某种形式而其中包含着未知参数。在数理统计中,人们都是通过从总体中抽取一部分个体,根据获得的数据来对总体分布进行推断的。被抽出的部分个体称为总体的一个样本。
所谓从总体抽取一个个体,就是对总体X进行一次观察并记录其结果。我们在相同的条件下对总体X进行n次重复的、独立的观察。将n次观察结果按试验的次序记为X1,?,Xn。而每一个观察结果也是一个随机变量。由于X1,?,Xn是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,所以有理由认为X1,?,Xn是相互独立的,且都是与X具有相同分布的随机变量。这样得到的X1,?,Xn,称为来自总体的一个简单随机样本,n称为这个样本的容量。以后如无特殊说明,所提到的样本都是指简单随机样本。
当n次观察一经完成,我们就得到一组实数x1,?,xn,它们依次是随机变量X1,?,Xn的观察值,称为样本值。
对于有限总体,采用放回抽样就能得到简单随机样本,但放回抽样使用起来不方便,当个体的总数N比要得到的样本的容量n大得多时,在实际中可将不放回抽样近似当做放回抽样来处理。
至于无限总体,因抽取一个个体不影响它的分布,所以总是用不放回抽样。
综上所述,我们给出如下定义:
定义:设X是具有分布函数F的随机变量,若X1,?,Xn是具有同一分布函数F的、相互独立的随机变量,则乘X1,?,Xn为从分布函数F(或总体F、或总体X)得到的容量为n}

我要回帖

更多关于 吸烟 肺癌 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信