统计学原理考试题2017η等于多少

君,已阅读到文档的结尾了呢~~
广告剩余8秒
文档加载中
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
统计学原理_答案
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口《统计学符号读法》_优秀范文十篇 www.fanwen99.cn
优秀范文《统计学符号读法》日期:
范文一:符号读法 1
引言2007年江西省高等自学考试工程力学(一)试卷中第一大题单项选择题的第9小题是这样表述的:“在下列公理、法则、定理中,只适用于刚体的是(
二力平衡公理
力的平行四边形法则
作用与反作用定理此道题是原版为2005年1 月全国高等教育自学考试工程力学(一)(课程代码02159)(以下简称国卷)第二大题的第1小题。原题为:在下列原理、法则、定理中,只适用于刚体的是(
二力平衡原理
B 力的平行四边形法则
力的可传性原理
D 作用与反作用定理省卷的A 、B 、D 三个选项答案与国卷相同,省卷的C 选项用“刚化公理”取代了国卷的C 选项的“力的可传性原理”。国卷的标准答案是非常清楚的:C 选项答案是正确的,即力的可传性原理只适用于刚体。省卷提供的答案为“A”选项答案,即二力平衡公理只适用于刚体。孰是孰非,省卷有标准答案吗?下面是对每一选项答案所作的分析与研究。 2
思考与分析2.1“国卷C 选项答案”[力的可传性原理]作用在刚体上的力,沿其作用线移到刚体内任一点,不会改变它对刚体的作用外效应(运动效应)”。在外效应的讨论中,由实践人们有这样的体会,以等量的力在车后B 点推和在车前A 点拉车效果是一样的。如图1a )、b )示。即力沿作用线移动,不会改变力对物体的外效应。如图2a 示的变形杆AB ,沿杆的轴线受到两个等值、反向的拉力作用,杆AB 被拉长了,若把这两个力沿作用线分别移到了杆的另一端,如图2b 示,杆AB 被压短了。这说明变形效应(内力效应)改变了。因此,力的可传性原理只适用于刚体,而不适用于变形体。 2.2“省卷D 选项答案”[作用与反作用定理]两物体的作用力与反作用力总是同时存在,且等值、反向、共线,分别作用在两个相互作用的物体上。该定理是牛顿第三定律,它概括了自然界中物体间相互作用的关系。作用与反作用定理是一座桥梁,应用作用与反作用关系,可以将机械或结构中的一个零部件的受力分析顺利过渡到另一个另部件的受力分析。因此,作用与反作用定理,不仅适用于刚体也适用变形体。
2.3“省卷B 选项答案”[力的平行四边形法则]作用在物体上同一点的两个力可以合成为一个合力,合力也作用在该点,合力的大小和方向由这两个力为边构成的平行四边形的对角线表示。该法则说明力的合成是符合矢量加法,它只是一种力系简化时的矢量运算法则,是复杂力系简化的基础。由此可知,力的平行四边形法则既适用于刚体也适用变形体。以上分析表明,“作用与反作用定理”和“力的平行四边形法则”的应用与研究的物体是刚体还是变形体无关。2.4“省卷A 选项答案”[两力平衡公理]作用于刚体上的二个力,使刚体保持平衡状态的必要与充分条件是,此两力等值、反向、共线。两力平衡公理是作用于刚体上最简单的力系平衡时所必须满足的条件。对于刚体,这个条件既必要又充分,但对非刚体(如柔索、链条、皮带等等),这个条件只是必要条件而不是充分条件。如图3、a )所示,柔性绳受两个等值、反向、共线的拉力作用可平衡;而图3、b )示,绳受两个等值、反向、共线的压力就不能平衡。 由二力平衡公理的内涵与外延说明二力平衡公理适用于刚体,也可有条件的运用到非刚体(变形体)中,如图3a 所示,而不是只适用刚体。 2.5“省卷C 选项答案”[刚化公理]变形体在某一力系作用下处于平衡,如将此变形体刚化成刚体,则平衡状态保持不变。这个公理阐明了把变形体抽象成刚体模型的条件。如柔性绳在等值、反向、共线的两个拉力作用下处于平衡状态(图3a 示),此时可将柔性绳刚化成刚体(图3c 示), 而柔性绳在两个等值、反向、共线的压力作用下就不能平衡,这时就不能将其刚化成刚体。刚化公理建立了刚体平衡条件和变形体平衡条件的联系,是把刚体平衡条件应用到变形体平衡问题的依据。因此,在刚体静力学的基础上,考虑变形体的特性,可以进一步研究变形体的平衡问题,从而扩大了刚体静力学的应用范围,这在弹性静力学和流体静力学中有着重要意义。由刚化公理进一步表明二力平衡公理可以有条件的应用于非刚体,而不是只适用于刚体。以上分析可见,省卷C 选项答案不符合该题设要求。 3
结论由国卷、省卷该题的每一选项答案的研究分析表明,省卷作者提供的“A”选项答案:二力平衡公理只适用刚体 是错误的,并且该题没有题设要求的正确答案,即此题出现了原则性的概念不清等问题。在二十一世纪的今天,对经典力学中的公理,定律以及其内涵与外延的理解还有如此严重的概念不清的问题的出现,作为一个力学基础课的教育工作者,有义务用公理、定律的本身性质分析作一回应,以澄清其错误概念,是对教育者的启示,更是对受教育者的负责。静力学公理静力学公理是人们在生活和生产实践中长期总结出来的力的基本性质。
公理一 二力平衡公理作用在刚体上的两个力,使刚体保持平衡的必要和充分条件是:这两个力的大小相等,方向相反,且作用在同一直线上。
公理二 加减平衡力系公理在已知力系上加上或减去任意的平衡力系,并不改变原力系对于刚体的作用。
推论 力的可传性原理作用于刚体上某点的力,可以沿其作用线移到刚体内任意一点,并不改变该力对刚体的作用。公理三 力的平行四边形法则作用在物体上同一点的两个力,可合成为一个力,合力的作用点仍在该点,合力的大小和方向,由这两个力为边构成的平行四边形的对角线去认定。
推论 三力平衡汇交定理作用于刚体上三个相互平衡的力,若其中两个力的作用线汇交于一点,则此三力必在同一平面内,且第三个力的作用线通过该点。
公理四 作用与反作用定律两物体间的相互作用力,大小相等,方向相反,作用线沿同一直线。
公理五 刚化定理变形体在某一力系作用下处于平衡时,如将其刚化为刚体,其平衡状态保持不变。 http://www.scude.cc/software/08/01/001/01/00001/bj/ch01/bj01_02.htm###充分条件如果有事物情况A ,则必然有事物情况B ;如果没有事物情况A 而未必没有事物情况B ,A 就是B 的充分而不必要的条件,简称充分条件。简单地说,满足A ,必然B ;不满足A ,不必然B ,则A 是B 的充分条件。例如:
1. A下雨;B 地湿。2. A烧柴;B 会产生二氧化碳。3. A再过一百年;B 在座的各位都不在人间了。例子中A 都是B 的充分条件,确切地说,A 是B 的充分而不必要的条件:其一、A 必然导致B ;其二,A 不是B 发生必需的。在例子中,往地上泼水地就湿了;燃烧石油也会产生二氧化碳;扔一颗炸弹进去,各位就不在了,这说明A 不是B 发生必需的。 必要条件如果没有事物情况A ,则必然没有事物情况B ;如果有事物情况A 而未必有事物情况B ,A 就是B 的必要而不充分的条件,简称必要条件。简单地说,不满足A ,必然不B ;满足A ,不必然B ,则A 是B 的必要条件。例如:1. A不断呼吸;B 人能活着。2. A认识26个字母;B 能看懂英文。
3. A听过京剧;B 能体会到京剧的美。例子中A 都是B 的必要条件,确切地说,A 是B 的必要而不充分的条件:其一、A 是B 发生必需的;其二,A 不必然导致B 。在例子中,不喝水人就不能活下去;认识了26个字母不一定就能看懂英文;听过京剧未必能体会到京剧的美,这说明A 不必然导致B 。 充分必要条件如果有事物情况A ,则必然有事物情况B ;如果没有事物情况A ,则必然没有事物情况B ,A 就是B 的充分必要条件。简单地说,满足A ,必然B ;不满足A ,必然不B ,则A 是B 的充分必要条件。例如:1. A三角形等边;B 三角形等角。2. A某人触犯了刑律;B 应当依照刑法对他处以刑罚。
3. A付了足够的钱;B 能买到商店里的东西。例子中A 都是B 的充分必要条件:其一、A 必然导致B ;其二,A 是B 发生必需的。
范文二:符号的读法标点符号Punctuation,
' ' - ;所有格符号 § <> ;书名号 - Other keyboard symbols_ # (UK),pound //
US),sharp(misic),如C#
Mathematical symbols[
equalis equivalent to ,is identical totoIs less than Is much less than infinity (square) root ≠
→ ⌒ …成比例Xiangchao Zhang± ∑ ′
| plus or minus summation of? Π , alternative denial toMinute,foot〃 …分布 Implies,if …then Logical notand,minIs defined as the integral of ↑,| !?,’?,!,~ :=, ≡, :
symmetric difference,Laplace operatorfogcomposed with ||…|| Norm off:X→Y?|…| Greek CharactersΑ
ΕΙalpha ['aelfa]Β 磁通系数;角度;系数gamma ['gaema] Δ 变动;密度;屈光度epsilon ['epsilan
Ζ 系数;方位角;阻抗;相对粘/ ep'sailan] 度;原子序数 温度;相位角iota [ai'outa]
Κ 介质常数
Xiangchao ZhangΝ
Τ 磁导系数;微(千分之一);放大因数nu [nju:]
omicron [ou'maikran] tau [tau]
Π 圆周率总和(大写),表面密度;跨导Υ 位移
Ohm 欧姆(大写);角速(小写);角Ψ
psi [psi:] Xiangchao Zhang
范文三:关于统计学符号的使用肖鲲等?石斛属植物的AD指纹图谱聚类分析石斛和美花石斛聚类;而石仙桃与上述石斛亲缘关为5大类,细茎石斛和铁皮石斛为一类,金钗石斛与?????系最远,单独成一支?此结果与表3中石斛间遗传距矩唇石斛为一类,重唇石斛和流苏石斛一类,而美花?离统计资料相同?石斛和石仙桃为独立支,其中石仙桃与各个品种之间差异性较大?在种间亲缘上,AD指纹图谱分析3讨论AD技术因其操作简便,DA用量少,C引物无种属限制等特点,目前已经广泛应用于厚扑,苍结果与形态分类存在一定差异,其系统分类与亲缘关系的研究尚需积累更多的AD检测位点,并结5合其他DA分析手段做出更科学的评价4,???实验结果还表明:通过AD技术建立的指纹术,西洋参,人参等药用植物的DA指纹图谱构建,??????图谱,对一些外形难于区别的石斛属植物进行鉴别真伪鉴别,亲缘关系,遗传多样性,及药材道地性的????是可行的,如金钗石斛和矩唇石斛?目前我们仅是对研究??????解被检测位点,可以针对所发现的特异位点设计特????物共扩增出53谱带,平均每个引物扩增的DA条本实验从72个随机引物中,筛选出8个有效引石斛基因组中的某些位点进行检测,如要进一步了异引物进行DA序列分析;或对扩增出的特异位点带为6.63,其中39个条带具有遗传多态性,约占总??????条带进行克隆测序,并制备DA探针从而更便捷地数的73.6℅,显示出丰富的遗传多样性?聚类分析表???明,8个筛选出的引物能有效地区分石斛属植物,其鉴定不同品种,这将为名贵中药材的AD分子鉴别提供新思路?中90还扩增出特异条带,说明AD技术可以进行中药石斛的鉴别????表3列出12个样品之间的遗传距离关系,石仙参考文献?1应依,徐红,王峥涛.DA分子标记技术在中药石斛类药桃与各个品种石斛之间的遗传距离从0.66667?材鉴定中的应用J.中医药现代化,):65-70.0.82609,平均遗传距离为0.71734;各个不同品种石2郑晓珂,曹新伟,冯卫生,等.金钗石斛的研究进展J斛间的遗传距离从0.21,平均为新药杂志,):826-829.??0.44380;金钗石斛品种间的平均遗传距离为3??.中国??0.04381?由此可见,各个石斛品种与石斛伪品(石仙化和DA多态性分析J.江苏大学学报(医学版),桃),遗传差异大,相似程度低,石斛各品种间相似范):134-137.??围分布广遗传多样性较丰富?AD扩增反应产生14白音,包英华,王文全,等.不同居群美花石解种质资源的条带代表基因组中的1个位点,本实验意味着对样品的53个位点进行检测,这是传统的形态学,细胞学,显微学等鉴定方法无法比的?在聚类分析中,遗传距离取0.4时,可将样本分5AD分析J.中草药,):748-751.彭锐,李泉森,李隆云.石斛的分子生物学鉴定???基于AD分析J.西南农业大学学报,):438-440.责任编辑:李勇肖鲲,葛晓军,李小琼,等.金钗石斛及其相似种AD优关于统计学符号的使用按国家标准GB3358-82?统计学名词及符号?的规定书写,符号均用斜体,常用者示例如下:样本的算术平均数用英语小写,也不用或(中位数仍用)?标准差用英文小写,不用D?标准误用英文2小写,不用I?检验用英文小写?F检验用英文大写F?卡方检验用希腊文小写用英文小写?自由度用希腊文小写?概率用英文大写??相关系数(本刊编辑部)?456?
范文四:统计学术语及符号《统计学》中的重要符号、读音及用途统计学术语 population 母体 sample 样本 census 普查 sampling 抽样 quantitative 量的qualitative/categorical质的 discrete 离散的 continuous 连续的population parameters 母体参数 sample statistics 样本统计量 descriptive statistics 叙述统计学 inferential/inductive statistics 推论 ... 抽样调查(sampliing survey单纯随机抽样(simple random sampling 系统抽样(systematic sampling 分层抽样(stratified sampling 整群抽样(cluster sampling 多级抽样(multistage sampling 常态分配(Parametric Statistics)无母数统计学(Nonparametric Statistics) 实验设计(Design of Experiment) 参数(Parameter) Statistics 统计学 Population 母体 Sample 样本Data analysis 资料分析 Statistical table 统计表Statistical chart 统计图
Pie chart 圆饼图Stem-and-leaf display 茎叶图
Box plot 盒须图
Histogram 直方图
Bar Chart 长条图
Polygon 次数多边图
Ogive 肩形图Descriptive statistics 叙述统计学
Wilcoxon signed rank tests 魏克森讯号等级检定Wilcoxon rank sum tests 魏克森等级和检定Run test 连检定法Discrete uniform densities 离散的均匀密度Binomial densities 二项密度Hypergeometric densities 超几何密度
Expectation 期望值
Mean 平均数
Variance 变异数Standard deviation 标准差
Standard error 标准误Covariance matrix 共变异数矩阵
Inferential statistics 推论统计学
Point estimation 点估计
Interval estimation 区间估计
Confidence interval 信赖区间
Confidence coefficient 信赖系数Testing statistical hypothesis 统计假设检定
Regression analysis 回归分析
Analysis of variance 变异数分析
Correlation coefficient 相关系数
Sampling survey 抽样调查
Census 普查
Sampling 抽样
Reliability 信度
Validity 效度Sampling error 抽样误差Non-sampling error 非抽样误差
Random sampling 随机抽样Simple random sampling 简单随机抽样法
Stratified sampling 分层抽样法
Cluster sampling 群集抽样法
Systematic sampling 系统抽样法Two-stage random sampling 两段随机抽样法Convenience sampling 便利抽样
Quota sampling 配额抽样
Snowball sampling 雪球抽样Nonparametric statistics 无母数统计
The sign test 等级检定
Poisson densities 卜松密度 Geometric densities 几何密度Negative binomial densities 负二项密度 Continuous uniform densities 连续均匀密度Normal densities 常态密度 Exponential densities 指数密度 Gamma densities 伽玛密度 Beta densities 贝他密度Multivariate analysis 多变量分析 Principal components 主因子分析 Discrimination analysis 区别分析 Cluster analysis 群集分析 Factor analysis 因素分析 Survival analysis 存活分析Time series analysis 时间序列分析 Linear models 线性模式Quality engineering 品质工程 Probability theory 机率论Statistical computing 统计计算 Statistical inference 统计推论 Stochastic processes 随机过程 Decision theory 决策理论 Discrete analysis 离散分析Mathematical statistics 数理统计 统计学 : Statistics 母体 : Population 样本 : Sample资料分析 : Data analysis 统计表 : Statistical table 统计图 : Statistical chart 圆饼图 : Pie chart茎叶图 : Stem-and-leaf display 盒须图 : Box plot 直方图 : Histogram 长条图 : Bar Chart
次数多边图 : Polygon
肩形图 : Ogive叙述统计学 : Descriptive statistics
期望值 : Expectation
众数 : Mode
平均数 : Mean
变异数 : Variance标准差 : Standard deviation
标准误 : Standard error共变异数矩阵 : Covariance matrix
推论统计学 : Inferential statistics
点估计 : Point estimation
区间估计 : Interval estimation
信赖区间 : Confidence interval
信赖系数 : Confidence coefficient统计假设检定 : Testing statistical hypothesis回归分析 : Regression analysis
变异数分析 : Analysis of variance
相关系数 : Correlation coefficient抽样调查 : Sampling survey
普查 : Census
抽样 : Sampling
信度 : Reliability
效度 : Validity抽样误差 : Sampling error非抽样误差 : Non-sampling error
随机抽样 : Random sampling简单随机抽样法 : Simple random sampling分层抽样法 : Stratified sampling
群集抽样法 : Cluster sampling
系统抽样法 : Systematic sampling两段随机抽样法 : Two-stage random sampling便利抽样 : Convenience sampling
配额抽样 : Quota sampling
雪球抽样 : Snowball sampling无母数统计 : Nonparametric statistics
等级检定 : The sign test魏克森讯号等级检定 : Wilcoxon signed rank tests
魏克森等级和检定 : Wilcoxon rank sum tests连检定法 : Run test离散的均匀密度 : Discrete uniform densities二项密度 : Binomial densities超几何密度 : Hypergeometric densities
卜松密度 : Poisson densities
几何密度 : Geometric densities负二项密度 : Negative binomial densitie,连续均匀密度 : Continuous uniform densities常态密度 : Normal densities
指数密度 : Exponential densities
伽玛密度 : Gamma densities
贝他密度 : Beta densities多变量分析 : Multivariate analysis
主因子分析 : Principal components
区别分析 : Discrimination analysis
群集分析 : Cluster analysis
因素分析 : Factor analysis存活分析 : Survival analysis时间序列分析 : Time series analysis
线性模式 : Linear models品质工程 : Quality engineering
机率论 : Probability theory统计计算 : Statistical computing
统计推论 : Statistical inference
随机过程 : Stochastic processes
决策理论 : Decision theory
离散分析 : Discrete analysis数理统计 : Mathematical statistics统 计 名 词 市 调 辞 典
众数(Mode) 普查(census)指数(Index) 问卷(Questionnaire)
中位数(Median) 信度(Reliability)百分比(Percentage) 母群体(Population)
信赖水准(Confidence level) 观察法(Observational Survey)假设检定(Hypothesis Testing) 综合法(Integrated Survey) 卡方检定(Chi-square Test) 雪球抽样(Snowball Sampling)差距量表(Interval Scale) 序列偏差(Series Bias)类别量表(Nominal Scale) 次级资料(Secondary Data)顺序量表(Ordinal Scale) 抽样架构(Sampling frame)比率量表(Ratio Scale) 集群抽样(Cluster Sampling)连检定法(Run Test) 便利抽样(Convenience Sampling)符号检定(Sign Test) 抽样调查(Sampling Sur)算术平均数(Arithmetic Mean) 非抽样误差(non-sampling error)展示会法(Display Survey)
调 查 名 词 准确效度(Criterion-Related Validity)元素(Element) 邮寄问卷法(Mail Interview)样本(Sample) 信抽样误差(Sampling error)效度(Validity) 封闭式问题(Close Question)精确度(Precision) 电话访问法(Telephone Interview)准确度(Validity) 随机抽样法(Random Sampling)实验法(Experiment Survey)抽样单位(Sampling unit) 资 讯 名 词
市场调查(Marketing Research) 决策树(Decision Trees)容忍误差(Tolerated erro) 资料采矿(Data Mining)初级资料(Primary Data) 时间序列(Time-Series Forecasting)目标母体(Target Population) 回归分析(Regression)抽样偏差(Sampling Bias) 趋势分析(Trend Analysis)抽样误差(sampling error) 罗吉斯回归(Logistic Regression)架构效度(Construct Validity) 类神经网络(Neural Network)配额抽样(Quota Sampling) 无母数统计检定方法(Non-Parametric Test)人员访问法(Interview) 判别分析法(Discriminant Analysis)集群分析法(cluster analysis) 规则归纳法(Rules Induction)内容效度(Content Validity) 判断抽样(Judgment Sampling)开放式问题(Open Question) OLAP(Online Analytical Process)分层随机抽样(Stratified Random sampling) 资料仓储(Data Warehouse)非随机抽样法(Nonrandom Sampling)知识发现(Knowledge Discover
范文五:统计学符号读音及用途《统计学原理》中的重要符号、读音及用途序号 大写 小写 英文注音 国际音标注音 中文读音 意义 1 Α α alpha a:lf2 Β β beta 阿尔法 角度;系数
磁通系数;角度;系数电导系数(小写)bet 贝塔 3 Γ γ gamma ga:m 4 Γ δ delta delt5 Δ ε epsilon6 Ε δ zeta 伽马 德尔塔 变动;密度;屈光度 ep`silon 伊普西龙 对数之基数
系数;方位角;阻抗;相对粘度;原子序数
zat 截塔7 Ζ ε eta eit 艾塔8 Θ ζ thet ζit 磁滞系数;效率(小写)
西塔 温度;相位角9 Η η iot aiot 约塔 微小,一点儿介质常数
10 Κ θ kappa kap 卡帕11 Λ ι lambda lambd 兰布达 波长(小写);体积12 Μ κ mu mju 缪 磁导系数微(千分之一)放大因数(小写)
13 Ν λ nu nju 纽 磁阻系数14 Ξ μ xi ksi 克西15 Ο ν omicron
omik`ron 奥密克戎16 Π π pi pai 派 圆周率=圆周÷直径=3. 89793
17 Ρ ξ rho rou 肉 电阻系数(小写)18 ? ζ sigma `sigma 西格马 总和(大写),表面密度;跨导(小写)19 Σ η tau tau 套 时间常数20 Τ υ upsilon jup`silon 宇普西龙 位移磁通;角
21 Φ θ phi fai 佛爱22 Υ χ chi phai23 Φ ψ psi psai 西
普西 角速;介质电通量(静电力线);角24 Χ ω omega o`miga 欧米伽 欧姆(大写);角速(小写);角 ☆ 《统计学原理》中的重要符号、读音及用途。
摘编:江老师(window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
&&|&&4次下载&&|&&总515页&&|
统计学原理经典讲义
您的计算机尚未安装Flash,点击安装&
阅读已结束,如需下载到电脑,请使用积分()
下载:100积分
0人评价24页
2人评价33页
1人评价255页
2人评价116页
2人评价495页
3人评价129页
所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
文档内容侵权
已存在相同文档
不属于经济管理类文档
源文档损坏或加密
若此文档涉嫌侵害了您的权利,请参照说明。
我要评价:
价格:100积分VIP价:80积分教育统计学_大学生考试网
教育统计学
引言 一.关于学习教育与心理统计学的几点说明 (一)确定为教育与心理统计学的依据 教育与心理统计,实际上是教育统计与心理统计的合称,如今,教育问题的研究与心理问题 的研究,关系愈益密切,对教育教学问题的深层次的微观研究,常常离不开心理学,因此, 统计方法通常运用于既包含教育问题、又包含心理问题的场合。如,考试理论研究中所运用 的因子分析, 既涉及可观察的学生学习行为结果的知识测量, 又涉及到不可观察的学生潜在 心理特质的测量。此外,运用在教育研究领域的统计方法,在心理研究领域也基本可用,正 因为如此, 教育统计学中的基本统计理论、 原理和方法实际上就是心理研究领域中的统计理 论、 原理和方法。 教育统计与心理统计的差异主要是形式上即材料上的差异而非本质的差异 ――即教育统计主要运用教育教学中的数据材料来阐明统计原理和方法, 而心理统计则主要 运用心理实验数据或心理测验数据来阐明统计原理和方法。 也就是说, 统计原理和方法一样, 仅仅是数据材料不同。 (二)掌握统计技术另需具备的工具和书刊 1. 具统计功能的计算器或 excel 电子表格的数据编辑处理方法。 2. spss 统计软件全称是 statistics package for social science(Statistical Products-- Services Solution) ,没有统计软件的支撑,统计知识和方法也基本上只能停留在理论层面和少量的 数据处理,难以真正运用到实践中。 3. 统计软件处理技术必备的自学书籍。 《spss 在教育统计中的应用》,主编杨晓明高等教育 出版社; 《心理实验设计及其数据处理》,主编金志诚, 广东高等教育出版社; 《数据统计分析 与 spss 应用》主编余建英人民邮电出版社。 4. 教育及心理问卷调查必备测量工具书刊《心理卫生评定量表手册》中国心理卫生杂志社 汪向东等共 112 个心理与教育方面问题的量表。 二. 教育与心理统计学产生的背景及意义 随着科技的发展,人类认识、改造世界的能力不断更新,教育工作者已不再满足于对教育和 心理现象只进行哲学的思辨或经验的描述, 而开始要求并强调作系统的思考与定量的研究和 分析。 (学科发展背景)这一学科发展的背景也正好符合――当代社会科学向数量化、综合 化发展的社会趋势。因此,教育与心理科学的定量化研究,乃是 20 世纪以来的世界性潮流。 (社会背景)因为教育与心理统计学,就是阐述怎样运用数理统计学原理,对教育和心理问 题进行定量研究的方法论科学,是了解教育与心理状态、认识教育与心理规律的有力工具, 是推进教育和心理研究方法科学化进程的重要基石。因而,学好教育与心理统计学,是跟上 这种教育与心理问题定量化研究的趋势, 提高自己的研究水平和研究力度, 以及确保教务管 理科学化,等等,都具有积极的意义。 三、教育与心理统计学学习难度的根源解析 覆盖多门学科知识;思维基础的限制;学习习惯方面定势的不良影响;讲授的深浅度难于把 握。第一章绪论 教学目的 : 了解教育与心理统计学的作用及其产生发展情况以及学习时应注意的基本问题; 理解教育与心理统计学的性质;掌握教育与心理统计学的主要内容;熟练掌握教育与心理统 计学中的几个基本概念和符号。 教学重点:教育与心理统计学的性质;教育与心理统计学中的几组基本概念和常见符号 教学方法:讲授法讨论法 第一节 教育与心理统计学的性质和作用 一、 教育与心理统计学的性质 教育与心理统计学:是以数理统计的理论和方法来研究教育与心理现象中数据资料的搜集、 整理、分析和推断,以便发现教育与心理现象的特点和规律的应用科学。 (手段、内容、目的和特性) 为深入理解教育与心理统计学的上述性质,请思考讨论下面两个问题: 1. 统计学、数理统计学与教育与心理统计学,三门学科之间有何逻辑联系? 2. 教育与心理统计学为什么要以数理统计学为其理论基础? (或者说,教育与心理现象的研究为什么要借用数理统计的原理和方法?) 对于问题 1?? 对于问题 2,数理统计是通过对随机现象所表现的数量进行搜集、整理、描述和推断,从而 发现其统计规律的一门学科。 数理统计学研究的是随机现象 (即因存在不确定因素而导致结 果带有偶然性同时又蕴涵一定规律性的现象) 。比如,??与此同时,教育与心理领域中也 存在大量的随机现象,这些随机现象之所以难以确定,是因为难界定、难控制、难测量、难 比较、 难归因。 如, 性格的形成、 表现及影响, 对个体而言, 都是难以确定的, 具有偶然性, 但同时也潜藏一定的规律性,对同类性格的大多数人来说,性格的形成、表现及影响,又涵 盖了不少规律性的东西。 为了能更好地研究这样一些随机现象, 就需要以数理统计学为理论 基础,就应该借用数理统计学的原理和方法来加以研究。 二、教育与心理统计学的作用 …… (一)明确教育、心理现象的性质 (二)比较两种教育、心理现象的差异 (三)分析影响教育、心理现象变化的因素 (四)由局部推测总体 (五)设计最优抽样方案第二节 教育与心理统计学的基本内容 一、 根据研究问题的实质分为以下几项内容 (一)描述一件事物的性质 (二)比较两件事物的差异 (三)分析影响事物变化的因素 (四)一件事物两种不同属性之间的相互关系 (五)取样方法 二、 根据统计方法的功能分为三种 (一)描述统计 主要研究如何整理心理与教育科学实验或调查得到的大量数据。用于描述一件事物的全貌, 表达一种事物的性质。描述统计又有两方面的内容: 1、 绘制统计图、统计表 把收集来的杂乱无序的数据简缩成清晰而易于理解的形式,以图表、数字的形式表现出来。 使研究者从中能够非常直观且迅速地获得有价值的信息。 2、计算出统计量 集中量数差异量数偏态量与峰态量相关系数,等等。 (二)推断统计:用于在一定可靠程 度上,据样本信息对相应总体特征进 行合理推断。 参数估计假设检验(4 大检验) :Z 检验;T 检验;F 检验;检验 (三)实验设计 用于研究如何科学、经济、以及更有效地设计实验。?? 描述统计是基础和前提,推断统计来自描述统计,是描述统计的深化 第三节 学习和应用教育与心理统计学应注意的基本问题 一、 在学习教育与心理统计学时要注意以下几个问题 (一)树立学习信心,克服畏难情绪,提高学习积极性 (二)重点掌握各种统计方法的使用条件 (三)进行一定的练习 (四)把握好学习的三个环节:预习、听讲、复习 二、 在应用教育与心理统计学的各种方法时要切记以下几点 (一)克服统计无用和统计万能的思想,注意科研道德 (二)需认真分析要处理的实验数据,正确选用统计方法,防止乱用统计 1、分析实验是否合理,即所获得的数据能否用统计方法去处理 2、分析实验数据的类型 一般说来,实验数据按由什么方法获得,可分为两大类,一类是通过计算个数的数据,叫计 数数据。如,男女数。另一类是借助于一定测量工具,或一定测量标准而获得的,叫测量数 据。如身高。此外,实验数据按其是否具有连续性,又可分为连续数据和离散数据。连续数 据――在某一区间,允许取无限个数量。离散数据――取有限个或者可数的数量 3、分析数据的分布规律 第四节 教育与心理统计学中的 几组基本概念和符号 一、 随机现象、随机试验、随机事件和随机变量 随机现象:是指在一定的条件下, 有多种可能结果出现,事先不能断言 哪种结果会出现的现象。如:抛一枚硬币。 随机试验:对随机现象的一次观察,称为一次随机试验,简称试验。 随机事件:指随机现象中的每一种可能结果,简称事件(常用 A、B、C 表示) 。在 SPSS 统计 软件中,为了统计处理方便,对于不是以数值表示的随机事件,应将其数量化。如:?? 随机变量:对于每一个给定的随机 现象,定义在事件集合上的函数,称为随机变量,简称变量(常用 X、Y、Z 表示) 例如:抛掷一枚硬币,观察其落地后是“正面朝上”还是“反面朝上” 。这一现象只有两个 可能结果:A 代表正面朝上(用 1 表示) ,B 代表反面朝上(用 0 表示) 。于是可定义一个随 机变量 X: 1 当 A 发生时 X=0 当 B 发生时 这样,X =1 表示“正面朝上”事件; X=0 表示“反面朝上”事件。有人做过大量实验,事 件 A 和事件 B 发生的概率几乎相等, 均为 0.5。 这个结果可表示为这样的函数关系式: P (X =1)= P (X =0)=0.5 二、 总体、个体、样本和样品 总体:具有某种特征的一类事物的全体,又称“母体” 个体:构成总体的每个基本单元 样本: 为了调查总体的性质而从总体中随机抽取的一部分个体所组成的集合成为总体的一个 样本。 (常用“n”表示) 样品:样本中的个体称为样品。样本中包含的个体数称为样本容量 特别注意两个问题: 1. 总体和样本是相对的。比如,从徐州市随机抽取 6 所学校,对其学生家长的职业进行调 查。这时,6 所学校的学生可作为整个徐州市所有学生的样本,同时也可作为 6 所学校各班 学生的总体。 2. 大样本和小样本也是相对的。一般说来,n 大于或等于 30 为大样本 n 小于 30 为小样 本但这种划分不是绝对的。 必须根据具体问题加以确定。 如要对全国中学生心理素质状况进 行调查,那么抽取 n=50 甚至 100 仍然不能算是大样本。因为这样的数量相对于全国的中学 生而言,是微乎其微的。 三、 次数、频率、概率和概率分布 次数:某一随机事件在某一类别中出现的数目,又称为频数。统计学上往往将人数、只数、 个数、头数等等统称为次数或频数。 (用“f”表示) 。如: 频率:又称相对次数,某一事件的次数被总的事件数目除,也就是某一数据出现的次数占数 据总数目的比例。用公式表示为: 频数 /总数目T频率 频率常用比例表达,有时也用百分数表示。 概率:又称机率,是指在一定条件下,对一个事件出现的“可能性大小”的度量(用“p” 表示) 概率分布:说明一个随机变量可能 取哪些值以及有多大的概率取到那些值的表达式。如:P(X=χ i)=p i (i =1,2,3?) 表示 的就是,若 X 为离散型随机变量,可能的取值范围是χ 1 ,χ 2 ,χ 3 ?,取值χ i 的概率 为 p i ,于是把上述表达式称为 X 的概率分布或者概率密度 常用的概率分布有:两点分布、二项分布、正态分布、分布、t 分布和 F 分布 6 种。 四、 统计量和参数 统计量:又称统计特征数,是指在 研究中对样本信息计算得到的各种 量数,它能描述一组数据的特征。如 平均数、中数?? 参数:又称总体参数,是指从已知 的统计量推论得到的相应总体的各种量数,它能描述一个总体的情况。比如,由样本平均数 推论得到的总体平均数, 由样本标准差推论得到的总体标准差, 以及由样本相关系数推论得 到的总体相关系数等等。 几种常用的统计量和参数的符号 名称 统计量 参数 算术平均数 κ 标准差 S 方差 S2 相关系数 r ξ 希腊字母表及其读音与意义 序号大写小写英文注音国际音标注音中文注音意义 1 Α α alpha a:lf 阿尔法角度;系数 2 Β β beta bet 贝塔磁通系数;角度;系数 3 Γ γ gamma ga:m 伽马电导系数(小写) 4 Γ δ delta delt 德尔塔变动;密度;屈光度 5 Δε epsilon ep`silon 伊普西龙对数之基数 6 Εδ zeta zat 截塔系数;方位角;阻抗;相对粘度;原子序数 7 Ζ ε eta eit 艾塔磁滞系数;效率(小写) 8 Θ ζ thet ζ it 西塔温度;相位角 9 Η η iot aiot 约塔微小,一点儿 10 Κ θ kappa kap 卡帕介质常数 11 ∧ι lambda lambd 兰布达波长(小写) ;体积 12 Μ κ mu mju 缪磁导系数;微(千分之一) ;放大因数(小写) 13 Ν λ nu nju 纽磁阻系数 14 Ξ μ xi ksi 克西 15 Ο ν omicron omik`ron 奥密克戎 16 ∏π pi pai 派圆周率=圆周÷直径=3.1416 17 Ρ ξ rho rou 肉电阻系数(小写) 18 ∑ζ sigma `sigma 西格马总和(大写) ,表面密度;跨导(小写) 19 Τ η tau tau 套时间常数 20 Υ υ upsilon jup`silon 宇普西龙位移 21 Φ θ phi fai 佛爱磁通;角 22 Φ χ chi phai 西 23 Χ ψ psi psai 普西角速;介质电通量(静电力线) ;角 24 Ψ ω omega o`miga 欧米伽欧姆(大写) ;角速(小写) ;角 五、误差、系统误差、随机测量误差和抽样误差 误差:测得值与真值之差,以及样本统计量与总体参数之差。 系统误差:在搜集资料的过程中,因仪器不足,主试者暗示或对一些实验指标掌握过宽或过 严,可导致测量结果呈倾向性的偏大或偏小。应力求避免。 随机测量误差:在搜集资料的过程中,即使方法能够统一,仪器得以校正,但由于各种偶然 因素影响, 会造成对用同一方法对同一对象多次测定的结果不完全相同, 这种误差往往没有 固定的倾向,而是有的稍高,有的稍低。如,被试自身带到实验中来的各种因素和特征:象 被试的年龄、性别、智力水平、学习经验以及被试实验过程中的兴趣、态度和疲劳等因素。 随机测量误差可尽量缩小,但一般难以完全避免。 抽样误差:随机样本的统计量与总体参数之差。 第五节教育与心理统计的常见问题类型与 SPSS 一. 问题类型 ①对采集数据的一般性统计。如频数、频率、均值和方差等。例如,抽样调查某地区家庭义 务教育支出,其中问卷调查项目有家庭人口、父母受教育年限、子女人数、上学人数、家庭 人均收入、家庭人均支出、教育支出、少数民族比例。要对整个抽样加以统计,说明此地区 的上述指标情况,就要做一般性统计分析。 ②两个总体之间某类特征数据的差异显著性。 例如, 研究我国重点与非重点两类大学毕业生 收入有无差异问题。 ③多个总体之间某类特征数据的差异显著性。例如,研究具有博士学位、硕士学位和学士学 位毕业生的期望收入有无差异的问题。 ? 一个或多个因素对结果影响的显著性。例如,不同性别、不同地区、不同家庭背景的学生 接受高等教育情况有无差异;教学手段与课外科研活动是否对学生学习成绩有影响。 ⑤两个特征变量数据的相关性(相关程度)大小。例如,个人受教育年限与个人收入关系的 密切程度。 ⑥一变量和另一变量或多个变量之间的近似函数关系。 例如, 一个地区人均教育支出与人均 国内生产总值近似的函数关系。 ⑦某变量是否服从特定分布。例如,某校学生月生活费支出是否服从正态分布。 ⑧如何将多个研究对象进行分类(聚类) 。例如,将我国 31 个省市按人均教育经费多少分成 五大类。 ⑨如何将多个指标描述的对象简化成少量指标描述。例如,影响小学辍学率的因素有很多, 比如人均国内生产总值、人均教育经费、农民人均收入、当地文盲率等十几个因素,能否简 化成几个综合因素(因子) 。 ⑩如何将多个用不同量纲指标描述的研究对象进行综合排序。 例如, 衡量一个地区现代化水 平有多个指标,而且这些指标量纲都不一样,现有几个地区,按教育现代化水平这一量纲指 标排序,如何进行。 二. 数据类型 按照统计学处理问题的方法分类, 不同的数据类型有不同的统计分析方法。 一般分为定性数 据和定量数据。定量数据中又分为:服从或近似正态分布的数据;非正态分布数据。 三. SPSS 如何解决教育与心理统计中的问题 解决上述 10 种问题的 SPSS 统计方法如下表所示:解决 方法 问题 类型 定性 数据数据类型定量数据 服从或近似非正态分布 服从正态分布 ? 数据清理与基本统计分析 数据清理与基本统计分析 数据清理与基本统计分析 ? 卡方检验 一般卡方检验 T 检验 配对 T 检验 两组独立样本的 T 检验 非参数检验;两组独立样本非参数检验; 两配对非参数检验 ? 卡方检验 方差分析 非参数检验;多独立样本非参数检验; 多配对非参数检验 ? 方差分析 多独立样本非参数检验; 多配对非参数检验 ? 卡方检验 相关分析 相关分析 ? 回归分析 回归分析 ? 非参数检验;单样本 K-S 检验 ? 聚类分析 聚类分析 聚类分析 ? 因子分析与主成分分析 因子分析与主成分分析 因子分析与主成分分析 ? 因子分析与主成分分析 因子分析与主成分分析 因子分析与主成分分析 注: 基本统计分析包括频数统计、 描述性统计、 均值、 均值标准误差、 中位数、 众数和全距、 方差和标准差、四分位数、十分位数和百分位数、峰度和偏度、参数估计(总体均值与总体 方差的估计?参数的点估计、计算总体均值的置信区间?参数的区间估计) 课后作业与练习: 1、 什么是教育与心理统计学?它的作用和内容有哪些? 2、名词解释 随机现象、随机试验、随机事件、随机变量、次数、频率、概率和概率分布、误差、系统误 差、随机测量误差和抽样误差 3、举例说明什么是总体、个体、样本和样品?什么是统计量和参数? 4、熟练掌握 Excel 数据录入及图表制作方法。第二章 数据的搜集、整理和表达 教学目的了解数据整理和表达的意义; 掌握各类数据的区别和联系; 掌握数据整理和表达的 主要方法;熟练掌握数据分组和编制次数分布表的步骤及方法。 教学重点各种数据资料的异同及适用统计量; 数据整理和表达的主要方法; 数据分组和编制 次数分布表的步骤及方法。 教学方法讲授法讨论法 第一节 数据资料的搜集 一、搜集数据资料的意义 (一)搜集数据资料是统计工作的第一步 (二)搜集数据资料是统计整理和统计分析、推断的前提和基础 (要求:根据研究目的和实事求是原则、运用科学方法、准确并及时搜集统计资料) 二、数据资料的来源 在教育与心理研究中, 统计资料主要来自教育与心理实验、 教育与心理测验以及教育与心理 调查三种途径。 (一)实验数据 通过教育与心理实验得到的数据,应采用何种统计方法,与实验设计的方法有关。这部分内 容属于《心理科学研究方法》这门学科,因此这里不再展开。 (二)测量数据 教育与心理测验是一种特殊的调查, 但由于测验已经形成一套相当完整的理论, 因而不再归 于调查而自成体系。 (三)调查资料 1、按调查对象的范围划分,有全面调查和非全面调查 2、按调查时间划分,有经常性调查和一次性调查 3、按调查的组织方式划分,有统计报表调查和专门调查 统计报表主要指教育部门逐级向上呈报的各种表格, 教职工情况登记表、 学生情况登记表和 经费收支情况登记表等等。 4、按调查方法划分,有观察法、访谈法、报告法、问卷法、文献法 其中,报告法是按隶属关系逐级呈报资料的方法。 运用上述调查方法搜集数据资料,需要首先制定调查方案。调查方案的制定包括以下工作: 明确调查的目的和任务是什么;确认调查的对象和范围;理清调查的内容和项目;运用什么 调查方法和方式;对调查活动的组织领导――又包括思想准备、组织准备、人员训练、力量 配备、文件及表格的拟制和经费预算等。 第二节数据资料的整理 当我们从?? 一、变量与数据的基本问题 (一) 变量的基本问题 1、 变量的涵义:表示事物某一特性的量。由于事物总是发展变化的,??在某一变量中, 一旦某个值被确定,就把这个值称之为这个变量的一个数据。比如,??变量是上位概念, 数据是从属于变量的下位概念。 2、 变量的种类 (1) 按变量的测量水平即标定(或表示)事物的明确程度分为以下几种 A 称名变量(又叫定类变量或类别变量) (Ⅰ)涵义:按事物的某一特性,划分并区别事物不同种类后,用数字化的方式来表示所形 成的变量。如,?? 二分称名变量:只有两项类别或两种变化结果的称名变量。 (Ⅱ)特点及适用统计方法: a 表示称名变量的数只能叫数字或数码,而不能叫作数值或数据,只起分类标记作用,而无 数量和序列的涵义。如学号,我是 1 号,你是 2 号,所以我比你高明吗?69 路公交车就一 定比 67 路公交车的服务质量好吗? b 不能直接进行量化分析和加、减、乘、除四则运算。男(1)+女(0)=?对+错=? c 在相关分析中,可用点二列相关系数和相关系数等统计指标来表示变量间的特征;在描述 统计分析中,统计图/统计表/频数/频率;在统计假设检验中,可采用卡方检验 B 等级变量(又叫定序变量) (Ⅰ)涵义:在对事物的分类过程中,依据事物某种特征或属性的程度大小而排列成序所形 成的变量。如,?? (Ⅱ)特点: a 既无绝对零点,也无相等单位 所谓无绝对零点,是指无绝对的从 0 开始的起始点或参照点。?? 此外, 所谓无相等单位, 有两层涵义: 一是指, 各等级间差距的意义不同即不相等。 如, 优、 良、中、各等级间的差距是不相等的;二是指,评定各等级时使用的评定标准即单位值是不 一致的即不相同的。如:某同学成绩在徐师大评为中等,但在九州大学则可能评为优等,或 者相反,显然是由于衡定、度量各等级的标准(单位值)不等造成的。而体重、身高等则不 会出现上述情况。 b 等级变量不能进行加、减、乘、除四则运算。因为加减法运算有一个前提:参加运算的数 据须有相同的单位。1 只苹果+1 只橘子=?1 名+2 名=?这里的“名”不是它的单位,优等+ 良等=? c 如果是等级变量,在描述统计中,可用中位数、百分位数、频数、频率、统计图、统计 表;在相关分析中,可采用等级相关系数等统计指标,表示其变量间的特征;在统计假设检 验中,可采用卡方检验。 C 等距变量(又叫定距变量或间距变量) (Ⅰ)涵义:依据某一特性划分事物类别时,既编排了顺序,又具有相等度量单位的变量。 (Ⅱ)特点: a 单位相等(即数据等距、度量的单位值相同) ,如温度,摄氏 10 度与摄氏 9 度,同摄氏 9 度与摄氏 8 度,都是相差 1 度,所以这种数据是等距的,具有相同单位的。一般有相对参 照点,但无绝对参照点,温度为 0 不是一点温度都没有,所以这里的 0 不是绝对零点即并非 绝对的起始点,而只是一个相对的参照点,是一个人为规定的相对参照点,是“1 个大气压 下纯水结冰的温度” ,如果当时物理学家将“1 个大气压下煤油结冰的温度”规定为摄氏 0 度,这样一来,纯水结冰时的温度就不是 0 度,而会高于 0 度。 b 可以进行加、减运算但不能进行乘、除运算。如,可在 2 个温度之间进行加减运算,可 以说今天最高气温(30 度)比昨天最高气温(20)高 10 度,这是减法运算的结果,但不能 说今天最高气温(30 度)是昨天最高气温(20 度)的 1.5 倍,即不可以进行 30/20=1.5 这样 的乘除法运算,因为乘除运算的前提是:须有绝对零点。 c 如果是等距变量,既可用前述描述统计的方法,也可用平均数、标准差等统计分 析方法;相关分析中,可采用积差相关系数等统计指标,表示其变量间的特征;统计假设检 验中,适用于各种检验方法。 D 比率变量(定比变量) (Ⅰ)涵义:表示事物某一特性的变量,既有绝对参照点,又有相同单位的变量。如长度、 重量、 体积等数量, 其绝对零点都是 0, 就长度而言, 0 米就是在始发地,一点距离都没有; 就重量而言 0 千克就是一点质量都没有, 并且这样的 0 作为起始点是不以人的意志为转移的, 因而是绝对的零点。 同时 3 米和 2 米, 2 米和 1 米相差的距离始终是相等的, 所以单位相等。 (Ⅱ)特点: a 可以进行加、减、乘、除四则运算? b 适合等距变量的统计指标和方法,都适合比率变量 讨论:5 分制和 100 分制是定序变量还是定距变量? (2)据变量的性质不同,可分为以下两种 A、 连续变量 (Ⅰ)涵义:在变化范围内,可取得任何数值的变量。?? (Ⅱ)特征: a 数值可以是小数或分数 b 借助于某种测量工具得到的,称之为测量数据或计量数据 (Ⅲ)几何意义及表达式 a 数轴上的一段距离 b 具有实数的稠密性 实限: 连续变量的取值所确定的区间界限, 其中较大的界限值称实上限, 较小的称为实下限。 确定法:向连续变量的取值的上下各移动最末一个数位的半个单位值而得到的两个数。 10 米的最末一个数位是个位, 表明是用以 1 米为一个单位值去度量得到的长度, 所以它的一半 就是 0.5,于是上实限为 10+0.5=10.5;下实限为 10-0.5=9.5 。 例 1:确定连续变量取值 19.6 的实限。 例 2:确定确定连续变量取值 10.00 的实限。 练习:74.825;80.00005 表达法:大于等于下限,小于上限 [ )左闭右开 B、非连续变量(离散变量) (Ⅰ)涵义:在变化范围内,只能取一定数值,且彼此不连续的变量。 附:数值是整数,通过计算个体数目多少而得到的称之为计数数据。 (Ⅱ)几何意义及其表达:代表数轴上的一个独立的点值,取值是有限的。对于非连续变量 来说,其变量值不存在实限问题。所以可直接表达。1,2,3,4? (二)数据的基本问题 1、数据的涵义:事物关系的具体表 现形式, 它是从量的方面去反映和标志事物某种特征的有单位的数值。 它是对具体事物进行 计数或测量的结果。如, 2、数据的特点: A 变异性(波动性) :即用同一方 法对同一样本的各个个体进行测 试所获得的结果不同,甚至用同一方法多次测试同样个体,结果也不完全相同。?? B 规律性:在一定时空范围内,数据呈现差异的同时又存在一定的规律性。?? 3、数据的种类: (1)数据的获得方式不同:可分为 A 计数数据:计算个数的方式得到的数据,以整数的数量形式表示。 B 测量数据:借助一定的测量工具或一定的测量标准而得到的数据 既可以是整数,又可以用分数来表示。它只是一个代表值。 (2)根据数据是否具有连续性,可分为离散性数据和连续性数据。 一般说来,数据测量水平(等级)越高,应用范围越广泛;反之,应用范围越受限。等级高 的数据可兼有等级低数据的功能;而不能相反。统计学上也将数据分为两大类型:定性数据 和定量数据。 定性数据也称品质数据, 它说明的是研究对象的品质特征, 不能用数值来表现, 主要代表定类数据和定序数据。在 spss 中为处理方便,常用数字或数码去标示它,但这时 的数字或数码 只起分类标记作用, 而无数量和序列的涵义, 因而不是数值或数据; 定量数据也称数量数据, 它说明的是研究对象的数量特征,能用数值来表现,主要代表定距数据和定比数据。对于这 两类不同类型的数据, 要采用不同的统计方法进行处理和分析。 对品质数据通常计算出频数 和频率,并进行卡方检验;而数量数据则可以用均值和其它更为复杂的统计方法进行分析, 并进行 Z 检验、F 检验和 T 检验。 二、数据资料整理的意义 1、统计资料的整理是对统计调查的进一步深化 2、统计资料的整理是统计分析的前提 三、数据资料整理的方法 (一)鉴别资料的真实性 方法:计算检查;逻辑检查 (二)分组和次数分布 1、分组。分组也叫归类,即根据形式不同,可分为 (1)性质类别――按照事物的不同性质进行分类。如,将学生作文成绩分为:甲、乙、丙、 丁,将健康状况分为:好、中、差,将员工对工作的满意度分为:很满意、基本满意、不满 意。等等。然后再把具有相应性质的人归入某个等级组中,以便查明各等级组的人数情况和 总体的情况。 (2)数量类别――按照数值大小排序分组 A 等级排列,即按等级大小排列成序。究竟是数值大的还是数值小的排在第一等,这要看 事物本身所反映的性质。如果是学习成绩或能力测验分数,当然是数值大的为第一等级;如 果是反应时及完成一项工作所需要的时间,数值小的当然为第一等级。此外,在对一组数据 按等级排序时,常遇到等级数值相同的数据,如:61,60,60,58,57,57,57,55,这 时又应当怎样排等级呢? 具体方法是:不管相同数目的个 数是多少, 将其各相同数据应占的等级相加再平均 (相同数据所在的等级相加再除以数据的 个数) ,所得的平均等级作为这几个相同数据的共同等级。?? 1(61) ,2.5(60) ,2.5(60) ,4(58) ,6(57) ,6(57) ,6(57) ,8(55) 这里应注意两点:等级数应与数据的个数相同,即 8 个数据应有 8 个等级数;在相同数据后 面的数据,其等级应与相同数据等级平均之前所占等级相连接。如:58 为第 4 等,那么相 隔 3 个书后的 55 应为第 8 等。 B 按照数值大小直接由小到大排列。如果数据太多,就要编制一个次数分布表。 2、编制次数分布表 (1)次数分布表的涵义:表现总体单位在各组的次数分配情况的统计表,叫做次数分布表 (2)几种常见的次数分布表的编制 A 简单次数分布表 结构:组别(观测值分组)和次数(频率)构成。见 P35 a 整列并求全距 全距:最大值与最小值间的距离,即该组数据最大值减最小值之差用 R 表示 b 定组数:分组的数目即为组数。 用 K 表示。组数要根据数据多少来确定,但编制次数分布表的前提是“数据较多” ,所以数 据就不会很少。如果数据在 100 左右或更多,那么根据经验,组数一般确定为 10―15;或 者按照计算公式精确计算,如 P32 公式。 c 求组距 组距:各组数据的组内间距。组距内的各数据即便数值有大小之别,但统计学上,每个数据 都有平等分享组距空间的权益, 也就是说, 组距内的每个数据所占的组距内的距离是等长的。 用 i 表示 i = R / K 即分组后上下限之间的距离。组距一般取整数值。 d 定组限 组限:各组数据的起止范围,即各组数据在数值上的起点值和终点值。但为了计算方便,常 把最高或最低组组限稍作延伸。见 P34。组距和组限确定后,如果从最低组开始分组,那么 第一组为 60~63,按照连续数据的性质,该组的实际上下限应当的 59.5~62.5,再根据左闭 右开的数据区间的归属原则,小于 62.5 的数据应归入该组;等于或大于 62.5 的数据应归入 63~66 这一组, 因为 63~66 的实际范围是 62.5~65.5 , 其余类推。 按照习惯, 次数分布表中, 各组的上限常常省略。见 P35 次数分布表。 e 求组中值 组中值是居于各组数据分布中点位置的数值, 是各组数据的代表值。 如 85~89 这组内有 85, 85,85,88 四个数据,虽然有 3 个数都不与组中值 87 相等,但我们在对次数分布表中的分 组数据进行统计量的计算时,都用 87 这一组中值代表组内 4 个数据,这虽然与原始数据计 算的统计量有一定误差,但正负抵消之后的误差一般都在允许的范围内。正因为如此,我们 才能以组中值作为该组内所有数据的代表值。组中值用符号 M 或 Xc 表示 f 归类划记 g 记录次数 h 核对 B、累计次数分布表 以简单次数分布表的基础,就可编制出累计次数分布表。见 P37 C、相对次数分布表即频率分布表 此外, 还有累计百分比分布表和双列次数分布表, 只要简单次数分布表的编制方法和技术掌 握后,??第三节数据的表达 (重点.自学) 一、统计表 (一)统计表及其作用 (二)统计表的结构:标题、表号、标目、线条(两边不封闭) 、数字、表注 (三)统计表编排原则和要求 (四)统计表的种类及其编制步骤 二、统计图 (一)统计图及其特点作用 (二)统计图的结构:标题、图号、标目、图形、图注 (三)统计图的编排规则 (四)统计图的种类及其编制步骤 提醒:请熟练掌握 excel(电子)表格的数据录入和图表制作方法。该技术可用于基本的信 息统计和教务管理以及简单的定量研究。 *** spss 中两种数据录入及数据排序方法 见 P10 对中学家长的问卷调查 spss 中如何定义变量及录入数据(spss 配套数据 EG2-1 中学 家长问卷) 。 课后作业与练习: 1、定类变量、定序变量、定距变量和定比变量的涵义、特点与适用条件 2、调查方案的制定应作好哪些工作? 3、写出下列各数的精确限 832.9,7.675,23.0,78,1.302 4、编制统计表和统计图各应遵循哪些原则? 5、条形图、圆形图和次数分布图分别适合什么样的统计资料? 6、名词解释:连续变量、离散变量、品质数据、数量数据 7、P53 第 4、6、7 题。 1. 定性数据/品质数据/离散数据/计数数据/等级数据等-----适用的基本统计分析方法有------频数/频率/统计图/统计表/卡方检验以及一些相关分析方法 2. 定量数据/数量数据/连续数据/测量数据/定距数据/定比数据-----适用的基本统计分析方 法有-------频数/频率/统计图/统计表/平均数/标准差/各种检验方法以及一些相关分析方法第三章集中量数 教学目的:了解集中量数的作用与种类;理解集中量数、集中趋势、权数、权重与加权;掌 握集中量数性质、特点、适用范围和优缺点;熟练掌握各集中量数的计算及使用。 教学重点: 权数、 权重与加权; 集中量数性质、 特点、 适用范围和优缺点; 加权算术平均数、 几何平均数和中位数的应用 教学方法讲授法讨论法 第一节 集中量数的概述 前面我们讨论了数据资料的搜集、整理和表达?? 一、什么是集中量数 代表一组数据典型水平或集中趋势的量,又称代表值。如,常用平均水平(平均数)代表一 个班级或一个群体的整体水平或一般水平。 二、什么是集中趋势 数据向某一点集中或靠近的现象,称为数据的集中趋势。如,全年级同学的成绩都会在平均 数上下或左右波动, 距离平均数远一点的数据即高分和低分会相对较少, 离平均数越近的数 据会逐渐增多,数据的这种向某一点(比如平均数)集中或靠近的现象,就是数据的集中趋 势。 三、集中量数的作用和种类 (一)作用 1、能反应大量数据向某一点集中的情况。据此,我们一旦知道某个群体的平均水平,也就 能确认这个群体中绝大多数个体的水平与平均水平差不多。 2、它把研究对象各量数的差异抽象 化(模糊化) ,用一个概括一般 的简单数据来描述和代表研究对象的一般水平, 并且可用它对同质的另一个研究对象作比较, 还为进一步的统计分析奠定基础。 (二)种类 1、算术平均数(M 或)___Mean 2、中位数(Md)――Median 3、众数(Mo)____Mode 4、几何平均数(Mg)___geometric mean 5、调和平均数(MH)―harmonic mean 第二节算术平均数 一、算术平均数的概念及特性 (一)算术平均数的概念 各观测值的总和 / 观测值的个数所得之商,可称为均数、均值、平均数,它是统计学中最 常用的。公式为: (二)算术平均数的特性(数学性质) 1、平均数与观测值个数的乘积等于各观测值的总和 2、如果对每个观测值加减一个任意值 A ,那么平均数也增加或减少这个数 A。 3、如果每个观测值乘以或除以任意一个值 A ,那么也等于平均数乘以或除以该数 A。 4、各观测值与其算术平均数之差的总和等于 0。即离均差或离差之总和为 0。 5、各观测值与平均数离差平方和同各观测值与其它任意值的离差平方和相比为最小。这 就是推论统计中常用到的“离差平方和最小”原则,即由该性质推导而来。并且,根据该原 则,可推定“样本平均数是总体平均数的最佳估计值” 。 二、算术平均数的计算方法 (一)简单算术平均数(据原始数据计算) (二)加权算术平均数 1、相关概念: A、 权数:即各变量值出现的次数或在一个总体中所占的比重(通常用分数、频率或比率表 示) 。 B、 权重:即某数据出现次数的多少,可以权衡其在该组数据中的重要性或代表性程度,有 权衡轻重的意思。 C、 加权:用权数乘以各变量值,即所谓对变量值进行加权。 2、计算方法: ①据原始数据求平均数 原始数据还在,且各原始数据的权数(次数或比重)已知,则按下列公式计算。例 1 某年级 4 个班的学生人数分别为 50,52,48,51,期末各班数学考试平均成绩依次为 90,85,88,92,求年级的平均成绩。 例 2 某小学三年级数学期末总平均成绩规定为平时占 20%,期中占 30%,期末占 50%。某 学生数学平时成绩为 96, 期中考试成绩为 80, 期末考试成绩为 92。 求该生期末总平均成绩。 ②据分组后的数据求平均数 若数据资料已分组,原始数据已不见,但每组数据的个数或次数已知或可求出,那么,可用 组中值代表该组内各数据。这时的计算公式为: 其中,f 为各组的数据个数即代表组内各数据的组中值的权数,Xc 为各组组中值,为为数据 总数目即 N。例题见 P 58 三、算术平均数的优缺点 (一)优点 1. 一般优点: (1)反映灵敏 (2)确定严密 (3)简明易懂 (4)适合代数运算 2. 特殊优点: (1)只知一组观测值的总和与总频数即可求算术平均数。 (2)用加权法可求出几个平均数的总平均数 (3) 据样本数据求得的算术平均数最接近于总体平均数的真值, (这是与中数和众数等集中 量数相比而言)它是总体平均数的最好估计值。 (4)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它 (二)缺点 1、易受两极端数值的影响 2、一组数据中,某个数据的大小,糊涂不清或不够确切,就无法计算平均数。 3、整理的数据,组距不等距的情况和分组出现开口组的情况 四、算术平均数的适用条件 (一)适用于同质数据,不同质的数据,不能计算算术平均数 (注:同质数据――指使用同一个观察手段,采用相同观测标准,能反应某一个问题的同一 方面特质的数据) 2、要求一组数据中每个数据都比较准确、可靠,若数据模糊不清或分组资料有不确定 组限时,不能计算平均数。 3、无极端值出现,这是平均数受极端数据影响较大的缘故 4、需要得到一个相对精确可靠的集中量数或进一步参与其它运算。 5、只适合用几何平均数的情境则不宜用算术平均数第三节中位数 一、中位数的概念 是指一组数据按大小顺序排序后,位于一组有序数据中间位置的量数,又叫中数,或中点数 二、中位数的计算方法 (一)数据较少时由原始数据求中位数 若数据个数 N 为奇数,那么位于中间位置(N+1)/ 2 ,若数据个数 N 为偶数,那么居于中 间位置 N/2 和 N/2+1 上的、那两个数的平均数是这组数据的中位数。 例 1,5 名学生的语文考分 60,68,71,80,83 的中位数是? 例 2,8 名学生的数学考分 58,64,70,74,79,81,89,92 的中位数是? (二) 当数据个数较多既可直接通过 spss 操作得到, 也可在次数分布表求中位数, 公式为: 见 P58 次数分布表。由于中位数所在位置与次数累积方向有关,所以,我们仅以自下而上累 积的次数分布情况为例, 讨论如何计算中位数。 自上而下累积的次数分布情况基本思路一样。 具体步骤: 1、求 N/2,为中位数所在的位置,并找出中位数所在的分组区间 2、确定中位数所在的分组区间的精确下限,记为 Lmd 3、求含有中位数那一区间组下限 Lmd 以下的累积次数,记为 ni 4、求 N/2 与 ni 之差,记为 (N/2―ni) , 表示中位数所在位置到该组的精确下限 Lmd 这一段距离内有多少个数据。 ?? (三)在中位数附近出现重复数据时求中位数 具体步骤: 1、将这些相同数据视其在组距为 1 的次数分布的同一组中 2、确定中位数所在组的精确下限 3、根据 求它 如:求数据 2,3.8,5,5,5,8,8.7,10 的中位数 三、中位数的优缺点 (一)优点 1、不受两极端特殊量数的影响 例: 一项研究通过调查得到 19 名中学教师月收入情况如下 (单位, 元) : 1200, 1270, 1300, ,,,,,,1580, ,4000。请问,他们的月平均收入情况如何? 解:因这 19 名教师的收入中存在极端数据,M=1626.3 元,已不能很好反映他们的平均收入 情况 (19 人中有 17 人月收入低于 1626.3 元) , 故应用中位数来代表其一般水平。 于是, Md= (19+1)/2=10,即 1390 元。 2、在两端界限不明确的分布中,即分组出现开口组时,不能求平均数,但可以求中位数。 3、一组数据中有个别数据不确切、不清楚时,要用中位数反映其平均水平。 (二)缺点 1、不适合进一步代数运算。如,不能将 N 个中位数综合求出一个总的中位数。 2、反应不够灵敏。求中位数不是每个数都参与计算,而主要由数据的个数决定,所以它反 应不够灵敏,但这正是中位数的特殊价值所在。 四、中位数的适用条件 (一)当一组数据有极端值时。 (二)当一组有序数据有个别数据模糊不清时。 (三)当需要快速估计一组数据的代表值时。 (四)分组资料有不确定组限即分组出现开口组时。 第四节几何平均数 一、几何平均数的涵义及基本公式 (一)涵义 当一组数据中存在极端数据且分布呈偏态时, 或者当一组数据中任何相邻数据之比, 接近于 某个常数,即数据按一定比例关系变化时,用来表示其平均水平的量数。 如第一种情况:3,6,9,10,35。 因出现极端数据 35,且呈偏态。 第二种情况,如,某高校自 93 至 96 年的招生数分别为:,。因相 邻两数据之比为常数 1,如果要了解这几年的平均变化情况以及平均增长情况,就必须用几 何平均数来表示。当然,如果只需了解这几年的平均招生人数,则用算术平均数表示。 (二)基本公式 二、几何平均数的应用与计算 (一)当一组数据存在少数极端数据,分布呈偏态时,直接用基本公式计算几何平均数 例:有一研究者想研究介于 S1 与 S2 两感觉的物理刺激量是多少,他随机抽取 10 名被试, 让其调节一个可变的物理量的刺激,使所产生的感觉恰好介于 S1 与 S2 之间,然后测试所 调节的物理刺激量,10 名被试的结果如下:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6, 18.0 因发现有 15.6 和 18.0 两极端数据,且分布呈偏态,所以直接用基本公式计算。经计算,结 果为 8.552。如果计算算术平均数,则为 9.22,显然偏大。相比之下,几何平均数更能代表 该组数据的集中趋势。 (二) 当一组数据间的变化是按一定比例关系变化时, 如果想了解平均变化情况和平均增长 情况,要用几何平均数基本公式的变式计算 ①每年的变化率已给出,直接用公式 例: 已知某校四年中各年度的学生人数分别为上一年的 1.12 倍, 1.09 倍, 1.08 倍和 1.06 倍, 求年度的平均变化率。 注意:此时的 1.12 等比率值即是原始数据。两者相同的是,表示的都是平均水平;不同的 是,前者求的是几何平均数,而后者求的是平均变化率。 ②每年的变化率没给出,只有原始数据,则用公式 注意:1、其中 a1 表示一组数据中最先的原始数据,a N 表示最后的原始数据。 2、a2/ a1 相当于基本公式中的 X1 基本公式中的 N 表示 N 个数据,而据原始数据求平均变化率中的 N-1 表示 N-1 个比率值。 ★如果要了解平均变化情况或平均变化比率,就直接用上述公式。可见,平均变化情况或平 均变化比率,既可根据比率求出也可根据原始数据求出。 ★在平均变化情况或平均变化比率求出后, 如果要进一步了解教育经费的平均增长率、 学习 进步率或提高率等,可据得到的平均变化率或平均发展速度,再用公式:平均增长率=平均 变化率―1,求出平均的增长率、学习进步率或提高率。如上例。 ★在得到平均增长率后, 如果还要进一步了解――从某一年开始预测未来几年的情况, 那么 可用上述公式的又一变式 X=X′ *(Mg)N 其中 X 表示想了解的未来情况的预测数 X′表示预测基础数,从哪一年开始预测,这一年的基础数是多少 Mg=1+平均增长率即平均变化率,N 表示预测的年度数目(3 年后??,那么 N 为 3) ,或 者,从 2005 年开始预测,到 2010 年该校的招生人数是多少?这种情况下, N =预测终止年-预测的起始年 练习: 例 1:某生第一到第五周分别记住英语单词数为:20,23,26,30,34。问该生记英语单词 的平均变化率是多少?进步率又是多少? 例 2:某校连续四年的毕业人数分别依次是:980,,1300,问毕业生平均增长 率是多少?若该校毕业生一直照此速度增长,那么再过 5 年,该校毕业人数是多少? 例 3:某校 1970 年的教育经费是 10 万元,2002 年是 121 万元,问该校教育经费的年增长 率是多少?若一直按此比率增加,问 2010 年该校的教育经费是多少? (三)几何平均数的适用条件 1、求一组等比或近似等比数据的平均数时 2、一组数据中有少数偏大或偏小的数据,数据分布呈偏态,求平均数时(此时算术平均数 已不能很好反映数据的典型情况) ,当然这种情况下求中数、众数也可。 3、在教育领域,主要应用几何平 均数求平均发展速度、增长率、 进步率、提高率,以便对某个理 想目标进行预测估计 *** 见 P69 对中学家长的问卷调查 spss 基本统计分析中如何计算集中量数 (spss 配套数据 EG2-1 中学家长问卷与 EG13-1 某班学生成绩) 。 应用 crosstabs 进行分析----实例----潘 P62 课后作业与练习: 1.名词解释:集中量数,集中趋势,权数,权重,加权2. 简答题: ①算术平均数的优缺点及其适用条 件 ②几何平均数在教育上的作用 ③中位数的适用条件 3. 计算题: ①某年级有 5 个实验小组,第一组 8 人,第二组 13 人,第三组 11 人,第四组 9 人,第五组 10 人,在一次实验后得知各组平均分依次分别为:81,79,84,90,73,求全年级 5 个实 验小组的总平均分。 ②某初中最近 4 年毕业生统一会考的平均成绩如下, 问, 该校初中毕业成绩的平均变化率是 多少? 时间:94 1995 成绩:52.31 60.65 63.78 71.42 ? 某市 1998 年至 2002 年高中毕业生人数分别为:,,2880,问, 该市这几年高中毕业生人数的年均变化率和年均增长率是多少?照此速度增长,到 2010 年 该市有多少高中毕业生? ④ P80 第 4 题、第 5 题 第四章差异量数 教学目的:了解差异量数的种类及其与集中量数的区别;理解差异量数、离中趋势、绝对差 异量数和相对差异量数;掌握百分位差、标准差、差异系数和标准分数的性质、特点、适用 范围和优缺点;熟练掌握百分位差、标准差、差异系数和标准分数的计算与运用。 教学重点: 绝对差异量数和相对差异量数; 百分位差、 标准差、 差异系数和标准分数的性质、 特点、适用范围和优缺点及其运用。 教学方法:讲授法讨论法 在进入差异量数讨论之前,我们先看看下面的问题: 某班有甲、乙两位同学,数学的平时测验分数为: 甲:54,63,70,82,90,74,99 乙:67,70,72,82,78,79,84 现在要从中选 1 名学生参加全市的数学竞赛,请问,该选谁去最好??? 第一节差异量数的概述 一、什么是差异量数 所谓差异量数就是用来衡量数据离中(注意与集中量数的区别)趋势大小程度的量数。 二、什么是离中趋势 一数列中各数据离开集中量数(如平均数)距离远近的趋势 三、差异量数的种类有哪些 全距百分位差平均差方差或标准差差异系数标准分数 T 分数等 四、在数轴上,集中量数与差异量数有何不同 在数轴上集中量数表现为量尺上的一点,是点值。 而差异量数表现为量尺上的一段距离。 全距是最大值与最小值之间的一段距离; 百分位差是 两个百分位数之间的一段距离; 平均差是每个数据与平均数之间的平均距离; 标准差是总体 数据与平均数的标准距离(经过标准化处理的平均距离) ,即以平均数为 1 个单位值对总体 数据的差异程度进行度量,表示差异程度有多少个平均数。标准差的平方就是方差,反之, 方差的算术平方根就是标准差; 差异系数是以平均数为 1 个单位值对标准差的大小进行度量, 表示标准差的大小有多少个平均数。 标准分数是以标准差为 1 个单位值去度量每个数据距离 平均数有多远,也就是有多少个标准差。可见,差异量数表示的都是量尺上的一段距离,只 不过这段距离的单位不同而已。 第二节全距和百分位差 一、全距(极差) (一)全距的性质 ??R=Xmax―Xmin (二)全距的计算方法(spss) (三)全距的作用和适用情况 ??一般情况下,全距只用于资料的预备性检查,目的在于大体了解数据的分散范围,以便 确定分组的方法。但是?? A:1,2,5,10,15,18,19 B:2,8,9,10,14,19,17,20 二、百分位差(百分位距) (一)涵义 用次数分布中,两个百分位数之间的差距,来描述数据离中趋势的一种差异量数。即在一定 范围内求全距。 常用的百分位差:P90―P10 ,P93 ―P7 ,P75―P25 百分位差在意义上与全距一样, 都是用来表示数据的离散程度的, 只是表示离散程度的数据 范围不同而已。 如果把一个次数分布看成是一个整体或一个基本单位, 那么全距是在一个次 数分布中的 100%的范围内求全距,而百分位差可理解为是在一个次数分布中的一定范围内 求全距,所以全距和百分位差可理解为同类型的差异量数,只不过当数据两端出现特大、特 小值时, 全距的代表性低, 为提高差异量数的代表性, 就必须考虑在数据集中的位置或地段, 求一定范围内的数据的“全距” ,于是产生了百分位差和四分位差这样的差异量数或统计方 法。 (二)常用的百分位差(包含四分位差)的计算方法(spss) 1、P90-P10,P93-P7 ①首先计算百分位数 据百分位差的定义,它是两个百分位数之差,因此要计算百分位差,首先要计算百分位数。 在中位数的讨论中我们已经知道,N/2 表示的是中位数所在的位置,如果把一组数据看成是 一个整体或一个基本单位,然后把它 100 等分,那么中位数所在的位置就在第 50 分位,即 可表示为 N*50/100,即 N/2;如果用 PP 表示第 P 个百分位,那么 P50 就表示第 50 个百分 位数即中位数,依次类推:P90 就表示?其位置就在 N*90/100,P10 就表示?其位置在?同 理,P93 和 P7 表示的统计意义和位置也可明确。 据在次数分布表计算中位数的公式 若用以上分析的百分位数表示,那么在次数分布表计算中位数的公式,也可表示为: 这样,把该公式推广为第 P 个百分位数,就得到计算百分位数的一般公式: 按照理解中位数计算公式的思路,来理解百分位数的公式,就不难得出:因为中位数的统计 意义是----把一组数据分为对等的两部分即中位数上下的数据各为 50%,由此,第 P 个百分 位数 Pp 的统计意义就是----在 Pp 以下包含数据分布中全部数据的 P%,在 Pp 以上包含数据 分布中全部数据的(100-P)% 思考: P90 和 P10 上下的数据个数分别是多少, 于是不难得到这样的结论:百分位数是中位数的推广(普遍情况) ,中位数是百分位数的特 例。 百分位数的计算步骤与中位数基 本相同: (1)即第 P 个百分位数所在的位 置 P*N/100,并找出该百分位数 所在的分组区间 (2)确定百分位数所在组的精确下限 L p (3)算出 L p 以下的各组次数和,计为 ni (4)求 P%N 与 ni 之差 (5)将上述结果代入公式: 例 1:某班数学成绩分布表,求 P90―P10,P93―P7 组别 次数 自下而上 累计次数 90―95 3 45 85―90 13 42 80―85 8 29 75―80 11 21 70―75 5 10 65―70 3 5 60―65 2 2 解:P90 = 84.5 + ( 45*90/100-29 ) *5/13 = 84.5+ 4.423 = 88.923 P10 = 64.5 + (45*10/100-2)*5/3 = 64.5 +4.167 =68.667 P90-P10=88.923-68.667 = 20.256 表示有 80%的数据分布在全距为 20.256 这样的范围内 P93 = 84.5 + ( 45*93/100-29 )*5/13 = 89.442 P7 = 64.5 +(45*7/100-2)*5/13=66.417 P93 - P7 =89.442―66.417=23.025 表示有 86%的数据分布在全距为 23.025 这样的范围内 例 2:某地区参加高考的学生共 200000 人,计划录取 18000 人,初选拟定 20000 人,试问 分数线应如何划定? 某地区高考成绩次数分布表 成绩 次数 自下而上累计 自上而下累计 500 以上 258
490―500 557
480―490 784 9 470―480
以下 289 200000步骤: 第一步,编制累计次数分布表 第二步,确定 Pp 所在位置,此题要求自上而下累计次数为 20000 人,那么自下而上的累计 次数就为 180000 人 (录取分数线以下考生人数) , 实际上就是所确定的百分位数以下的人数, 据百分位数的统计意义,该百分位数就是 000,即 90%分位。因此,百分位数就 在自下而上累积的 180088 所在的组,即 410―420 这一组。 第三步,确定 P90 所在组的精确下限 第四步,确定小于 Lp 的各组次数累计和 解: 录取线以上人数为总人数的: =10%, 则录取线以下人数为总人数的 90%, 于是需要求出 P90 这一百分位数。 P90=409.5+(/100-173663)* 10/ 2、P75-P25 和四分位差 如果按前面讨论的把一个次数分布看成是一个整体或一个基本单位,然后把它 100 等分, P75-P25 就是百分位差; 而如果把它 4 等分, 那么第 1/4 处即为第 25 个百分位数所在的位置, 也就是 25N%(1N/4) ,该点通常被称为前四分位数,同理,第 3/4 处即为第 75 个百分位数 所在的位置,也就是 75N%(3N/4) ,该点通常被称为后四分位数。把一组数据 100 等分后 两个百分位数之差称为百分位差, 那么,把一组数据 4 等分后,第 3/4 处的后四分位数( P75)与第 1/4 处的前四分位数之差 的一半就是四分位差。用公式表示为: Q = (Q3-Q1)/2 意义:表示一个次数分布中,中间 50%的数据的一半 四分位差的计算方法是:不管数据分组还是未分组,其基本公式都是但 Q1 和 Q3 的具体计算方法不同。 A、未分组数据 Q1 和 Q3 的求法 1、 先排序,确定 N 为偶数还是奇数 2、 若 N 为偶数,Q1 和 Q3 所在的位置(并非四分位数)分别为:例:计算下面数据的四分位差: 25,22,29,12,40,15,14,39, 37,31,33,19,17,20,35,30 解:首先排序 据公式 =12.5 =(33+35)/2 =34 =4.5 =(17+19)/2 =18 于是,所求四分位差为: =(34-18)/2 =8 3、若 N 为奇数,Q1 和 Q3 所在的位置分别为:具体计算方法与偶数情况的计算类似。 B、已分组数据 Q1 和 Q3 的求法=P25 =P75 例:据某班学生数学成绩的次数分布情况表求 P75-P25 和四分位差。 某班学生数学成绩的次数分布情况表 组别 次数 自下而上 累积次数 90- 3 45 85- 13 42 80- 8 29 75- 11 21 70- 5 10 65- 3 5 60- 2 2 根据前面公式: =P25=74.5+5/11*(11.25-10)=75.07=P75 =84.5+5/13*(33.75-29)=86.33 于是得 P75-P25 的百分位差为: P75-P25=86.33-75.07=11.26 四分位差为: =11.26/2=5.63 (三)百分位差与四分位差的适用条件 1、当数据两端出现极端数值时,用百分位差与四分位差能较好反映一组数据的差异程度。 2、一组数据的两端有个别数据模糊不清或分组资料有不确定组限时 注意:1、P90-P10、P93-P7、P75-P25 都表示位于次数分布表中间两个百分位数之间的分布 范围,分别表示占 80%、86%、50%的数据的“全距” ,是根据实际的需要和数据分布的情况 及特征来确定的。 2、后面要讨论的计算差异系数时:其基本公式为 ,公式表明,是用平均数来表示一组数 据的集中趋势的,因而分子用标准差 S,但当一组数据必须用中位数来表示其集中趋势时, 那么,计算差异系数的公式将变成,可见此时分子只能用四分位差 Q,而不能用标准差 S第三节平均差与标准差 在本章第二节的内容中介绍的?? 一、平均差 (一)概念: 各量数与其平均数之差的绝对值之 和的平均数,也就是离均差或离差 的绝对值之平均数,通常用“AD” 表示公式为: 思考讨论:为什么要用绝对值? (二)计算方法 1、 原始数据的计算方法 2、 分组数据的计算方法 各组组中值代表组内各数据的数值 平均差虽然是一种易于理解、 计算简便的差异量数, 可以用来说明一数列各量数的平均离中 趋势或差异情况,但是,平均差是用离差的绝对值来计算的,因而不适合用代数方法作进一 步处理。?(因为打开绝对值要讨论三种情况)这就在很大程度上限制了平均差的使用范围。 因此,现在的问题是,要是能找到一种差异量数,既保证每个数的离均差是一个正数,又能 方便作进一步处理。有没有? 于是数学家带着这样问题, 在此基础上, 通过研究找到了另一种更好的差异量数――标准差。 二、标准差 (一)概念 各量数与其平均数离差的平方和的平均数的平方根。用 S 或 SD 表示 其基本公式为 思考讨论:为什么要平方?又为什么要开方?平方之后是否会改变其性质? (二)计算方法(spss) 1、原始数据计算的方法 ① ② 2、分组数据的计算方法(三)标准差的组合(合成) 只有在运用同一种观测手段,测量的是同一种属性,仅仅是样本不同。例:某年级有 4 个班,各班某科成绩如下:1 班 35 人,平均成绩 80 分,标准差 8 分;2 班 40 人,平均成绩 75 分,标准差 10 分;3 班 40 人,平均成绩 78 分,标准差 9 分;4 班 37 人,平均成绩 70 分,标准差 10 分。求 4 个班的总平均成绩和总标准差。 (三)标准差的适用条件 1、 与算术平均数配合使用, 且与算术平均数适用条件相同。 即一组数据的一般水平适合用 算术平均数描述时,其离散程度适合用标准差描述。 2、 计算其他统计量,如差异系数、相关系数、标准分数等,需要用到标准差。 3、 在推断统计中,尤其是进行方差分析时,常用方差(标准差的平方)表示数据的离散程 度。 第四节相对差异量数和相对位置量数 一、绝对差异量数和相对差异量数 (一)绝对差异量数 前面讨论的几种差异量数, ??所谓绝对差异量数, 是指结果都附有与原资料相同单位的差 异量数。 其适用条件是: 当所观测的样本水平比较接近, 并对同一种属性使用同一测量工具进行测量时, 要比较不同 样本之间离散程度的大小,一般考虑直接比较标准差或方差即绝对差异量数。 否则,考虑其它的差异量数,如差异系数、相对位置量数等相对差异量数。这是因为,在科 学研究中,只根据其绝对差异量数比较离散程度的大小,有时是不合理的,这时就得用相对 差异量数进行比较。 (二)相对差异量数 1、涵义、种类及公式 相对差异量数,是指不具有单位 的差异量数。如差异系数或变异 系数 CV-coefficient of variation) 。差异系数有: 平均差与平均数的百分比,即平 均差的差异系数,公式为 四分位差与中位数的百分比,即 四分位差的差异系数,公式为 标准差与平均数的百分比,即标准差的变异系数,简称标准差异系数或相对标准差。公式为 在三种差异系数中,标准差异系 数或相对标准差使用最多。 2、标准差异系数或相对标准差的意义 由上式可知,差异系数已经没有 单位。使用这样的相对差异量数 比较数据离散程度的大小,其意 义如下:以平均数作为比较的起始点或参照点。 ? 以平均数为 1 个单位值, 对标准差进行量度, 表示一组数据中的全体数据的平均差异程 度或总体差异程度,相对于该组数据的平均数而言,占平均数百分比的大小,即百分之多少 个平均数,也就是该组数据相对于自身平均数的离散程度。可见,差异系数主要应用于平均 数不等于零的连续数据。 差异系数越大表明离散程度越大,反之表明离散程度越小。这一点也可从公式中得到证实。 CV 与 S 成正比还是反比关系? 接下来的问题是, 什么情况下不可直接用绝对差异量数而必须用相对差异量数去比较两列变 量的差异情况呢? 3、相对差异量数的适用条件或者需要解决如下问题时: ? 比较不同单位资料的差异程度。如,一组变量值是身高变量,另一组变量值是体重变量 ? 比较单位相同而平均数相差较大的两组资料的差异程度 ? 可判断特殊差异情况 根据经验,一般 CV 值常在 5%-35%之间。如果 CV 大于 35%时,可怀疑所求得的平均数 是否失去了意义;如果 CV 小于 5%时,可怀疑平均数与标准差是否计算有误。 ◆可衡量学校教学是否面向全体,并作为分析学生成绩是否两极分化的指标。 量化判断的标准是: CV≤8.75%表明无分化现象 8.75%&CV&33.4% 表明有分化倾向 若 CV≥33.4% 表明已有分化现象,应引起教师与管理者重视。 例 1:某班学生的物理和化学的平均分分别为 85、72,标准差分别为 6.82、6.82,请问这两 门学科成绩哪科更整齐?(比较标准差相同而但平均数不同的两组资料的差异程度) CV1=(6. 82/85)*100%=8.02% CV2 = (6. 82/72)*100%=9.47% 如果就算能直接比较,显然差异程度是一样的。 例 2:已知某小学一年级学生的平均体重为 25 Kg, S1=3.7Kg,平均身高为 110cm, S2=6.2cm,请 比较体重与身高的离散程度哪个更大?(比较计量单位不同的数据资料的差异程度) CV1=(3.7/25)*100=14.8% CV2 = (6. 2/110)*100%=5.64% 如果就算能直接比较,差异程度则刚好相反。 例 3: 1975 年上海市区两组女童体重的数据 平均数 标准差 差异系数 2 个月组 5.45 千克 0.62 千克 11.38% 6 岁组 19.02 千克 2.12 千克 11.15% (比较单位相同而平均数相差较大的两组资料的差异程度) 二、相对位置量数 在教育与心理的科研及评价实践中,人们经常?? 讨论:我院}

我要回帖

更多关于 统计学原理 pdf 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信