协方差分析中用f检验结果分析怎么判断是否落在拒绝域内

君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
SPSS统计分析—差异分析.ppt
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口后使用快捷导航没有帐号?
查看: 4469|回复: 6
F检验如何分析和解读?
中级会员, 积分 337, 距离下一级还需 163 积分
论坛徽章:1
如题,请教各位,希望能讲得通俗易懂点,谢谢!
金牌会员, 积分 1133, 距离下一级还需 1867 积分
论坛徽章:1
推荐你看数理统计的书籍,不过简单一点就是两个卡方分布分布除以自由度后相除,F(n-1,m-1)(v/n-1)/(u/m-1),
金牌会员, 积分 1170, 距离下一级还需 1830 积分
论坛徽章:1
查表确定分位数后确定拒绝域,看介值是否进入拒绝域
高级会员, 积分 989, 距离下一级还需 11 积分
论坛徽章:2
F统计量在统计里面主要是对 方差做检验用的。它又叫做方差齐性检验。
从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。   
其中要判断两总体方差是否相等,就可以用F检验。
F统计量的构造即为 两个服从卡方分布的统计量分别除以各自的自由度再相除。
F=(w/n)/(v/m) 其中 W,V为服从卡方分布的统计量,n,m为W,V的自由度
论坛徽章:2
F检验应该的意思应该是构建统计量符合F分布而作相应推断吧~目前学过的有
1,判断两者的方差是否为相同,因为通过F分布构建原理可以得到两样本的方差的比值。
2,最近学的,关于单因素方差分析(ANOVA)也可以根据离均差平方的性质构建F统计量而做检验~所以说是看具体情况吧
中级会员, 积分 337, 距离下一级还需 163 积分
论坛徽章:1
来的都是客,非常的感谢!
新手上路, 积分 16, 距离下一级还需 34 积分
论坛徽章:0
一头雾水中
扫一扫加入本版微信群六西格玛数据分析技术
σσσ σσ σSSMC六西格玛管理培训丛书(5)? 何晓群 主编六西格玛数据分析技术何晓群 编著 光盘作者:陶 沙 苏晨辉1中国人民大学出版社中国人民大学六西格玛质量管理研究中心1 σσσ σσ σSSMC目 录课程概要 第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章 基本统计概念 概率及其应用 管理中常见的几个概率分布 参数估计 假设检验 离散数据的卡方检验 方差分析 相关分析与一元回归 多元回归分析退出放映中国人民大学六西格玛质量管理研究中心2 返回目录 σσσ σσ σSSMC课程概要z z z z 课程要点 培养对象 欲达目的 课时安排中国人民大学六西格玛质量管理研究中心3 返回目录 σσσ σσ σSSMC课程要点1. 2. 3. 4. 5. 6. 7. 8. 9. 数据收集与整理描述 概率及其在质量管理中的应用 质量管理中常见的几个概率分布 参数估计及其应用 假设检验及其应用 离散数据的卡方检验 方差分析及其应用 相关分析与一元回归 多元回归及其应用中国人民大学六西格玛质量管理研究中心4 返回目录 σσσ σσ σSSMC培养对象开展六西格玛管理 项目的黑带及黑带大 师候选人和掌握统计 技术与方法应用的人。中国人民大学六西格玛质量管理研究中心5 返回目录 σσσ σσ σSSMC欲达目的通过本课程的学习你将达到: 理解统计数据分析主要方法的基本理论 树立起六西格玛管理的统计思想 掌握了基本统计方法在管理中的应用 能熟练运用Minitab软件实现数据分析 建立起运用统计方法解决管理问题的能力1. 2. 3. 4. 5.中国人民大学六西格玛质量管理研究中心6 返回目录 σσσ σσ σSSMC课时安排(36课时)基本统计概念 概率及其应用 管理中常见的几个概率分布 参数估计 假设检验 离散数据的卡方检验 方差分析 相关分析与一元回归 多元回归分析 4课时 4课时 4课时 4课时 4课时 4课时 4课时 4课时 4课时第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章中国人民大学六西格玛质量管理研究中心7 返回目录 σσσ σσ σSSMC第1章 基本统计概念1.1 1.2 1.3 1.4 1.5 1.6 1.7 常用数据分析技术概述 总体与样本 数据的收集 数据的类型 数据集中趋势的测度 数据离散程度的测度 数据基本分析的软件实现小组讨论与练习中国人民大学六西格玛质量管理研究中心8 返回目录 σσσ σσ σSSMC本 章 目 标1. 理解数据分析在6σ管理中的重要意义 2. 理解几个常见的统计概念 3. 树立企业管理人员量化管理的统计意识 4. 掌握几种不同平均数的计算方法 5. 掌握标准差和变异系数的计算方法中国人民大学六西格玛质量管理研究中心9 返回目录 σσσ σσ σSSMC1.1 常用数据分析技术概述界定 界定 Define Define 控制 控制 Control Control 量测所得 各种数据 Data 量测 量测 Measure Measure改进 改进 Improve Improve分析 分析 Analyze Analyze中国人民大学六西格玛质量管理研究中心10 返回目录 σσσ σσ σSSMC数据分析的意义界定 界定 Define Define 控制 控制 Control Control 量测 量测 Measure Measure6σ管理目标 顾客满意改进 改进 Improve Improve分析 分析 Analyze Analyze中国人民大学六西格玛质量管理研究中心11 返回目录 σσσ σσ σSSMC可靠的数据及分析是解决问题的根本确认问题 如何解决 现在的问题 设计量测指标 选择收集数据的方法 管 理 中 的 问 题 获得数据 分析数据 历史的 近期的 最新的得到分析结果 制定解决方案决策及行动中国人民大学六西格玛质量管理研究中心12 返回目录 σσσ σσ σSSMC1.2 总体与样本由样本信息作为总体信息 估计值总体X =?这个企业员工的月 平均收入是多少?从 总 体 中n 信 x = ∑ xi / n 息 i =1抽取一小部分x样本13中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC总体、个体与样本、样品总体(population):把研究的一类对象的全体称为 总体。 个体(individual,item):把构成总体的每一个成员 称为个体。 样本(sample):从总体中抽出的部分个体组成的 集合称为样本。 样品:样本中包含的个体成为样品。 样本容量(sample size):样本中包含的个体的数量称 为样本容量,通常用n表示。中国人民大学六西格玛质量管理研究中心14 返回目录 σσσ σσ σSSMC1.3 数据的收集6σ管理是一种科学的量化管理 没有数据就没有管理 没有数据的统计分析就等于无米之炊 数据资料的来源有两种:原始资料和二手资料 抽样是企业管理中收集数据的最普遍方法 宏观数据资料的获取主要依赖于各种统计年鉴和咨询 顾问公司中国人民大学六西格玛质量管理研究中心15 返回目录 σσσ σσ σSSMC关于抽样方法概率抽样和非概率抽样 概率抽样(随机性原则) ? 简单随机抽样(simple random sampling) ? 分层抽样(stratified sampling) ? 整群抽样(cluster sampling) ? 等距抽样。又称系统抽样(systematic sampling) 非概率抽样 配额抽样中国人民大学六西格玛质量管理研究中心16 返回目录 σσσ σσ σSSMC1.4 数据的类型6σ管理中通常遇到两种类型的数据:定类数据 定性数据 定序数据计量数据 定量数据 计数数据数据是决策的依据中国人民大学六西格玛质量管理研究中心17 返回目录 σσσ σσ σSSMC定量数据计量数据定 量 数 据计数数据中国人民大学六西格玛质量管理研究中心18 返回目录 σσσ σσ σSSMC计量数据――连续型数据怎样获得计量数据连续型数据连续型数据19中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC计数数据――离散型数据计数或事件发生的频率:如,顾客满意度调查中不满意的 人数。 需要较大的样本量,以更好地描述产品或服务的某种特性。满意的和不满意的人数就是数出来的瓷砖中的斑点数20中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC变量、参数和统计量变量是说明和描述事物某种特征的指标 变量的种类变量的种类分类变量顺序变量数值型变量随机变量连续型随机变量离散型随机变量参数 统计量中国人民大学六西格玛质量管理研究中心21 返回目录 σσσ σσ σSSMC1.5 数据集中趋势的测度反映样本位置的统计量 样本均值 x 设有样本数据 x1 , x2 ,..., xn1 n x = ∑ xi n i =1x就是样本均值样本中位数:将样本数据按从小到大排序后,处 于中间位置上的数就是中位数。中国人民大学六西格玛质量管理研究中心22 返回目录 σσσ σσ σSSMC加权算术平均数加权算术平均数nx = ∑ ω i xii =1xi在数据集中 其中ω i 为 x的权重(weight),表示 i所占的比重,而 ∑ ωi = 1 ; ωi ≥ 0i =1 n1 当权重相同,即 ωi = , i = 1,2,..., n 时 n加权算术平均数即为简单算术平均数。中国人民大学六西格玛质量管理研究中心23 返回目录 σσσ σσ σSSMC几何平均数几何平均数(geometric mean)将所有n个数x1 , x 2 ,...,xn 连乘,然后开n次方,即x g = n x1 × x 2 × ... × x n = n∏xi =1nix g代表几何平均数,Π为连乘符号 其中:当n&2时,为了方便计算可采用对上式两边取对数的方法计算:1 1 n log x g = (log x1 + log x 2 + ... + log x n ) = ∑ log xi n n i =1注意几何平均数一般用于计算在一段时间内有复式增长 的数据的均值中国人民大学六西格玛质量管理研究中心24 返回目录 σσσ σσ σSSMC几何平均数(续)几何平均数适用于计算在一段时间内有复式增长的数据的均值情况。这在企业中要经常用到。如企业成长10年来每年有个增长率, 试计算这10年的平均增长率;1995年――2004年每年有个国 内生产总值GDP的增长率,求1995年到2004年的平均增长率。 例:某投资者于2000年、2001年、2002年及2003年的持有 期回报(HPR)分别为1.2、1.3、1.4及0.8。试计算该投资者 在这四年内的平均持有期回报。 解:利用几何平均数计算持有期回报: 平均HPR = 1.2 × 1.3 × 1.4 × 0.8 = 1.149744该投资者平均每年持有期回报为1.1497。如果该投资者在2000 年初投资额为$100,那么到2003年底,他的财富将成为$100 × 1.1497 = $174.4 。中国人民大学六西格玛质量管理研究中心25 返回目录 σσσ σσ σSSMC1.6 数据离散程度的测度一批统计数据相对它的均值而言,这些数据的离散程 度如何? 数据波动的统计量通常有三种: 数据波动的统计量极差样本方差与 样本标准差变异系数中国人民大学六西格玛质量管理研究中心26 返回目录 σσσ σσ σSSMC极差(range)一组数据中的最大值与最小值之差称为极差,用R表示。 极差的计算十分简单,如某企业中员工的最大月收入是 12000元,最低月收入是800元,则 R=1=11200(元) 极差的计算简单,它是一种最简单的度量离散程度的方法。 极差的缺点也很明显,因为它只考虑了极端值,丢失的数据信 息较多。 现在的社会居民收入分配相差很大,这对社会稳定很不利。极 差让我们可以更清醒地认识到贫富差距。所以极差还是很有意 义的一个统计量。中国人民大学六西格玛质量管理研究中心27 返回目录 σσσ σσ σSSMC方差与标准差σ2 =总体方差∑ ( X i ? X ) 总体标准差2 i =1NNσ =2 ( ? ) X X ∑ i i =1NN2 ( x ? x ) ∑ i i =1 n样本方差s2 =∑ (xi =1ni? x)2样本标准差s=n ?1n ?1实际应用中常用样本标准差作为总体标准差的估计值。 方差不能带量纲(单位),这样就得不到合理解释; 只 有标准差才能带单位。中国人民大学六西格玛质量管理研究中心28 返回目录 σσσ σσ σSSMC均值与标准差概念的直观理解设有两组样本数据分别为: 2、4、6、8、10 4、5、6、7、8 把这两组数据分别标在下面的直线轴上0 024 4 56 6 78 810中国人民大学六西格玛质量管理研究中心29 返回目录 σσσ σσ σSSMC均值与标准差概念的直观理解(续)1 × ( 2 + 4 + 6 + 8 + 10 ) = 6 5( 2 ? 6 ) 2 + ( 4 ? 6 ) 2 + ( 6 ? 6 ) 2 + ( 8 ? 6 ) 2 + (10 ? 6 ) 2 = 3 . 16 4第一组数据的 x =s =第二组数据的 xs ==1 × (4 + 5 + 6 + 7 + 8) = 6 5( 4 ? 6 ) 2 + (5 ? 6 ) 2 + ( 6 ? 6 ) 2 + ( 7 ? 6 ) 2 + (8 ? 6 ) 2 = 1 . 58 4由这两组数据的均值和标准差,结合上面的图形,我们可 以直观地看到这两组数据均以6为中心,但前面5个数的离散程 度要大于后面5个数的离散程度。第一组数的标准差是3.16, 第二组数的标准差1.58。这个例子让我们更直观地体会到标准 差以及均值的意义。中国人民大学六西格玛质量管理研究中心30 返回目录 σσσ σσ σSSMC变异系数例1-3:设有甲、乙两个企业,他们职工月奖金的 平均 数及标准差如下(单位:元) 甲: 乙:x = 100 , s = 10 x = 80 , s = 9.6试问甲、乙两个企业哪个企业职工的月平均奖金 相差较大? 你怎么判断这个问题,你的答案是什么?中国人民大学六西格玛质量管理研究中心31 1.7 数据基本分析的软件实现返回目录 σσσ σσ σDisplay Descriptive Store Descriptive Statistics … Statistics … Basic StatisticsSSMCStat中国人民大学六西格玛质量管理研究中心32 返回目录 σσσ σσ σSSMC基本输出结果1Display Descriptive Statistics …在绘图窗口的输出分布图箱形图置信区间中国人民大学六西格玛质量管理研究中心33 返回目录 σσσ σσ σSSMC基本输出结果2Display Descriptive Statistics …程序输出窗口关于身高数据的统计量分析 Store Descriptive Statistics … 在工作表中的结果输出中国人民大学六西格玛质量管理研究中心34 返回目录 σσσ σσ σSSMC小组讨论与练习1. 试举本企业中关于总体、样本、个体和样品的例子。 2. 试举实际问题中哪些数是连续型数据,哪些数是离散型数据。 3. 某企业2000年到2003年的销售收入增长率分别是15%、20%、 23%、28%,请问这四年的销售收入平均增长是多少? 4. 从某啤酒厂的一批瓶装啤酒中随机抽取了10瓶,测得装量分别 为:(单位:ml) 640、639、636、641、642、638、639、643、636、639 试计算样本均值与样本标准差。 5. 从某厂生产的两种不同规格的车轴中,各随机抽取了20根,测 得它们的直径的均值与标准差分别为 甲产品 x = 40 mm , s = 1 . 01 mm 乙产品 x = 120 mm , s = 2 . 1mm 试问哪种产品的质量波动大?中国人民大学六西格玛质量管理研究中心35 返回目录 σσσ σσ σSSMC第2章 概率及其应用2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 掷骰子的游戏 概率及概率的计算 概率的性质与运算法则 条件概率 独立性 全概率公式 贝叶斯公式 概率树小组讨论与练习中国人民大学六西格玛质量管理研究中心36 返回目录 σσσ σσ σSSMC本章目标1. 理解随机事件及其概率的基本思想 2. 掌握概率的性质与运算法则 3. 理解条件概率与事件的独立 4. 理解优质产品不是检验出来的理念 5. 掌握全概率公式和贝叶斯公式的应用 6. 会运用概率树解决有关问题中国人民大学六西格玛质量管理研究中心37 返回目录 σσσ σσ σSSMC2.1 掷骰子的游戏?一枚骰子掷下去后点数为1、2、3、4、5、6各出现的可能性 有多大? ?我们大家都知道一枚骰子掷下去后, 各个点数出现的机会均等,每个点数 出现的可能性都是1/6。可能出现 的点数 可能性 大小1/61/61/61/61/61/638中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC一个顾客的期望?设有一对完全相同的骰子,把这一对骰子随机掷下, 一对骰子两两组合的点数最多出现11种结果,这种结果 的组合点数可能是2、3、4、5、6、7、8、9、10、11、 12。 ?有位顾客,仅仅需要能两两组 合成4、5、6、7、8、9、10、 11的结果。请问能使这位顾客期 望实现的概率有多大?不能使这 位顾客满意的风险是多大?中国人民大学六西格玛质量管理研究中心39 返回目录 σσσ σσ σSSMC一对骰子出现的全部组合有多少?点骰数子组合1骰子22 3 4 5 6 73 4 5 6 7 84 5 6 7 8 95 6 7 8 9 106 7 8 9 10 117 8 9 10 11 1240中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC一共有36个组合,每个组合出现的概率是 1/36=0.0278骰 每 个 子 的 组合 1 概 率 骰子20.8 0.8 0.80.8 0.8 0.80.8 0.8 0.80.8 0.8 0.80.8 0.8 0.80.8 0.8 0.8?骰子1与骰子2分别出现任何给定值的概率都等于1/6 ?任一给定组合发生的概率 =1 1 × = 0.41中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC2.2 概率及概率的计算?古典概型 随机事件常用大写的英文字母A、B、C等表示。随 机事件A的概率,用P(A)表示事件A所包含的基本事件的个数 m P( A) = = 样本空间所包含的基本事件个数 n ?统计概型m P( A) = = p n 其中:n表示相同情况下试验的次数, m表示某事件A出现的次数,比值m/n 称为事件A发生的频率。中国人民大学六西格玛质量管理研究中心42 返回目录 σσσ σσ σSSMC计算组合点数出现的概率出现的组合点值2 3 4 5 6 7 8 9 10 11 12组合个数(m)1 2 3 4 5 6 5 4 3 2 1概率0.6 0.1 0.7 0.1 0.6 0.027843中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC能使那位顾客满意的程度有多大?18% 16% 14% 12%8.34%LSLUSL2.78%概率10% 8% 6% 4%2% 02 3 4 5 6 7 8 9 10 11 12出现的组合点数中国人民大学六西格玛质量管理研究中心44 返回目录 σσσ σσ σSSMC2.3 概率的性质与运算法则?概率的公理化定义在研究随机现象中,把表示随机事件A发生的可能性大小的实数 称为该事件的概率,用P(A)表示。前苏联的柯莫哥洛夫于1933年给 出如下的概率公理化定义: 1. 非负性:对任一随机事件A,有P( A ) ≥ 02. 规范性:必然事件的概率为1, 而不可能事件的概率为0,即P(?) = 1P(Φ) = 03. 可加性:如果A与B是两个互不相容事件(互斥),则P( A U B) = P( A) + P( B)中国人民大学六西格玛质量管理研究中心45 返回目录 σσσ σσ σSSMC概率的性质与计算?由概率的公理化定义不难得到概率的其它许多性质, 如: 1. P( A ) = 1 ? P( A )其中A与A互为对立事件。AB图1Ω2. P( A U B) = P( A) + P( B) ? P( AB) 1所示。 事件A与事件B如图P( AB) = P(Φ) = 0,此性质 当A与B互不相容时, 退化为可加性公理。中国人民大学六西格玛质量管理研究中心46 返回目录 σσσ σσ σSSMC2.4 条 件 概 率?在现实世界中,任何随机试验都是在一定条件下进行的。这里我 们要讨论的条件概率,则是当试验结果的部分信息已知(即在原随 机试验的条件下,再加上一些附加信息)。例如当某一事件B已经发 生时,求事件A发生的概率,称这种概率为事件B发生条件下事件A 发生的条件概率,记为P(A|B)?由于增加了新的条件(附加信息),一般来说,P(A|B)≠P(A)。中国人民大学六西格玛质量管理研究中心47 返回目录 σσσ σσ σSSMC乘 法 公 式P( B) & 0 (1)(2)?由前一页最后的结果,我们看到条件概率有如下的计算公式:即条件概率可由两个无条件概率之商来计算。 ?对上边的公式变形,即得P ( AB) P( A | B) = P( B)P( AB) = P( A | B) P( B)此公式就是所谓的概率乘法公式。 ?如果将A、B的位置对换,这时有 P(BA)=P(B|A)P(A),而P(AB)=P(BA),于是P( AB) = P( B | A) P( A)公式(2)与(3)统称为概率的乘法公式。(3)48中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC一 个 例 子?例2-4:设有1000件产品,其中850件是正品,150 件是次品,从中依次抽取2件,2件都是次品的概率是多 少? 解:设A i表示“第i次抽到的是次品”, i =1,2,所求 概率为P(A1A2)。 因为 150 149 P ( A1 ) = , P ( A2 | A1 ) =
运用乘法公式可得 150 149 P ( A1 A2 ) = P ( A1 ) P ( A2 | A1 ) = ? = 0.9即抽到工件都是次品的概率是2.24%。中国人民大学六西格玛质量管理研究中心49 返回目录 σσσ σσ σSSMC2.5 独 立 性?在使用概率的乘法公式时,一般都要计算概率,但是在事件A与B 独立的情况下,乘法公式就会变得简单。 ?什么是独立事件呢? 一般认为,两个事件中不论哪一个事件发生与否并不影响另一 个事件发生的概率,则称这两个事件相互独立。当两个事件相互独 立时,其条件概率等于无条件概率,即P( A | B) = P( A),P( B | A) = P( B)因此,当两个事件相互独立时,其乘法规则可以简化为:P( AB) = P( A) ? P( B)我们甚至可以用这一公式来判断A、B两个事件是否独立!中国人民大学六西格玛质量管理研究中心50 返回目录 σσσ σσ σSSMC产出合格率的计算?某种产品的生产流程由两道主要工序组成。每一道工 序的最终生产合格率都是99%,那么,整个生产过程的 产品合格率是多少?99%工序199%工序298%99% × 99%=98% 因为两道工序是独立的,每件产品都要通过这两道 工序加工,这符合乘法原则。因此,生产过程的产品合 格率是98%。中国人民大学六西格玛质量管理研究中心51 返回目录 σσσ σσ σSSMC优质产品的生产靠检验吗?制 板 喷 漆 95 90 安 装 95 90例如生产家具的流程有制板、喷漆、安装三道工序,合 格率和优等率如下表所示:按成品合计 0.953 ×100=86 0.903 ×100=73 按过程合计 86 73合格率(%) 优等率(%)95 90企业如何提高产品合格率和优等率?中国人民大学六西格玛质量管理研究中心52 返回目录 σσσ σσ σSSMC每道工序都应严格检验吗?制板 检验前合格率(%) 检验后合格率(%) 优等率(%) 95 100 90 喷漆 95 100 90 安装 95 95 90 按成品 合计 86 95 73 按过程 合计 86 86 73现在第一和第二道工序间及第二和第三道工序间增 加检验,把不合格品剔除,得可见,增加工序检验的效果只是提高了按成品合计的合 格品率,付出的代价是: 第一,按生产过程的合格率仍然很低,只有86%,浪费 巨大,成本增高; 第二,优等品率仍然只有73%,产品在市场上只能是质 低价廉。中国人民大学六西格玛质量管理研究中心53 返回目录 σσσ σσ σSSMC提高流程能力才是根本!如果提高过程能力,不设检验制板 合格率(%) 优等率(%) 99 98 喷漆 99 98 安装 99 98 按成品 合计 97 94 按过程 合计 97 94……,可见产品的质量是制造(设计)出来 的,不是检验出来的!中国人民大学六西格玛质量管理研究中心54 返回目录 σσσ σσ σSSMC2.6 全 概 率 公 式?全概率公式主要用于计算较为复杂情形随机事件的概率。 ?全概率公式实质上是加法公式和乘法公式的综合运用和 推广。?例2-6:某车间用甲、乙、丙、三台机床 进行生产,各台机床加工零件的次品率分别 是5%,4%,2%,它们各自的零件分别占 总产量的25%,35%,40%。三台机床生 产的零件混在一起,求任取一个零件是次品 的概率。管接头镗孔机床中国人民大学六西格玛质量管理研究中心55 返回目录 σσσ σσ σSSMC例2-6 的求解?令A1表示“零件来自甲台机床”, A2表示“零件来自乙台 机床”, A3表示“零件来自丙台机床”,B表示“抽取到次品”。 ?则事件发生当且仅当下列三种情形任意出现一种: 1.是甲机床生产的零件且为次品(A1B); 2.是乙机床生产的零件且为次品(A2B ); 3.是丙机床生产的零件且为次品(A3B )。 ?显然,事件B是A1B, A2B,A3B这三个两两互不相容事 件的和,用公式表示为: B=A1B+ A2B+A3B中国人民大学六西格玛质量管理研究中心56 返回目录 σσσ σσ σSSMC例2-6 的求解(续)?根据加法公式: P(B)=P(A1B)+P(A2B)+P(A3B) ?分别对P(AiB) (i=1, 2, 3)用乘法公式: P(AiB)= P(Ai) P(B|Ai), i=1, 2, 3 于是得: 3P ( B ) = ∑ P ( Ai ) P ( B | Ai )i =1?代入已知数据: P(A1)=0.25, P(A2)=0.35, P(A3)=0.40 P(B|Ai)=0.05,P(B|Ai)=0.04,P(B|Ai)=0.02 P(B)=0.0345 即任取一件产品是次品的概率为0.0345。中国人民大学六西格玛质量管理研究中心57 返回目录 σσσ σσ σSSMC全概率公式的总结P ( B ) = ∑ P ( Ai ) P ( B | Ai )我们就称这个公式为全概率公式。i =1 n?一般情形,设n个事件A1,A2,A3,…,An互不相容, P(Ai)&0, i=1,2,…,n,事件B满足,B ? A1+A2+ …+An ,则?全概率公式的直观意义是:某一事件B的发生有多种可能的原因 Ai(i=1,2,…,n ),如果B是由原因Ai所引起的,则B发生的概率是P(AiB) (i=1,2,…,n )。每一事件Ai发生都可能导致B发生,相应的概率是 P(B|Ai) ,故B发生的概率是:P ( B ) = ∑ P ( Ai B ) = ∑ P ( Ai ) P ( B | Ai )i =1 i =1nn当直接计算P(B)较困难,而P(Ai) ,P(B|Ai) (i=1,2,…,n ) 的计算较简单 时,就可以利用全概率公式计算P(B)。例2-6 就是这样计算的。中国人民大学六西格玛质量管理研究中心58 返回目录 σσσ σσ σSSMC2.7 贝叶斯公式P( Ai ) P(B | Ai )?设n个事件A1,A2,A3,…,An互不相容, P(Ai)&0, i=1,2,…,n, 事件B满足,B ? A1+A2+ …+An ,则P( Ai | B) =∑ P( A ) P(B | A )j =1 j jn(i = 1,2,L, n)这就是著名的贝叶斯公式,也称为逆概率公式。 贝叶斯公式是英国统计学家贝叶斯(T?Bayes)给出,在其去世后 的1763年才发表。该公式是在观察到事件B已发生的条件下,寻找导 致B发生的每个原因Ai的概率。P(Ai)和P(Ai|B)分别称为原因Ai的验前 概率和验后概率。 ?此公式在实际应用中,可帮助人们确定引起事件B发生的最可能原 因。中国人民大学六西格玛质量管理研究中心59 返回目录 σσσ σσ σSSMC贝叶斯公式计算举例?例2-7:在上例中,如果抽到的一个零件是次品,分别求这一次品是由 机床甲、乙、丙生产的概率。 解:有关假设与例7相同。现已知事件B发生,求事件A1,A2,A3发生 的概率。由贝叶斯公式P(Ai B) P(Ai | B) = = P(B)P( A i ) P( B | A i )∑ P( A ) P( B | A )j =1 j j3代入已知数据(见例7),计算得P ( A1 | B ) = (0.25 × 0.05 ) 0.0345 = 0.3623类似有P(A2|B)=0.406, P(A3|B)=0.232。 本例中的P(Ai)是事件(取到的一件是次品)发生之前事件Ai发生的概率, 是由以往数据分析所得,故称验前概率。 P(Ai|B)是事件(取到的一件次品 (B))发生后事件Ai发生的概率,它是获得新信息(即事件B发生)之后再重新 加以修正的概率,故称P(Ai|B)为验后概率。中国人民大学六西格玛质量管理研究中心60 返回目录 σσσ σσ σSSMC2.8 概 率 树?企业的领导层在讨论竞争策略时,常常是众说纷纭,但 当说完后,人们又一筹莫展,没有头绪; ?利用概率树可以帮助企业家理清思路,科学决策; ?概率树就是一种树形图,然后在树干和树枝上标上相应 的概率。?我们用几个例子来说明这一 决策方法的应用。 ?例2-8:掷一对硬币,出现 结果是两个正面的概率是多大?中国人民大学六西格玛质量管理研究中心61 返回目录 σσσ σσ σSSMC掷硬币的概率树?第一个硬币出现的可能结果是正面(概率0.5)和反面(概率 0.5),于是形成两个分支。可以用0.5+0.5=1来检查有无其它可能 性被遗漏。 ?对于这两种可能结果的每一种,对应第二枚硬币均加上相似的两 个分支正(0.5) 正(0.5) 反(0.5) 正(0.5) 反(0.5) 反(0.5) 正反 反正 反反 0.25 0.25 0.25 结果 正正 概率 0.25?于是由概率树及乘法法则,会看到出现两个正面的概率是0.25。中国人民大学六西格玛质量管理研究中心62 返回目录 σσσ σσ σSSMC一个例子? 例2-9:某种产品由甲、乙、丙三台 机床生产,每台机床的生产量不同, 其中60%的产品来自机床甲,30%和 10%的产品分别由乙和丙生产。甲、 乙、丙三台机床产品的次品率分别是 8%、12%和3%。从它们生产的一批 产品中,随机抽取一件产品是次品的 概率是多大?方柱立钻中国人民大学六西格玛质量管理研究中心63 返回目录 σσσ σσ σSSMC例2-9的概率树正品(0.92)) 0.6 ( 甲次品(0.08) 正品(0.88) 次品(0.12) 正品(0.97) 次品(0.03)乙(0.3)丙( 0.1 )由概率树中,我们看到所有次品的三个分枝,及在每一个枝上 相应的概率。为计算随机抽取一件产品是次品的概率,我们利用乘 法法则计算出每一台机床次品分枝出现的概率,在利用概率的加法 法则计算出抽取一件产品是次品的概率为: (0.6×0.08)+(0.3 ×0.12)+(0.1 ×0.03)=0.087中国人民大学六西格玛质量管理研究中心64 返回目录 σσσ σσ σSSMC例2-10:开发新产品的决策例子?设A公司正在考虑是否研制一种新洗手液。目前A拥有30%的 洗手液市场,而它的主要对手B公司拥有70%。最近A公司研究 人员在配方上有所创新,有80%的把握研制出新的洗手液。如 果成功,将形成新的竞争力量。 ?在决策过程中,还需认真研究B公司的反应。估计B公司将推 出新产品相对抗的可能性为60%。如果这种情况发生,则A公司 占有70%市场份额的可能性是0.30,占有50%的可能性是0.40, 占有40%的可能性是0.30。决策者还估计,如果B公司未能研发 出新产品,则A公司占有80%市场份额的可能性是0.80,而占有 50%和40%的可能性都是0.10。如果A公司决定不开发新产品, 则将仍保持现有30%的市场份额。 ?这种问题摆在决策者面前显得很杂乱,无头绪。概率树法可 帮其决策。中国人民大学六西格玛质量管理研究中心65 返回目录 σσσ σσ σSSMC开发新产品的决策概率树份额 场 市 % 70 (0.30) 50%市场份额 司有 公 B 示 ) (0.40) B 1表 (0.60 40%市场 抗 份额 品对 ( 0 .3 0 新产 )S1=0.80×0.60×0.30=0.144 S2=0.80×0.60×0.40=0.192 S3=0.80×0.60×0.30=0.144制 研 示 .80) 表 A 1 功(0 成 A 不 2 表示 成 功 研制 ( 0. 20 )B表 2 示B 没有 对抗 公司 (0.4 0)决策者关心的是市场份额达到50%及以上的各种事件的组合, 由概率树及概率的基本运算法则,状态S1和S2符合要求。则组合 A1B1S1,A1B1S2,A1B2S1及A1B2S2符合要求,由此可计算出市场份额 达到和超过50%的概率是 p=0.144+0.192+0.256+0.032=0.62430%市场份额 维持不变份额 S1=0.80×0.40×0.80=0.256 场 市 ) 80 % (0.80 50%市场份额 S2=0.80×0.40×0.10=0.032 (0.10) 40%市 场份 S3=0.80×0.40×0.10=0.032 额(0.10)中国人民大学六西格玛质量管理研究中心66 返回目录 σσσ σσ σSSMC小组讨论与练习1.两个骰子掷下后,它们的组合点数7 出现的概率最大,但在某两次试验 中组合点数7都没出现,你如何理解 这种现象? 2.某种福利彩票每周开奖一次,每次一等奖的中 奖机会只有十万分之一,你的朋友10年来坚持 每周买一张彩票(每年52周),可从来未中过 一等奖,为什么? 你理解下面的计算公式吗? p=(1-10-5)520=0.9948中国人民大学六西格玛质量管理研究中心67 返回目录 σσσ σσ σSSMC第3章 管理中常见的几个概率分布随机变量 随机变量的分布 随机变量的均值与方差 二项分布及其应用 泊松分布及其应用 正态分布及其应用 中心极限定理 各种概率分布计算的Minitab实现3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8小组讨论与练习中国人民大学六西格玛质量管理研究中心68 返回目录 σσσ σσ σSSMC本章目标1.理解随机变量及随机变量分布的基本概念 2.理解随机变量的均值及方差在管理中运用的思想 3.理解二项分布的意义,掌握二项分布的应用 4.掌握泊松分布的意义和应用理念 5.理解正态分布与6σ的关系 6.理解中心极限定理的意义 7.掌握各种概率分布的计算实现中国人民大学六西格玛质量管理研究中心69 返回目录 σσσ σσ σSSMC3.1 随机变量? 日常生活中,生产实践中随机现象无处不在 ? 把随机现象的结果用变量来表示,就称为随机变量 ? 随机变量是随机现象表示的一种抽象,有了这种抽 象,使得我们的研究更具普遍性。 ? 常用大写的字母X,Y,Z等表示随机变量,随机变 量的取值常用小写字母x,y,z等表示。 ? 随机变量有离散型和连续型两大类中国人民大学六西格玛质量管理研究中心70 返回目录 σσσ σσ σSSMC离散型随机变量? 定义:如果一个随机变量的 取值是可数的,则称该随机 变量是离散型随机变量。 ? 离散型随机变量是仅取数轴 上有限个点或可列个点x1 x2 x3 x4 X 图1公路上的汽车x5x6x7完好瓷砖的数目71中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC连续型随机变量? 定义:如果一个随机变量可取数 轴上某一区间内的任一值,则称 该随机变量为连续型随机变量。 ? 连续型随机变量的取值可以是整 个实数轴上的任一区间(a,b)(如图 2)。a X 图2b中国人民大学六西格玛质量管理研究中心72 返回目录 σσσ σσ σSSMC3.2 随机变量的分布? 随机变量的取值的统计规律就是随机变 量的分布。 ? 知道了一个随机变量的分布就掌握了它 的关键。 ?离散型随机变量的分布。 z 随机变量X可能取哪些值,X取这些值的概率各是 多大? ?连续型随机变量的分布。 z随机变量X在哪个区间上取值,它在任意小区间取 值的概率是多少?中国人民大学六西格玛质量管理研究中心73 返回目录 σσσ σσ σSSMC离散型随机变量的分布X P x1 x2 ¨¨ xn p1 p2 ¨¨ pn? 离散型随机变量的分布常用下面表格形式的分布列来表示:? 用数学表达式表示即为: P(X=xi)=pi,i=1,2,…,n ? 离散型随机变量的分布应满足概率公理化定义的要求,即pi≥0, p1+p2+…+pn=1 ? 掷一枚骰子出现的点数及其概率就可用离散型随机变量的分布列 表示:X(出现的点数) P(所对应的概率)1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/674中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC连续型随机变量的分布? 连续型随机变量X,它可取某一区间内的所有值, 但它的取值不能逐一列出。我们用函数f(x)表示随 机变量X的密度函数。 ? 用概率密度函数f(x)来反映随机变量X在某一区间取 值的统计规律性 ? 连续型随机变量取某一固定值的概率为零 ? 在6σ管理中用连续型随机变量X常常表示产品的某 种质量特性,譬如啤酒的装量、电子元件的灵敏度、 电子产品的寿命等。中国人民大学六西格玛质量管理研究中心75 返回目录 σσσ σσ σSSMC质量特性与概率密度函数? 在生产制造业的管理现场我们常常要抽取若干样品测定某种产品 的质量特性X。如在啤酒厂今天生产的啤酒中随机抽取若干瓶量 测它们的装量(ml),就可用直方图表示它们的质量特性。随着测 定的数量越多,直方图就会演变成一条光滑曲线,这就是所谓的 概率密度函数曲线,它就刻画出隐藏在质量特性X随机取值后面 的统计规律性。这条光滑曲线f(x)告诉了我们什么信息?LSLUSLLSLUSLLSLUSL635 LSL640645 USL635 LSL640645 USL635 LSL640645 USL635 640645635640645635640645 76中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC概率密度曲线的几种不同情形? 在管理现场,不同产品的不同质量特性所表 现的概率密度曲线不同,这决定了形状不同, 散布不同,位置不同。正是这些不同的曲线 形式决定了质量特性的差别。正态偏态形状不同散布不同位置不同77中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC概率密度函数的性质? 概率密度曲线的纵轴在做直方图时,它是“单位长度上的频 率”,由于频率的稳定性,于是用概率代替了频率,从而纵 轴就演变成为“单位长度上的概率”,这也是为什么把密度曲 线称为概率密度曲线的缘由。 ? 连续型随机变量的密度函数f(x)具有如下性质: 1. f ( x ) ≥ 0 P (a & X & b) +∞ f(x) 2. ∫? ∞ f ( x ) dx = 1 3. ∫ f ( x ) dx = P ( a & X & b )b aabx其中 P(a & X & b) 表示质量特性值在区间(a,b)中的概率。 ? 这里涉及到积分概念,不必感到忧虑,因为积分计算不是重 点。中国人民大学六西格玛质量管理研究中心78 返回目录 σσσ σσ σSSMC3.3 随机变量的均值与方差? 前面第1章中看到的具体数据可以用均值和方差来分别描 述数据的集中趋势和离种趋势,随机变量也有均值和方 差的概念,用它们分别表示分布的中心位置和分散程度。 ? 在掷骰子例子中,每次掷下后出现的点数不仅相同,平 均出现的点数是多少?在啤酒的装量测定中,每瓶啤酒 的装量严格来说都不一样,它们的平均装量是多少?这 就是随机变量的均值问题。 ? 相对均值而言,每次掷骰子出现的结果都在它的左右, 那么平均的偏差有多大?假如一批瓶装啤酒的平均装量 是640ml,各瓶偏离640ml的多少都不一样,它们平均 偏离是多少?这就是随机变量的方差及标准差问题。中国人民大学六西格玛质量管理研究中心79 返回目录 σσσ σσ σSSMC随机变量均值与方差的理解? 生产或服务过程中的差别是难以避免的。生产过程中由 于种种随机因素的影响,使得我们无法避免变异的产生。 ? 在扔飞镖时,谁都想发发命中靶心,可遗憾的事常常发 生!1 234 51 234 5如何理解上面两图的结果 计算多次投标的平均结果就是求均值,计算相对均值的 离散程度就是计算方差。中国人民大学六西格玛质量管理研究中心80 返回目录 σσσ σσ σSSMC如何理解直方图? 直方图的上下公差限的总宽度是对生产能力的一个设计。在大 部分时间里,生产运行的结果就在这一区间上发生。 ? 譬如,根据啤酒装量的抽检数据建立了如下的直方图T废品 废品期望值 640 中国人民大学六西格玛质量管理研究中心81 返回目录 σσσ σσ σSSMC直方图的解释? 图形纵轴表示在某一范围内量测到的数目,公差限以内就 是合格品,出了公差限就是废品。 ? 上图中的T值就是均值(640ml),也即数学期望。这是一 个理想值,也就是说,设计人员期望每瓶啤酒的装量正好 是640ml,然而由于种种说不清道不明的原因的影响,不 可能,也不存在正好的640ml,于是只要在上下公差限之 内的都是合格品,出了上下公差限的就是废品。 ? 假如总共抽检了300瓶啤酒,有10瓶低于下规格限LSL, 15瓶超过了上规格限USL,因此,这批产品的废品率是 25/300=0.083 合格率是1-0.083=0.917,即合格率为91.7%中国人民大学六西格玛质量管理研究中心82 返回目录 σσσ σσ σSSMC实际与理想的差距我们应该意识到,一个 生产过程内在的精度不 是由设计人员及设计方 案所规定的。就像我们 扔飞镖每一发都想命中 靶心,但往往事与愿违。 提高质量的核心就是优 化流程,减小变异,提 高生产流程内在的精度。 这是6σ管理的精髓。中国人民大学六西格玛质量管理研究中心83 返回目录 σσσ σσ σSSMC6σ管理的目标是缩小实际与理想的差距LSL USLTT是目标值,期望值,设 计值。然而常常在生产实际 中,生产实际的中心值会发 生变化,偏离目标值。这也 说明实际生产结果的中心值 x 是独立于设计值规定的目标 值(T)的。 6σ管理的目的就在于优 化流程,减小变异,使实际 生产结果的中心值尽可能与 设计的目标值重合。中国人民大学六西格玛质量管理研究中心84 返回目录 σσσ σσ σSSMC均值的计算公式? 离散型随机变量的数学期望(均值)? = E( X ) = ∑ x i pii? 连续型随机变量的数学期望? = E(X) = ∫ xf(x)dx?∞+∞中国人民大学六西格玛质量管理研究中心85 返回目录 σσσ σσ σSSMC均值计算举例1 1 1 1 1 1 E(X) = ∑ x i pi = 1 × + 2 × + 3 × + 4 × + 5 × + 6 × = 3.5 6 6 6 6 6 6 i =16? 例3-1. 掷骰子试验中出现的点数用随机变量X表示,随机变量X的均 值(数学期望)为即掷骰子出现的结果很不一样,但它们的平均取值是3.5 ? 例3-2. 电子产品首次发生故障(需要维修)的时间通常遵从指数分 布。譬如某种品牌的手机首次发生故障的时间T(单位:小时)遵从指 数分布 ?0.0001xf (x) =0.0001ex≥00x&0问计算这种品牌的手机首次需要维修的平均时间是多少小时。 ∞ ∞ 解: E(T) = ∫0 xf(x)dx = ∫0 0.0001xe ?0.0001x dx = (0.0001) ?1 = 10000 即这种品牌的手机首次需要维修的平均时间是10000小时。中国人民大学六西格玛质量管理研究中心86 返回目录 σσσ σσ σSSMC方差的计算公式σ 2 = D(X) =? 离散型随机变量的方差∑n[x i ? E(x)]2pi? 连续型随机变量的方差σ2= D(X) =∫∞?∞[x ? E(x)]2f(x)dx? 由于方差不能带单位,故用标准差来刻画随 机变量相对均值的离散程度σ =σ2=D(X)87中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC方差计算举例? 例3-3. 掷骰子问题中,出现点数的平均值是3.5,每次取值相对于 均值的离散程度是多大? 解: 1 1 1 σ 2 = D(X) = (1 ? 3.5) 2 × + (2 ? 3.5) 2 × + L + (6 ? 3.5) 2 × 6 6 6 = (2.5 2 + 1.5 2 + 0.5 2 + 0.5 2 + 1.5 2 + 2.5 2 )/6 = 2.92σ = 2.92 = 1.71 即相对均值平均偏离1.71点。 1 E(X) = D(X) = ? 可以证明,指数分布的均值与标准差相等,即 λ 例3-2中某种品牌的手机首次需要维修的平均时间是10000小时, 即标准差σ也为10000小时。标准差如此之大有点不好理解。然而, 凡是遵从指数分布的产品寿命问题就是这样,也即你的期望越高, 标准差必然就大。实际中,也确有同一品牌的手机有的刚刚使用就 遇到故障,而有的用了好几年也不需修理。中国人民大学六西格玛质量管理研究中心88 返回目录 σσσ σσ σSSMC3.4 二项分布及其应用P(X ?n ? x = x) = ? ?x? ? p (1 ? p) ? ? x = 0,1,2, L , nn?x? 二项分布的概率计算公式:? ? 其中 ? ? 是从n个不同元素中取出x个的组合数,计 ?x? ? ? 算公式为: n?n? n! ? ? = ? x ? x! (n ? x)! ? ?二项分布的概率计算公式中有两个重要的参数,一 个是n,一个是p,故通常把二项分布记为B(n,p)中国人民大学六西格玛质量管理研究中心89 返回目录 σσσ σσ σSSMC一个产品检验的例子? 例3-4. 已知某生产流程生产的产品中有10%是有缺陷的,而 该生产流程生产的产品是否有缺陷完全是随机的,现在随机 选取5个产品,求其中有2个产品有缺陷的概率是多大? 解:这是一个符合二项分布情形的问题。设X为抽取的5个产 品中有缺陷的产品的个数,则X是遵从二项分布B(5,0.1)的随 机变量。某一产品有缺陷的概率为p=0.1,n=5。择所要求的 概率为: 5 2 5?2 n p x (1 ? p)n? x 0.1 0.9 = 0.07290 = x 2 P ( X = 2) = 类似可以计算出在抽取的5件产品中有0、1、3、4、5个产品 有缺陷的概率分别为 P(X = 0) = 0.59049, P(X = 1) = 0.32805P(X = 3) = 0.0081, P(X = 4) = 0.00045, P(X = 5) = 0.00001中国人民大学六西格玛质量管理研究中心90 返回目录 σσσ σσ σSSMC二项分布的均值与标准差E(X) = np, σ 2 = D(X) = np(1 ? p), σ = np(1 ? p)? 可以证明,如果随机变量X?B(n,p),它们的均值、方差、标准 差分别为: 在例3-4中,二项分布B(5,0.1)的均值、方差与标准差分别为:? = E ( X ) = 5 × 0 . 1 = 0 .5 σ 2 = 5 × 0.1× (1 - 0.1) = 0.45? 二项分布的计算在n很大时,像上面的那样的运算是很麻烦的, σ = 0.45 = 0.671 然而,通常可以通过查二项分布表直接解决这一问题,或通过 Minitab软件计算。中国人民大学六西格玛质量管理研究中心91 返回目录 σσσ σσ σSSMC3.5 泊松分布及其应用? 在任何生产流程中,缺陷的出现难以避免 ? 缺陷的出现完全是随机的? 单位产品缺陷数的概念? 如果50件产品发现了50处缺陷,则单位产 品的缺陷数为1 ? 生产一件产品无缺陷的最大可能性是多少? ? 一件产品保证不再返工或修理的最大可能性 是多少?中国人民大学六西格玛质量管理研究中心92 返回目录 σσσ σσ σSSMC某一产品无缺陷的最大可能性是多大?? 假设某种产品由10个零部件组成设零部件有缺陷的概率是0.10 该零部件无缺陷的概率是0.900.9010 = 0.重要结论:该种产品无缺陷的最大可能性是34.87%中国人民大学六西格玛质量管理研究中心93 返回目录 σσσ σσ σSSMC零件数和单位产品缺陷数(DPU)产生合格率(以DPU=1为例). . . . . .34800. 0..9100000.10100100010000100000零件数中国人民大学六西格玛质量管理研究中心94 返回目录 σσσ σσ σSSMC对缺陷模型的泊松模拟(DPU=1)e ?1 = 0.36788(d/U)rr P(r) 0.88 0.31 0.07 0.07 0.00 0.00 0.00 0.00? 当零件数趋于无限时,我们可以注意到合格品率趋于: ? 泊松公式:0 1Ur! 其中,d/U是单位产品缺陷数,r是缺 陷实际发生的数量。因此,当r=0时, 就可得到单位产品无缺陷的概率。P =e ?d2 3 4 5 6 7 8 9 10 11 12 13 14∑P = e ?d U 注意:它不同于传统意义上的产品合格 率。例如合格产品的数量比上所有被检 验产品的数量。中国人民大学六西格玛质量管理研究中心95 返回目录 σσσ σσ σSSMC泊松分布的更一般情形? 泊松分布常用来描述在一指定时间、面积、体积之 内某一事件出现的个数的分布。譬如:1.修一条铁路,每月出的伤亡事故数 2.在某一单位时间内,某种机器发生的故障数 3.一辆汽车的表面上的斑痕数 4.你的手机每天接到的呼唤次数? 泊松分布的一般数学形式是:λ x ?λ e ,x = 0,1,2, L P(X = x) = x!其中 λ 为某种特定单位内的平均数。在研究产品缺陷 问题中 λ =d U中国人民大学六西格玛质量管理研究中心96 返回目录 σσσ σσ σSSMC一个实际例子? 例3-5. 某一大型矿山每年发生工伤事故的平均次数为2.7, 如果企业的安全条件没有质的改变,则下一年发生的工伤事故 小于2的概率是多少? 解:设X为下一年发生的工伤事故数,则X遵从 λ 为2.7的泊 松分布,于是X遵从的分布为2.7 x e ?2.7 x = 0,1,2, L P(X = x ) = x! 于是 P(X & 2) = P(X ≤ 1), 可算得 P(X ≤ 1) = 0.24866即下一年发生工伤事故数小于2的概率为24.866%。 ? 可以证明泊松分布的均值与方差相等,且均为λ,即E(x) = λ, σ2 = D(X) = λ, σ = λ中国人民大学六西格玛质量管理研究中心97 返回目录 σσσ σσ σSSMC用泊松分布近似二项分布? 通常在实际应用中,当 p ≤ 0.25, n & 20, np ≤ 5 时,用泊松 分布近似二项分布效果良好。 ? 例3-6. 已知某种电子元件的次品率为1.5‰,在一大批元件 中随机抽取1000个,问次品数为0,1,2,3的概率是多少? 解:把“电子元件的次品数”看成随机变量X,显然X遵从二项 分布B(5)。如果直接利用二项分布公式求解, 就要计算P (X = 0) = 0 1 999 1000 P ( X = 1) = 1 ( 0 .0015 ) ( 0 .9985 )? 显然,计算量很大!3 997 ( 0 . 0015 ) ( 0 . 9985 ) P ( X = 3) =1000 31000( 0 .0015 ) 0 ( 0 .M中国人民大学六西格玛质量管理研究中心98 返回目录 σσσ σσ σSSMC用泊松分布近似二项分布(续)λ = np = 1.5P ( X = 0) = x! 1 0! 1.5 ?1.5 P(X = 1) = e = 0.! M 1.53 ?1.5 e = 0.125511 P(X = 3) = 3! e? 如果用泊松分布去近似计算,则 λx ? λ 1.50 ?1.5=e= 0.223130? 泊松分布与二项分布计算结果的比较P(X=x) P(X=0) P(X=1) P(X=2) P(X=3)二项分布 0....125558泊松分布 0....125511绝对差 0....00004799中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC3.6 正态分布及其应用随机变量X~N(μ,σ2)的正态分布曲线:1 f (x) = e 2πσ(x??)2 ? 2 2σ曲线拐点的横 坐标σ或 sP(a&X&b)=?中国人民大学六西格玛质量管理研究中心100 返回目录 σσσ σσ σSSMC不同的μ、σ对应的正态曲线σ1?2σ2?1 ?2σ相同,μ不同的情况 μ相同, σ不同的情况?1 & ?2σ1 & σ 2101中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMCz 当σ不变时,不同的μ对应的曲线形状不变,仅仅是位置 不同。而当μ不变时,不同的σ对应的曲线形状不同,σ 大的曲线较矮胖,σ小的曲线较瘦高。因此μ反映了曲线 的位置,是位置参数,它是正态随机变量的平均值,也称 μ为正态变量的均值(或数学期望)。σ反映了曲线的形状, 即随机变量取值的离散程度,是形状参数(也称尺度参数), 称σ为正态变量的标准差,σ2为其方差。常记为E(X) = ?Var ( X ) = σ1 n ? = x = ∑ xi ? n i=12n 1 σ = S2 = ( xi ? x ) 2 ∑ n ? 1 i =1102∧ 2中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC标准正态分布蓝色部分的面积: P(-3σ&X&3σ)=0.99731 ? x2 f ( x) = e 2π2?6σ?5σ?4σ?3σ?2σ ?σσ 2σ 3σ 4σ 5σ 6σ? =0中国人民大学六西格玛质量管理研究中心103 返回目录 σσσ σσ σSSMCx ? 1 e 2 2π2z当μ=0,σ=1时 f ( x ) = ,称随机变量X遵从标 准正态分布,记为 X ~ N (0,1) 。如果一个随机变量X遵从 标准正态分布,则其取值落在横轴上任意区间的概率 可通过标准正态分布表查出。 z标准正态分布的分布函数用 Φ ( x) 表示,即Φ ( x) = P( X & x)z例: z当 X ~ N (0,1)时,P ( X & 1.1) = Φ (1.1) = 0.864334Φ (? x) = 1 ? Φ ( x)P ( X & ? x) = 1 ? P ( X & x) 即P ( X & ?1.5) = Φ ( ?1.5) = 1 ? Φ (1.5) = 1 ? 0.933193 = 0.066807中国人民大学六西格玛质量管理研究中心104 返回目录 σσσ σσ σSSMC把一般正态分布转换为标准正态分布中国人民大学六西格玛质量管理研究中心105 返回目录 σσσ σσ σSSMC把一般正态分布转换为标准正态分布1.当 X ~ N ( ? , σ 2 ) 时,要通过变换公式 Z = X ? ? 把一 σ 般正态分布转换为标准正态分布 X ~ N (0,1) 2.当转换为标准正态分布后,查相应的标准正态分布表 3.对于 ? x,可由Φ(?x) = 1? Φ( x) 获取 4.当 X ~ N (0,1) 时,直接查表即可P (a & X & b) = Φ (b) ? Φ (a )P ( X & a ) = 2Φ (a ) ? 15.当 X ~ N ( ? , σ 2 ) 时,有公式:P (a & X & b) = Φ ( b?? a??σ)? Φ(σ)中国人民大学六西格玛质量管理研究中心106 返回目录 σσσ σσ σSSMC例3-7:某批零件的长度遵从正态分布, 平均长度为10mm,标准差为0.2mm. 试问:(1)从该批零件中随机抽取一件,其长度不到9.4mm的概率是多少? (2)为了保证产品质量,要求以95%的概率保证该零件的长度在 9.5mm~10.5mm之间,这一要求能否得到保证? 解:已知X~N(10,0.22) (1)P(X&9.4)=φ((9.4-10)/0.2)=φ(-3)=0.00135中国人民大学六西格玛质量管理研究中心107 返回目录 σσσ σσ σSSMC(2)P(9.5&x&10.5)=φ((10.5-10)/0.2)-φ((9.5-10)/0.2) = φ(2.5)-φ(-2.5)=2φ(2.5)-1=0.98758Z=(X-μ)/σP(9.5&X&10.5)=?9.5 10.5P(-2.5&z&2.5)=?-2.52.5即可以用98.76%的概率保证该批零件的长度在9.5mm~10.5mm之间中国人民大学六西格玛质量管理研究中心108 返回目录 σσσ σσ σSSMC0.46σ与正态分布0.3 Density Value 0.0 0.1 0.2? 6σ ? 5σ ? 4σ ? 3σ ? 2σ?σσ 0 68.27%95.45% 99.73%2σ3σ4σ5σ6σ99.943% 99.05-10-14中国人民大学六西格玛质量管理研究中心109 返回目录 σσσ σσ σSSMC不考虑漂移时6σ水准的合格率为 99.9999998%LSL LSL USL USL1/10亿 亿 1/10 0.1/10亿中国人民大学六西格玛质量管理研究中心110 返回目录 σσσ σσ σSSMC一个容易引起误会的比较图LSL 规格范围 USL0.001ppm 1350ppm?6σ ?3σ1350ppm 标称值=μ+3σ +6σ0.001ppm西格玛水平和对应的合格率中国人民大学六西格玛质量管理研究中心111 返回目录 σσσ σσ σSSMC流程I与流程II的比较USL 流程II 流程 I方差LSL流程II&方差流程I上下限内 & 上下限内 曲线的面积 曲线的面积 上下限内 & 上下限内 所容σ个数 所容σ个数x (样本均值)中国人民大学六西格玛质量管理研究中心112 返回目录 σσσ σσ σSSMC3σ流程与6σ流程的比较LSL 3σ流程 由客户决定 USL废品 1350ppm由客户决定废品 1350ppm合格 6σ流程废品 0.001ppm合格6σ流程比3σ流程好得多!废品 0.001ppm中国人民大学六西格玛质量管理研究中心113 返回目录 σσσ σσ σSSMC流程平均值的漂移LSL 7.5σ USL1.5σ的漂移期望流程面积约等于百万分之3.44.5σ 1.5σ6σ6σ当考虑漂移后 : 6σ&≠&十亿分之二次品率 6σ&=&3.4ppm如果你达到了6sigma质量水准,就意味着在有100万个出现缺陷 的机会的流程中,实际出现的缺陷仅为3.4个中国人民大学六西格玛质量管理研究中心114 返回目录 σσσ σσ σSSMC3.7中心极限定理? 中心极限定理:设X1 , X 2 , L , X n为n个相互独立且同分布的随 机变量,其共同分布未知,但其均值 ? 和方差σ 2都存在,在n 较大时,其样本均值 x近似遵从正态分布,即x ~ N(?,σn2)? 中心极限定理表明:无论共同分布是什么形式,只要独立同 分布随机变量的个数n较大时, X 的分布总是正态分布,这一 结论非常重要。样本均值 X 的均值 ? x = ? ,σ x = σ n 由样本均值的标准差 σ 可以看出,在质量管理中,多次测量 x 的平均值要比单次测量的值更具有稳定性。 ? 在许多统计推断中,只要n ≥ 30 即可采用中心极限定理。当 n&30时,通常需要假定总体遵从正态分布。中国人民大学六西格玛质量管理研究中心115 返回目录 σσσ σσ σSSMC3.8 各种概率分布计算的Minitab实现?二项分布? 以例3-4为例1、在工作表中填入1-5(因为选取了五个产品) 2、选取 Calc & Probability Distributions & Binomial. 3、选取 Probability. 4、在 Number of trials(试验次数)栏中, 填入5. 在 Probability of success(成功概率)栏中,填入 0.10. 5、选取 Input column 并选择数据列. 点击 OK.中国人民大学六西格玛质量管理研究中心116 返回目录 σσσ σσ σSSMC用Minitab计算二项分布概率输入数据选取 Calc & Probability Distributions & Binomial.中国人民大学六西格玛质量管理研究中心117 返回目录 σσσ σσ σSSMC用Minitab计算二项分布概率(续)在 Number of trials(试验次数) 计算得5个产品中有2个产 栏中, 填入5. 在 Probability of 品有缺陷的概率是0.0729 success(成功概率)栏中,填入 0.10.选取 Input column 并选择 数据列. 点击 OK中国人民大学六西格玛质量管理研究中心118 返回目录 σσσ σσ σSSMC用Minitab计算泊松分布概率z 泊松分布z 以例3-5为例1、在工作表中填入1-2(只需考虑2次事故) 2、选取 Calc & Probability Distributions & Possion. 3、选取 Cumulative probability. 4、在 Mean(均值)栏中, 填入2.7. 5、选取 Input column 并选择数据列. 点击 OK.中国人民大学六西格玛质量管理研究中心119 返回目录 σσσ σσ σSSMC用Minitab计算泊松分布概率(续一)输入数据选取 Calc & Probability Distributions & Possion.中国人民大学六西格玛质量管理研究中心120 返回目录 σσσ σσ σSSMC用Minitab计算泊松分布概率(续二)选取 Cumulative probability. 计算得下一年发生的工伤 在 Mean(均值)栏中, 填入2.7. 选取 Input column 并选择数据列. 事故小于2的概率是0.2487 点击 OK中国人民大学六西格玛质量管理研究中心121 返回目录 σσσ σσ σSSMC用Minitab计算正态分布概率z 正态分布 z 计算一个服从μ=28 ,σ=1的正态分布随机 变量小于等于27的概率。1、选取 Calc & Probability Distributions & Normal. 2、选取 Cumulative probability. 3、在 Mean栏中,输入 28. 在Standard deviation(标准差) 栏中填入 1. 4、选取 Input constant 并输入 27. 点击 OK.中国人民大学六西格玛质量管理研究中心122 返回目录 σσσ σσ σSSMC用Minitab计算正态分布概率(续一)选取 Calc & Probability Distributions & Normal.中国人民大学六西格玛质量管理研究中心123 返回目录 σσσ σσ σSSMC用Minitab计算正态分布概率(续二)计算得该随机变量小于等 于27的概率是0.1587选取 Cumulative probability, 在 Mean栏中,输入 28. 在 Standard deviation(标准差) 栏中 填入 1.选取 Input constant 并输 入 27. 点击 OK中国人民大学六西格玛质量管理研究中心124 返回目录 σσσ σσ σSSMC小组讨论与练习如何理解管理实践中的连续型随机变量和离散型随机变量? 已知一批产品的次品率为5%,现从中随机抽取3个,求在 所抽取的3个产品中恰有两个次品的概率。 设 ,求P(X&2)=? 设 X ~ N (0,1) ,求P(2&X&10)=? 设 X ~ N(5,32 ) 是相互独立且同分布 X1 , X 2 , L , X 25 的随机变量,它们的分布为正态分布 N(10,25),求其均值 和标准差 。 ?x σx1. 2. 3. 4. 5.中国人民大学六西格玛质量管理研究中心125 返回目录 σσσ σσ σSSMC第4章 参数估计4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 参数估计的基本概念 总体均值和总体比例的区间估计 样本容量的确定 两总体均值之差的区间估计 两总体比例之差的区间估计 正态总体方差的区间估计 两个正态总体方差比的区间估计 有关区间估计的Minitab软件实现小组讨论与练习中国人民大学六西格玛质量管理研究中心126 返回目录 σσσ σσ σSSMC本章目标1.掌握参数估计的基本概念 2.建立起在管理中运用参数估计的思想 3.能运用Minitab实现各种区间估计的计算 4.掌握样本容量的确定方法 5.能在管理实践中运用参数估计方法中国人民大学六西格玛质量管理研究中心127 返回目录 σσσ σσ σSSMC4.1 参数估计的基本概念?参数估计有两大类,一种叫点估计,一种叫区间估计 ?点估计是利用样本的信息对所感兴趣的参数估计出一 个数值 ?区间估计包含了两个数值,对应着数轴上的一个区间, 所以称为区间估计 ?点估计的方法最常用的有两种: ? 矩估计法 ? 极大似然估计法 ?对一个估计优良性的评价有一些相应的评价准则中国人民大学六西格玛质量管理研究中心128 返回目录 σσσ σσ σSSMC矩估计法? 对总体参数的估计,人们最容易想到的方法就是矩估计法, 即用样本矩估计总体相应的矩,用样本矩的函数估计总体相 应矩的函数。 ? 矩是指以期望值为基础而定义的数字特征,例如均值、方差、 协方差等。 ? 最常用的矩估计有:用样本均值估计总体均值,用样本标准 差估计总体标准差。 ? 例4-1.已知某种灯泡的寿命 X~N(μ,σ2),其中μ,σ2均 未知,今随机抽取4只灯泡,测得寿命(单位:小时)为1502, ,1650。试估计μ,σ。中国人民大学六西格玛质量管理研究中心129 返回目录 σσσ σσ σSSMC矩估计法(续)1 (1502 + 1453 + 1367 + 1650) = 02 ? 1493) 2 + … + (1650 ?
= 14069 s = 4 ?1 s = 14069 = 118.61 ? = x = 1493(小时), σ ? = s = 118.61(小时) 即?? 解:因为μ是全体灯泡的平均寿命, x 为样本的平均寿命,很自然地会 想到用 x去估计μ;同理用s去估计σ。 ? 由于 x =? 例4-2.设样本x1,x2,…, xn来自参数为λ 的泊松分布。由于 E(X)=D(X)=λ,因而x 与s2都可以作为λ的矩估计值。 ? 由例4-2可以看出E(X)=D(X)=λ,这表明总体均值与方差相等,但 在实际问题中 x 与s2不见得一样,因而矩估计的结果不惟一。中国人民大学六西格玛质量管理研究中心130 返回目录 σσσ σσ σSSMC极大似然估计?极大似然估计是利用总体的分布密度或概率分布的表达式及其 样本所提供的信息建立求未知参数估计量的一种方法。 ?极大似然估计好多初学者觉得难以理解,我们用下面的说法帮 助理解:在产品检验中,有说这批产品的次品率可能是 1/10000,也有说次品率可能是1/100。 如果你在这批产品中随机抽取一件,竟然 就是次品,自然应当认为这批产品的次品 率最有可能是1/100而不是1/10000。把这 种考虑问题的方法一般化,就概括出极大 似然估计方法。中国人民大学六西格玛质量管理研究中心131 返回目录 σσσ σσ σSSMC极大似然估计 (续1)?设总体X的分布已知,未知参数为θ ,假定其分布密 度族为f(x;θ); ?假设对总体X的n次观测结果为(x1, x2,…, xn)。应在一 切θ中选取使样本(X1,X2,…, Xn)落在点(x1, x2,…, xn)附 近概率最大的θ? 作为未知参数θ真值的估计值,即选 取θ? 使: L(θ?;x , x ,… , x ) = max L(θ;x , x ,… , x )1 2 nθ12n其中L(θ;x1 , x2 ,… , x n )称为似然函数,它是样本的联 合概率密度函数。中国人民大学六西格玛质量管理研究中心132 返回目录 σσσ σσ σSSMC极大似然估计 (续2)?一般情况下,我们用求解似然方程的方法进行极大似然估计, 具体步骤是: 1.由总体分布导出样本的联合概率密度; 2.把样本联合概率密度中自变量x1, x2,…, xn看成已知常数, 而把参数看作变量,得到似然函数; 3.用微分原理求似然函数的最大值点; 4.在最大值点的表达式中,代入样本值就得参数的估计值。 ?可以证明:若x1, x2,…, xn来自正态总体N(μ,σ2),则:1 n ? = x = ∑ xi ? n i =1 ?= σ1 n ( xi ? x ) 2 ∑ n i =1中国人民大学六西格玛质量管理研究中心133 返回目录 σσσ σσ σSSMC极大似然估计(续3)? 例4-3.设某种品牌的电视机的首次故障时间遵从指数分布f(t)=λe-λt,t&0, 共测试了7台电视机,获得相应的首次故障时间(单位:万小时)为: 1.49,3.65,0.26,4.25,5.43,6.97,8.09 求参数的λ估计值。 解:样本x1, x2,…, xn的联合密度P ( x1 , x 2 ,… , x n ) = Π ( λ ei =1 n ? λxi)=λ en?∑ xi λi =1n1 用均值 x = n∑ x 来表示,就有:i =1 inP ( x1 , x 2 ,… , x n ) = λ n e ? n x λ ,将L ( λ ) = λ n e ? n x λ ,进而取对数,求微商,解方程可得: 对本例而言,就有:λ ?= 1 ? = 7 = 0.2326 λ x 30.1x 看作常数, λ看作变量,可得似然函数中国人民大学六西格玛质量管理研究中心134 返回目录 σσσ σσ σSSMC点估计的优良性准则?不同的参数估计方法,可得到不同的估计量,不同的估计量 谁优谁劣?我们有一些相应的评价准则。在6σ管理中,最常 用的点估计优良性准则有两个:一个是无偏性,另一个是有效 性。 ?无偏性:设 θ? 是参数θ的一个估计量,如果E (θ?) = θ ,则称 ? 是参数θ的无偏估计。θ? 无偏性实际上是指对于一个估计量,屡次变更数据反复求估计 值时,估计值的平均与真值相一致,即尽管 θ? 有时比θ大, 有时比θ小,总的看来,它的“平均值”就是θ。 ? 可以证明 :许多情况下, x 是μ的无偏估计,s是σ的无偏估 计。然而,在正态分布中σ的极大似然估计就不是无偏估计。中国人民大学六西格玛质量管理研究中心135 返回目录 σσσ σσ σSSMC有效性? 无偏性只考虑估计值的平均结果是否等于待估参数的真值,而 不考虑每个估计值与待估参数真值之间偏差的大小和散布程度。 ? 实际问题的研究中,不仅希望估计是无偏的,更希望这些估计 值的偏差尽可能地小。 ?设 θ?1、θ?2 都是参数θ的无偏估计量,如果 ?) D(θ?1 ) ≤ D(θ 2 且至少有一个θ?0 ,严格不等号成立,则称θ?1 比 θ?2有效。 ? 设 、x1都是μ的无偏估计,但样本均值 的方差为σ2/n,x1的 方差为 x σ2,只要n>1,作为μ的估计值, x 比x1就更有效。x中国人民大学六西格玛质量管理研究中心136 返回目录 σσσ σσ σSSMC区间估计?点估计没有给出估计的精度和可靠程度,区间估计 解决了这一问题。 ?设θ是总体的一个待估参数,从总体中获得容量为n 的样本是x1, x2,…, xn,对给定的α(0&α&1),有统计 量:θL=θL(x1, x2,…, xn) 与θU=θU(x1, x2,…, xn) 若对任意θ有P(θL≤θ≤θU )=1-α,则称随机区 间[θL ,θU ]是θ的置信水平为1-α的置信区间。 θL 与θU分别称为1-α的置信下限与置信上限,α称为显著性水平。中国人民大学六西格玛质量管理研究中心137 返回目录 σσσ σσ σSSMC区间估计(续)?置信区间的大小表达了区间估计的精确性,置信水平表 达了区间估计的可靠性, 1-α是区间估计的可靠概率; 而显著性水平α表达了区间估计的不可靠的概率。 ?如果[θL ,θU ]是置信水平为0.95的置信区间,由于随机 区间[θL ,θU ]会随样本观察值的不同而不同,它有时包 含了参数θ ,有时没有包含θ ,但是用这种方法作参 数的区间估计时,100次中大约有95个区间能包含着参 数θ ,大约有5个区间没能包含θ 。 ?在进行区间估计时,必须同时考虑置信概率与置信区间 两个方面。即置信概率定的越大,则置信区间相应也大。 这两者要结合考虑,才更为实际。中国人民大学六西格玛质量管理研究中心138 返回目录 σσσ σσ σSSMC4.2 总体均值和总体比例的区间估计?总体均值的区间估计2)时, x ,x ,…, x 是来自该正态总体的随机样 ? 当X~N(μ,σ2 1 2 n σ 。 本, X~N ( ? , )? 当总体方差σ2已知时,μ的1-α置信区间为:n( x ? Z 1?α 2σ / n , x + Z 1?α 2σ / n )其中Z1-α/2是标准正态分布的1-α/2分位数。 ? 当总体方差σ2未知时,σ用其s代替,用t分布,μ的1-α 置信区间为:( x ? t1?α 2 (n ? 1) s / n , x + t1?α 2 (n ? 1) s / n )其中t1-α/2(n-1) 表示是自由度为n-1的t分布的 1-α/2分位数中国人民大学六西格玛质量管理研究中心139 返回目录 σσσ σσ σSSMC关于自由度? =s= σ∑ (xi =1ni? x)2 n ?1?在统计推断中常常会碰到自由度这一 概念,不少人对这一概念不好理解。 ?如果我们有10个数,而且你知道了均值和其中的9个数的值, 那么你就可以推出第10个数。 ?让10个人挑选10支不同颜色的铅笔,只有9人有自由挑选的可 能,因为当这9人都挑好之后,你别无选择!因此这个问题的 自由度为9。 ?自由度可以理解为在研究问题中,可以自由取值的数据的个数。中国人民大学六西格玛质量管理研究中心140 返回目录 σσσ σσ σSSMC例4-4.σ2已知时,μ的区间估计?某种零件的长度遵从正态分布,从该批零件中随机抽取9件, 测得其平均长度为21.4mm。已知总体标准差σ=0.15mm,试建 立该种零件平均长度的置信区间,给定的置信水平为0.95。 ? 解:已知X~N(μ,0.152)时, x =2.14,n=9,1-α=0.95, α=0.05, 查标准正态分布表可得1-α/2的分位数,Z1-α/2=1.96;α=0.01 时, Z1-α/2=2.58; α=0.10时, Z1-α/2=1.64。这是一些常用值, 请读者记住。 0.15 0.15 ( x ? Z 1?α 2σ / n , x + Z 1?α 2σ / n ) = (21.4 ? 1.96 ,21.4 ? 1.96 ) 9 9 即为: ( 21.302,21.498) ? 我们可以95%的概率保证这种零件的平均长度在(21.302,21.498) 之间。中国人民大学六西格玛质量管理研究中心141 返回目录 σσσ σσ σSSMC例4-5.σ2未知时,μ的区间估计?为了估计各省市电视台在某黄金时间一分钟广告的平均费用, 随机调查了20个电视台,他们每分钟的广告费 x=25000元, s=8000元。假定所有电视台的广告费近似遵从正态分布,试求 总体均值95%的区间估计。 ? 解:这是总体方差σ2未知的情况。已知 x =25000,s=8000, n=20, α=0.05,则t1-α/2(n-1)= t0.975(19)=2.093;于是( x ? t1?α 2 ( n ? 1) s / n , x + t1?α 2 ( n ? 1) s / n ) = ( 244 .07 ) ? 从而,我们有95%的把握认为所有省市电视台在黄金时间播出 的广告一分钟的平均费用在(744.07)之间。中国人民大学六西格玛质量管理研究中心142 返回目录 σσσ σσ σSSMCn≥30时均值的区间估计?前边讨论的是当总体为正态分布时,μ的区间估计,然 而总体不是正态分布时,如果样本容量n超过30,则我们 可根据中心极限定理知: x 仍近似遵从正态分布,因而仍 可用正态分布总体时的均值μ的区间估计方法。 ?例4-6.某航空公司在过去飞行记录中,随机抽取了225个 航班,航班空位数的样本均值 x =11.6,标准差=4.1,试 求过去一年所有航班的平均空位数的置信区间。(α=0.10) ? 解:所有航班空位数的分布未知,且总体标准差未知, 但n=225,因而仍可用 x ± Z 1?α 2 s / n 做区间估计。代入其 具体数据得[11.15,12.05],也即该公司有90%的把握认 为过去的一年该公司的平均空位数在11.15到12.05之间。中国人民大学六西格玛质量管理研究中心143 返回目录 σσσ σσ σSSMC总体比例的区间估计?我们常需要估计总体中具有某种特征的单位占总体全部单位的 比例 ?一批产品中,合格品的比例;顾客满意度调查中,有意见顾客 的比例等。? 。可以证明,当样本容量足够 ?记总体比例为p,样本比例为 p 大时,若np&5,n(1-p)&5,则可用正态分布去近似二项分布, 因而有:因此由正态分布构造总体比例p的置信区间为:1 ? ~N ( p , p (1 ? p )) p n? ± Z 1?α / 2 p? (1 ? p ?) p n144中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC总体比例置信区间估计的例子?例4-7.某企业在一项关于职工流动原因的研究中,从该企业 前职工的总体中随机抽选了200人组成一个样本。访问结果, 有140人说他的离开是由于企业管理缺乏人性化。试对由于这 种原因而离开企业的人员的真正比例进行估计(α=0.05)。 ? =0.7, p ? 解:已知n=200, ? =140&5, np ? )=60&5, Z1-α/2=1.96 n(1 ? p? ? Z 1?α / 2 (p = (0.7 ? 1.96 ? (1 ? p ?) p ? + Z 1?α / 2 ,p n ? (1 ? p ?) p ) n0.7 (1 ? 0.7 ) 0.7 (1 ? 0.7 ) ,0.7 + 1.96 ) 200 200 = (0.636,0.764 ) ? 故该企业职工认为企业管理缺乏人性化而离开的比例为63.6%~ 76.4%。中国人民大学六西格玛质量管理研究中心145 返回目录 σσσ σσ σSSMC4.3样本容量的确定?在研究实际问题时,需要自己动手设计 调查方案,这时如何确定样本容量大有 学问。如果样本量太大,必然费用增加; 如果样本量过小,估计误差又会增大。 ?这就看你需要什么样的估计精度,即你想构造多宽的估计 区间? ?对于你所确定的置信区间,你想要多大的置信度? ?估计总体均值时,样本容量的确定 在总体均值的区间估计里,置信区间是: ( x ? Z 1?α 2σ / n , x + Z 1?α 2σ / n ) 该区间估计的精度为 Z 1?α 2σ / n ,是区间估计长度的一半。 146中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC样本容量的确定(续1)?如果我们希望估计值与其真实值之间的 误差或估计的精度在置信度(1-α)下不超 过某一数值B(允许误差),则可从下面的 方程确定n。Z1?α 2σ / n = B2n = ( Z1?α 2σ / B) 解之得: ?只要我们知道了Z1-α/2,σ和允许误差,就可具体算出 样本容量n。 ?如果算出的n不是整数,就去超过该小数的最接近的整 数即可。中国人民大学六西格玛质量管理研究中心147 返回目录 σσσ σσ σSSMC样本容量的确定(续2)?由样本容量的确定公式n = ( Z1?α 2σ / B) 2 ,你可发现几个 量之间的一些关系: ?1.总体方差越大,必要的样本容量n越大。 ?2.必要样本容量n反比例于允许误差B。即在给定的置信 水平下,允许误差越大,样本容量就可以越小;允许 误差越小,样本容量就必须加大。 ?3.必要样本容量n与正态分布Z1-α/2分位数(也称可靠性系 数)成正比。即:我们要求的可靠程度越高,样本容量 就应越大;如果要求的可靠程度越低,样本容量就可 以小些。 148中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC样本容量的确定(续3)?例4-8.某广告公司想估计某类商场去年 所花的广告费平均有多少。经验表明, 总体方差约为1800000。如置信度取 95%,并要使估计值处在总体平均值 附近500元的范围内,这家广告公司 应取多大的样本? ? 解:已知σ2=1800000,α=0.05,Z1-α/2=1.96,B=5002 ( 1 . 96 ) ( ) = n=( B (500) 2 = 27.65 ≈ 28Z1?α 2σ? 即这家广告公司应抽取28个商场作样本。中国人民大学六西格玛质量管理研究中心149 返回目录 σσσ σσ σSSMC样本容量的确定(续4)?估计总体比例时,样本容量n的计算公式是: ? (1 ? p ?) Z 12?α 2 p n= B2 ?例4-9.某市场调查公司想估计某地区有数码相机的家庭所 占的比例。该公司希望对p的估计误差不超过0.05,要求的 ?估计值。 可靠度为95%,应取多大的样本?没有可利用的 p ? 值时,可以用 p ?=0.5 ? 解:通常在此类问题研究中,无法得到 p ?=0.5 计算。已知B=0.05, α=0.05,Z1-α/2=1.96, pn=? (1 ? p ?) Z 12?α 2 p B2(1.96) 2 0.5(1 ? 0.5) = ≈ 385 2 (0.05)? 即抽取385户调查,就可以95%的可靠度保证估计误差不超 过0.05。中国人民大学六西格玛质量管理研究中心150 返回目录 σσσ σσ σSSMC4.4 两个总体均值之差的区间估计?某化工厂需要比较由两个供应商提供的原材料所带来的产量, 某企业质量管理部的部长希望 了解车间内两条生产线生产的灯泡 平均寿命是否存在差异等。这些都 是要对两个总体均值之差作区间估计。 ?两个总体的方差σ 12、σ 22 已知情况下,两总体均值差异μ1-μ2 的区间估计: 2 σ 12 σ 2 ( x1 ? x 2 ) ± Z1?α 2 + n1 n2 其中, x1、 x 2 分别为来自两个总体的样本均值,n1,n2为抽自 2 两总体的样本容量, 分别是两总体的方差。 σ 12、σ 2 ?只要样本容量足够大,对于总体分布是否正态都可适用。中国人民大学六西格玛质量管理研究中心151 返回目录 σσσ σσ σSSMC两个总体均值之差的估计案例?例4-10.某企业质量部部长希望了解企业两条生产线生产的 灯泡平均寿命是否存在差异。假定两条生产线生产的灯泡的 2 寿命均呈正态分布,方差分别为σ 12 = 420,σ 2 = 445。随机从 两条生产线生产的灯泡中各抽取20只和25只,测得平均寿命 分别为1478小时和1456小时,在α=0.05时,求出两条生产 线生产的灯泡平均寿命差异的区间估计。 2 n1 = 20, n2 = 25, x1 = 1478, x 2 = 1456, σ 12 = 420, σ 2 = 445 ? 解: α = 0.05, Z1?α 2 = 1.96,则?1 ? ? 2的区间估计为:n1 n2 ? 即μ1-μ2的95%的置信区间为(9.8,34.2)。( x1 ? x 2 ) ± Z1?α 2σ 12+2 σ2= (9.8,34.2)中国人民大学六西格玛质量管理研究中心152 返回目录 σσσ σσ σSSMC2 2 σ 、 σ 两个总体方差 1 2 未知的情况?两个总体均遵从正态分布,且 σ 12 = σ 22,当σ 12,σ 22未知时, 为了给出μ1-μ2的估计我们必须利用两个样本中关于 σ2的信息联合大体估计σ2 ,这个联合估计量为:( n1 ? 1) s + ( n 2 ? 1) s S = n1 + n 2 ? 22 p 2 12 2?这时两个总体均值之差μ1-μ2的1-α置信水平下的置信 区间为:( x1 ? x2 ) ± t1?α 2 (n1 + n2 ? 2)S p1 1 + n1 n2153中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC方差不等的情况2 ?当两个总体均遵从正态分布, ,且方差未知时,自然用 σ 12 ≠ σ 2 2 2 2 和s2 分别估计 σ 12和σ 2 ,从而得到 σ (2x1 ? x 2 )的估计为 s12 2 2 2 s1 s2 s1 s2 ( + ),但此时 [( x1 ? x 2 ) ? ( ? 1 ? ? 2 )] + 的 n1 n2 n1 n2 抽样分布不遵从自由度为(n1+ n2-2)的t分布,而近似遵从自由 度为f的t分布。f的计算公式为:2 2 2 2 2 ( ) ( ) s12 s 2 s n s n f = ( + )2 ( 1 1 + 2 2 ) n1 n 2 n1 ? 1 n2 ? 1 这样两个总体均值之差μ1-μ2的1-α置信水平下的置信区间为:( x 1 ? x 2 ) ± t 1 ?α2 s12 s 2 + 2( f ) n1 n 2154中国人民大学六西格玛质量管理研究中心 返回目录 σσσ σσ σSSMC4.5两个总体比例之差的区间估计?设两个正态总体的比例分别为p1和p2,为了估计 p1-p2,分别从两个总体中各随机抽取容量为n1和n2的 ? 1和p ? 2 ,可以 两个随机样本,并计算两个样本的比例 p 证明,p1-p2的置信度为1-α的置信区间为:?1 ? p ? 2 ) ± Z 1?α (p2? 1 (1 ? p ?1) ? 2 (1 ? p ?2) p p + n1 n2中国人民大学六西格玛质量管理研究中心155 返回目录 σσσ σσ σSSMC4.6正态总体方差的区间估计?设x1,x2,…, xn来自均值为μ,方差为σ2的正态总体, μ 、σ2均未知,则σ2的估计量为s2,且( n ? 1) s 2σ2~χ 2 ( n ? 1)?利用χ2(n-1)分布可以得到σ2的1-α置信区间为:? ( n ? 1) s 2 ( n ? 1) s 2 ? , 2 ? ? 2 ? ? ? χ 1?α 2 ( n ? 1) χ α 2 ( n ? 1) ? 2(n-1)分布的 2 ?其中χ 12?α 2 (n ? 1)与χ α 分别是 χ ( n ? 1 ) 21-α/2分位数与α/2分位数。中国人民大学六西格玛质量管理研究中心156 返回目录 σσσ σσ σSSMC总体方差区间估计的案例?例4-14.对某种金属材料的10个样品所组成的一个随机样本 作抗拉强度试验。从试验数据算出方差为4,试求σ2的95% 置信区间。 ? 解:设该种金属材料的抗拉强度遵从正态分布,则此时σ2的 置信度为95%的置信区间为: ? ( n ? 1) s 2 ( n ? 1) s 2 ? , 2 ? 2 ? ? ? χ 1?α 2 ( n ? 1) χ α 2 ( n ? 1) ? ?式中, n = 10, 1 ? α = 0.95, α = 0.05, s 2 = 4 ? (10 ? 1) 4 (10 ? 1) 4 ? , ? ? ? 19 .4 ? ? 即[1.4],而标准差σ的95%的置信区间为:[ 1.8925 ,13 .3314 ,即[1.38, 3.65 ] 。中国人民大学六西格玛质量管理研究中心157] 返回目录 σσσ σσ σSSMC4.7 两个正态总体方差比的区间估计?实际问题中,我们需要比较两种测量工具的精度;比 较两个生产过程的稳定性;比较两个评委评分的变异性 等等,这些都可转化为两个总体方差的比较。2 σ ?可以证明:置信度为1-α的 12 的区间估计为: σ22 ? s12 ? s 1 1 1 , 2 ? 2 ? ? ? s 2 F1?α 2 (n1 ? 1, n2 ? 1) s 2 Fα 2 (n1 ? 1, n2 ? 1) ? ??注意:F分布的分位数Fα(n1,n2)=1/F1-α(n2,n1),查表时 有用。中国人民大学六西格玛质量管理研究中心158 返回目录 σσσ σσ σSSMC4.8 有关区间估计的Minitab软件实现一.点估计的软件实现:1.例4-1的软件实现,输入数据见表:2.点击Stat―― Basic Statistics―― Display Descriptive Statistics中国人民大学六西格玛质量管理研究中心159 返回目录 σσσ σσ σSSMC3.弹出如下对话框,选 择要分析的变量进入 Variables框中,点击OK 键,结果如下:均值,标准差:中国人民大学六西格玛质量管理研究中心160 返回目录 σσσ σσ σSSMC4.此外,还可以点击Stat――Basic Statistics―― Store Descriptive Statistics,弹出如下对话框:5.选择变量后,点击Statistics, 弹出下面的复选框,可 选择你需要估计的参数值, 点击OK得到结果:中国人民大学六西格玛质量管理研究中心161 返回目录 σσσ σσ σSSMC二.均值及方差的区间估计:单样本方差已知的均值区间估计: 单样本方差未知的均值区间估计: 两样本均值之差的区间估计: 比例的区间估计: 方差之比的区间估计:中国人民大学六西格玛质量管理研究中心162 返回目录 σσσ σσ σSSMC小组讨论与练习1.区间估计与点估计的思想方法有什么不同? 2.从一批零件中随机抽取了100个进行量测, 其零件长度的平均数 x =69.7mm, 若s2=3.5,试以95%的置信水平估计该批 零件长度均值μ的置信区间。 3.某企业的质量部要估计其产品的废品率。这家企业接 受的废品率最高为5%。如果希望误差不超过2%和1%, 置信度为95%,满足2%和1%的误差分别抽取多少件 产品 进行检测。试说明两者结果的意义。中国人民大学六西格玛质量管理研究中心163 返回目录 σσσ σσ σSSMC第5章 假设检验广告宣传的虚假性 假设检验(hypothesis testing)的几个步骤 单侧检验(one-tailed hypothesis) 双侧检验(two-tailed hypothesis) 两类错误 检验的应用5.1 5.2 5.3 5.4 5.5 5.6小组讨论与练习中国人民大学六西格玛质量管理研究中心164 返回目录 σσσ σσ σSSMC本 章 目 标1.了解假设检验的原理 2.掌握假设检验的步骤 3.了解怎样辨别I类和II类错误 4.学会计算单尾和双尾概率中国人民大学六西格玛质量管理研究中心165 返回目录 σσσ σσ σSSMC5.1 广告宣传的虚假性z手机电池的使用寿命不是按年来计算的,而是按电 池的充放电次数来计算的。镍氢电池一般可充放电 200-300次,锂电池一般可充放电350-700次。某手 机电池厂商宣称其一种改良产品能够充放电900次, 为了验证厂商的说法,消费者协会对10件该产品进 行了充放电试验。得到的次数分别为891,863, 903,912,861,885,874,923,841,836。中国人民大学六西格玛质量管理研究中心166 返回目录 σσσ σσ σSSMC广告宣传是虚假的吗上述数据的均值为878.9,明显少于900。 但是,到底均值落在什么范围内我们就认为 广告宣传是虚假的呢?现在的问题是如 何确定这两条线 的位置900接受广告宣传中国人民大学六西格玛质量管理研究中心167 返回目录 σσσ σσ σSSMC假设检验的原理假设检验的原理是逻辑上的反证法和 统计上的小概率原理zzz反证法:当一件事情的发生只有两种可 能A和B,如果能否定B,则等同于间接 的肯定了A。 小概率原理:发生概率很小的随机事件 在一次实验中是几乎不可能发生的。中国人民大学六西格玛质量管理研究中心168 返回目录 σσσ σσ σSSMC假设检验的原理(续)z由于个体差异的存在,即使从同一总体中严格的随机 抽样,X1、X2、X3、X4、、、,也不尽不同。z它们的 不同有两种(只有两种)可能: 9 (1)分别所代表的总体均值相同,由于抽样误差造 成了样本均值的差别。差别无显著性 。 9 (2)分别所代表的总体均值不同。差别有显著性。中国人民大学六西格玛质量管理研究中心169 返回目录 σσσ σσ σSSMC5.2 假设检验的几个步骤? 假设检验的一般步骤,即提出假设、确定检 验统计量、计算检验统计量值、做出决策。提出假设构造统计量计算统计量值 做出推断做出统计 决策中国人民大学六西格玛质量管理研究中心170 返回目录 σσσ σσ σSSMC提出假设在决策分析过程中,人们常常需要证实自己 通过样本数据对总体分布形式做出的某种推 断的正确性(比如,总体的参数θ大于某个 值θ0),这时就需要提出假设,假设包括 零假设H0与备择假设H1。z中国人民大学六西格玛质量管理研究中心171 返回目录 σσσ σσ σSSMC零假设的选取假设检验所使用的逻辑上的间接证明法 决 定了我们选取的零假设应当是与我们希望证 实的推断相对立的一种逻辑判断,也就是我 们希望否定的那种推断。z中国人民大学六西格玛质量管理研究中心172 返回目录 σσσ σσ σSSMC零假设的选取(续一)同时,作为零假设的这个推断是不会轻易被 推翻的,只有当样本数据提供的不利于零假 设的证据足够充分,使得我们做出拒绝零假 设的决策时错误的可能性非常小的时候,才 能推翻零假设。z中国人民大学六西格玛质量管理研究中心173 返回目录 σσσ σσ σSSMC零假设的选取(续二)所以,一旦零假设被拒绝,它的对立面―― 我们希望证实的推断就应被视为是可以接 受的。z中国人民大学六西格玛质量管理研究中心174 返回目录 σσσ σσ σSSMC构造检验统计量收集样本信息 利用样本信息构造检验统计量z= x ? ?0z zσn中国人民大学六西格玛质量管理研究中心175 返回目录 σσσ σσ σSSMC计算检验统计量值把样本信息代入到检验统计量中,得到检验 统计量的值。 x ? ?0 z= σ nz中国人民大学六西格玛质量管理研究中心176 返回目录 σσσ σσ σSSMC做出决策1、 规定显著性水平α,也就是决策中所面临的风险 2、决定拒绝域(critical region)和判别值(critical value) 3、判定检验统计量是否落在拒绝域内 4、得出关于H0和关于H1的结论中国人民大学六西格玛质量管理研究中心177 返回目录 σσσ σσ σSSMC显著性水平显著性水平α是当原假设正确却被拒绝的概 率 通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其正 确的可能性(概率)为95%或99%zz z中国人民大学六西格玛质量管理研究中心178 返回目录 σσσ σσ σSSMC判定法则1、如果检验统计量落入拒绝域中,则拒绝原假设 2、如果检验统计量落入接受域中,则我们说不能拒绝原假设注意:判定法则2的含义是指我们在这个置信水平下 没有足够的证据推翻原假设;实际上,如果我们改变 置信水平或样本数}

我要回帖

更多关于 spss f检验结果分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信