minitab17中文破解版 17 怎样得出 y=2x

(window.slotbydup=window.slotbydup || []).push({ id: '2014386', container: s, size: '234,60', display: 'inlay-fix' (19人评价) &&|&&20次下载&&|&&总570页&&| minitab使用教材,Minitab统计教程 您的计算机尚未安装Flash,点击安装& 阅读已结束,如需下载到电脑,请使用积分() 下载:100积分 0人评价6页 2人评价14页 9人评价763页 3人评价112页 0人评价10页 所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!) (多个标签用逗号分隔) 文不对题,内容与标题介绍不符 广告内容或内容过于简单 文档乱码或无法正常显示 文档内容侵权 已存在相同文档 不属于经济管理类文档 源文档损坏或加密 若此文档涉嫌侵害了您的权利,请参照说明。 我要评价: 下载:100积分【图文】一元回归分析方法(手算.MINITAB.EXCEL对比)_百度文库 两大类热门资源免费畅读 续费一年阅读会员,立省24元! 评价文档: 一元回归分析方法(手算.MINITAB.EXCEL对比) 上传于|0|0|文档简介 &&手算. MINITAB. EXCEL 计算方法对比 大小:524.00KB 登录百度文库,专享文档复制特权,财富值每天免费拿! 你可能喜欢Minitab17(统计分析软件) v17.1.0 特别版 你的位置: & > Minitab17(统计分析软件) v17.1.0 特别版 Minitab17(统计分析软件) v17.1.0 特别版 不好用:(0) Minitab17是一款为质量改善、教育和研究应用领域提供统计软件和服务的先导。是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件。 MINITAB 统计软件为质量改善和概率应用提供准确和易用的工具。 Minitab的应用通常结合一些统计处理方法,如六标准差(Six Sigma), 能力成熟度模型集成(CMMI)等。 Minitab17新增的&助手&菜单,对广大新用户来说是一个无比重要的工具,该工具提供各种统计工具和质量工具的选择树,帮你在第一时间选择正确的分析工具。并且对输出的结果有详细的解释和分析。各种名词解释和统计原来也内嵌其中,因此受到很多质量学者和统计院校的热烈欢迎。 本站提供搜狐网络电视2016免费下载,搜狐网络电视是搜狐视频强势推出的一款全新体验的播放器,搜狐网络电视支持主流媒体格式的视频、音频文件,实现本地播放和在线点播。 (您的评论需要经过审核才能显示,请文明发言!)&&剩余字数: 点击图片更换 * 为了达到最快的下载速度,推荐使用或下载本站软件。 * 请一定升级到最新版才能正常解压本站提供的软件! * 站内提供的所有软件均为作者提交或网上搜集,若侵犯您的版权利益,通知我们! 管理工具分类 本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。 Copy . All Rights Reserved.当前位置: >> Minitab全面经典教程:统计分析 Minitab全面经典教程------- Minitab统计分析 Minitab介绍?Minitab是众多统计软件当中比较 简单易懂的软件之一; ?相对来讲,Minitab在质量管理方 面的应用是比较适合的; ?Minitab的功能齐全,一般的数据 分析和图形处理都可以应付自如。
Minitab与6 Sigma的关系?在上个世纪80年代Motolora开始在公司内推 行6 Sigma,并开始借助Minitab使6 Sigma得 以最大限度的发挥; ?6 Sigma的MAIC阶段中,很多分析和计算都 可以都通过Minitab简单的完成; ?即使是对统计的知识不怎么熟悉,也同样可 以运用Minitab很好的完成各项分析。 Minitab的功能?计算功能?计算器功能 ?生成数据功 能 ?概率分布功 能 ?矩阵运算 Minitab的功能?数据分析功能?基本统计 ?回归分析 ?方差分析 ?实验设计分析 ?控制图 ?质量工具 ?可靠度分析 ?多变量分析? ? ? ? ?时间序列 列联表 非参数估计 EDA 概率与样本容量 Minitab的功能?图形分析?直方图 ?散布图 ?时间序列图 ?条形图 ?箱图 ?矩阵图 ?轮廓图? ? ? ? ? ? ?三维图 点图 饼图 边际图 概率图 茎叶图 特征图 课程内容安排※由于时间有限,很多内容只是 做简单的介绍; ※在两天的时间里,主要的课程 内容安排如下: 区分第一天第二天基本界面和操作介绍 常用图形的Minitab操作上 午 特性要因图 柏拉图 散布图 直方图 时间序列图4)组间/组内能力分析 5)Weibull能力分析 基础统计和假设检验 1)描述统计 2)单样本Z测试 3)单样本T测试 4)双样本T测试 5)成对T测试 6)1比率测试 7) 2比率测试 8)正态分布 方差分析 1)单因数和双因数方差分析 回归分析 1)简单回归 2)逐步回归 MSA测量系统分析 1)测量重复和再现性 (交叉Crossed、嵌套Nested) 2)测量走势图 3)测量线性研究 4)属性测量R&R 研究(计数)1)Xbar-R Chart 2)Xbar-S Chart 4)Z-MR Chart 下 3)I-MR Chart 5)I-MR-R/S Chart 午 6)P Chart 7)NP Chart 8)C Chart 9)U ChartSPC的Minitab操作能力分析 1)正态分布图能力分析 2)泊松分布图能力分析 3)二项分布图能力分析 Minitab界面和基本操作介绍 Minitab界面主菜单Session Window: ?分析结果输出窗口Data Window: ?输入数据的窗口 ?每一列的名字可以写在最前面的列 ?每一列的数据性质是一致的 Minitab界面? 同一时间只能激活一个窗口.每一个窗口可以单独储存.不同的要求选择不 同的保存命令 工具栏的介绍打开文件 保存文件 打印窗口 之前之后命令 查找数据 查找下一个数据 取消 帮助报告便栈 打开相关文件 显示因子设计session窗口当前数据窗口剪切 复制 粘贴 恢复 重做 编辑最近对话框状态向导 显示session窗口折叠 显示worksheets折叠 显示GRAPH折叠 项目窗口 历史记录项目管理窗口 关闭所有图形窗口 插入单元格 插入行 插入列 移除列 数据的生成(Make Random Data)例:生成一组男 生身高的数据, 要求:平均身高 175cm,标准偏 差5cm,数据个 数100.? Select: Calc & Random Data & Normal 数据的生成结果 生成有规律的数据? Select:Calc &Make Patterned Data &Simple Set of Number 结果输出 数据类型的转换(Change Data Type)? Select: Data & Change Data Type & Numeric to Text需要转换的列转换后数据存放列, 可以是原来的数据列 数据类型的转换结果 数据的堆栈(Stack&Unstack)?Select: Data & Stack & columns原始数据 输入需要堆栈的列,如 果由前后顺序,按前后 顺序进行输入输入堆栈后存 放列的位置注解可以用来区 分数据的来源 数据的堆栈结果 数据块的堆栈(Stack Blocks)?Select: Data & Stack & Blocks of columns原始数据在对话框中输入2~5 列数据,注解列在前面输入新工作表 和注解的位置 数据块的堆栈结果 转置栏(Transpose Columns)?Select: Data & Transpose Columns输入需要转置的列输入新工作表的位置可以输入注解列 转置结果 连接(Concatenate)? Select: Data & Concatenate原始数据输入需要连 接的数据列输入新数据 列的位置 连接结果 编码(Code)? Select: Data & code&Numeric to Text原始数据 被编码的 变量 存储编码值的栏编码 规则 编码结果 Minitab之常用图形 QC手法常用的图形如下:特性要因图 控制图(参见SPC部分) 柏拉图 散布图 直方图 时间序列图 特性要因图决定特性Y 头脑风暴找出可能的要因X 将X依5M+1E方式列表 将表输出MINITAB中 输出结果图形 练习人 机 料 法 环 测不够 熟练 培训 不够 监督 不够设备没有 原料没有 没有设定标 温度太 仪器偏差 保养 检查 准化方法 高 太大 设备不常 清扫 没有进行 点检 原料含 s,p太高 抽样方式不 湿度太 合理 低 仪器R&R 太高 输入表中?Select: Stat & Quality tools& Cause - and - effect注意输入格式 填好各项需要的参数 结果输出 : Cause-and-Effect DiagramMeasuremen Material Personnel不够熟练 培训不够 仪器R & R 太高 原料含s , p 太高 监督不够 仪器偏差太大 原料没有检查没有进行点检 湿度太低 抽样方式不合理 设备不常清扫 温度太高 没有设定标准化 方法 设备没有保养为什么 有缺陷 产生EnvironmenMethodsMachines 柏拉图收集各项质量特性缺陷 列成表 输入到MINITAB中 MINITAB绘出图形 找出关键的Y特性 练习项次1 2 3 4 5缺陷项虚焊 漏焊 强度不够 外观受损 其它数量500 300 200 150 160 输入数据?Select: Stat & Quality tools& Pareto Chart 填好各项参数输入缺陷列 输入频数列 在此指定 “95%” 将使 余下的图示为 “Others” 。 设置X轴,Y轴标签 可以对柏拉图进行命名 结果输出 ?下表为STS冷轧工厂ZRM不良现状,试做分析不良项目 摩擦痕 辊印 污染 划伤 线形裂纹 异物压入 斑痕 微细裂纹 垫纸压入 轧机垫纸印痕 合计 不良数 7.78 2.44 2.27 2.22 1.97 1.33 1.11 0.77 0.68 0.51 21.08 不良率 0.37 0.12 0.11 0.11 0.09 0.06 0.05 0.04 0.03 0.02 累计不良率 0.37 0.48 0.59 0.70 0.79 0.85 0.91 0.94 0.98 1.00练习: 散布图决定你所关心的Y 决定和Y有可能的X 收集Y和X的数据 输入MINITAB绘出图形 判定Y和X之间的关系 练习Y65 66 65 66 67 67 68 68 67 68X800 810 820 830 840 850 860 870 890 900 输入数据?Select: Gragh& Scatterplot 输入参数可以选择不同的 输出表现形式 输出图形?可以用直接方式判定,有正相关的倾向。 ?更详细的说明可以参见回归分析 直方图决定你所关心的Y或X 收集Y或X的数据 输入MINITAB表 MINITAB绘出直方图 进行判定 练习序号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 61.1 60.6 61.3 61.0 60.9 61.0 60.3 60.5 61.0 61.2 60.4 60.8 62.3 62.2 60.1 61.3 60.8 60.6 60.8 60.2 60.8 60.7 61.3 61.4 60.9 60.5 60.8 61.2 60.9 60.8 61.4 60.9 60.3 61.8 60.6 60.9 61.0 61.5 61.0 60.4 61.3 59.7 61.2 60.5 61.0零件重量60.6 61.3 60.7 60.9 61.5 60.6 61.7 61.1 60.3 61.6 61.2 60.8 60.0 61.6 61.1 60.6 61.0 61.2 60.9 61.7 61.1 60.5 61.0 61.1 60.6 61.9 61.0 61.0 62.5 60.8 62.0 60.8 60.6 61.7 59.8 61.0 61.6 60.7 61.1 60.4 60.9 61.2 60.1 61.1 61.5 61.0 60.7 61.1 61.4 62.1 61.1 61.6 61.2 61.0 60.3 61.0 60.6 61.4 61.0 61.7 60.6 60.2 62.1 60.4 62.3 60.9 60.7 60.8 61.1 60.6 60.7 60.7 61.1 61.4 60.5 输入数据? Select: Gragh& Histogram 例:右表为某零件重量的数 据.试作(1)直方图 (2)计算均值x和标准差s (3)该特性值的下限是60.2 克,上限是62.6克,在直方图 中加入规格线并加以讨论. 填入参数可以同时为几个 变量作直方图可以选择不同的 输出表现形式点击此选项输入上下规格界限 结果输出?请依照直方图分析方法来进行图形分析和判定 ?更深入的分析可以参见制程能力分析部份。 时间序列图决定你所关心的Y或X 收集Y或X的数据 输入MINITAB表 MINITAB绘出时间序列图 进行判定 练习时间6/2 6/4 6/6 6/8 2006/9销售量150 126 135 165 190 170 175 180 176 输入数据?Select: Gragh& Time Series Plot 时间刻度设置 时间刻度设置填入参数可以选择不同的 可以选择不同的 输出表现形式 输出表现形式 结果输出Time Series Plot of 销售量190 180 170 销售量 160 150 140 130 120 2006/12006/22006/32006/42006/5 时间2006/62006/72006/82006/9?依此状况来判定未定的销售趋势。 ?依此状况来判定未定的销售趋势。 Minitab的SPC使用 一.控制图原理?控 制 图1.现代质量管理的一个观点--产品质量的统计观点 a.产品的质量具有变异性. 至工业革命以后,人们一开始误认为:产品是由机 器造出来的,因此,生产出来的产品是一样的.随着 测量理论与测量工具的进步,人们终于认识到:产 品质量具有变异性,公差制度的建立是一个标志. b.产品质量的变异具有统计规律性. 产品质量的变异也是有规律性的,但它不是通 常的确定性现象的确定性规律,而是随机现象 的统计规律. 一.控制图原理2.控制图的原理 a.计量值产品特性的正态分布n ( μ , σ )?控 制 图0μ如果我们对某一计量 值产品的特性值(如:钢 卷厚度等)进行连续 测试,只要样本量足够 大,就可看到它们服从 正态分布的规律. 一.控制图原理?控 制 图b. 3σ 控制方式下的产品特性值区间 3σ 控制方式下产品 特性值落在[μ -3σ , μ +3σ] 范围内的 概率为99.73%,其产 品特性值落在此区 间外的概率为199.73%=0.27%.0.135%0.135%μ -3σμμ +3σ 一.控制图原理c. 常规控制图的形成?控 制 图μ -3σμμ +3σμ -3σμ+3σμμ +3σμμ -3σ 一.控制图原理?控 制 图d.控制图原理的解释 第一种解释:8 9 10 11 UCL CL LCL 时间(h)1.若过程正常,即分布不变,则点子超过UCL 的概率只 有1‰ 左右. 2.若过程异常, μ 值发生偏移,于是分布曲线上、 下偏移,则点子超过UCL或LCL的概率大为增加.结论:点出界就判异以后要把它当成一条规定来记住. 一.控制图原理第二种解释: 1.偶然因素引起偶然波动。偶然波动不可避 免,但对质量的影响微小,通常服从正态分布, 且其分布不随时间的变化而改变。目 标 线?控 制 图可预测过程受控时间 一.控制图原理第二种解释: 2.异因引起异波。异波 产生后,其分布会随时 间的变化而发生变化。 异波对质量影响大,但 采取措施后不难消除。?控 制 图过程失控标 目 线不可预测结论:控制图上的控制间 时界限就是区分偶波与 异波的科学 界限,休 哈特控制图的实质是 区分偶然因素与异常 因素两类因素. 二.常规控制图及其用途分布 控制图 代号 X-R?控 制 图控制图名称控制图界限 UCLX= X+A2R备 注 最常用最基本 的控制图.控制 对象:长度、重 量等. 当样本大小 n&10,需要应用 s图来代替R图.均值-极差控制图UCLR= D4R LCLR =D3R UCLX= X+A3s LCLs = B3s正态 分布 (计 量值)X-s均值-标准差控制图 UCL = B s s 4~ X-RX-Rs中位数-极差控制图UCLR=D4R LCLR=D3R现场需把测定 ~ UCLX=X+m3A2R 数据直接记入 控制图进行控 制. 取样费时、昂 贵的场合.单值-移动极差控制图 UCLx=X+2.66Rs UCLRs=3.267Rs 二.常规控制图及其用途?控 制 图分布 二项 分布 (计件 值) 控制图 代号 p 控制图名称 不合格品率 控制图 不合格品数 控制图 单位不合格数 控制图 不合格数 控制图 控制图界限 备注 用于不合格 品率或合格 品率控制 不合格品 数控制 一定单位中 所出现缺陷 数目控制 一定单位,样 品大小不变 时√ p(1-p)/n UCLp= p+ 3UCLnp=np+3 np(1-p) √ UCLu=u+3√ u / nnp泊松 分布 (计点 值)ucUCLc= c + 3√c Minitab可提供的图形? 计量型 ?Xbar-R ?Xbar-s ?I-MR ?I-MR-s ?Z-MR ? 计数型 ?P ?Np ?C ?U Xbar-R做法?Xbar-R是用于计量型 ?判稳准则:连续二十五点没有超出控制界限。 ?判异准则:?一点超出控制界限 ?连续六点上升或下降或在同一侧 ?不呈正态分布,大部份点子没有集中在中心线。 Xbar-R做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Xbar-R练习Minitab Worksheet?打开Data目录下的Camshaft.mtw ?Select: Stat &Control Charts &Variables Charts for Subgroups & Xbar-R 输入参数根据不同的输入方式 选择不同的分析方法 决定测试要求可以在这里选 择判异准则 ※判 异 准 则准则1: 一点超出控制界限区域A 区域B 区域C 区域C 区域B 区域A UCL CL LCL A B C C B A × (+3σ ) (+2σ ) (+1σ ) ( -1σ ) ( -2σ ) ( -3σ ) × UCL CL LCL ※判 异 准 则准则2: 连续9点在中心线的同侧UCL A B CL C C B ALCL ※判 异 准 则准则3: 连续6点呈上升或下降趋势UCL A B CL C C B LCL A ※判 异 准 则准则4: 连续14点上下交替UCL A B CL C C B LCL A ※判 异 准 则准则5: 连续3点中有2点落在中心线 同一侧的B区以外UCL A B CL C C B ALCL ※判 异 准 则准则6: 连续5点中有4点在C区之外(同侧)UCL A B CL C C B LCL A ※判 异 准 则准则7: 连续15点在中心线附近的C区内UCL A B CL C C B LCL A ※判 异 准 则准则8: 连续8点在中心线两侧而无一点在C区UCL A B CL C C B LCL A 决定标准差的估计方法一般选择Rbar的 标准差估计方式 决定选项进行正态性转换 λ值 λ=2 λ=0.5 λ=0 λ=-0.5 λ=-1 转换值 Y?=Y2 Y?=√Y Y?=logeY Y?=1/√Y Y?=1/Y?λ值将标准转换变量的 标准偏差最小化,当λ≠0 , 转换结果为Y λ,如λ =0,转换结果为LOGeY 决定选项(续)输入1,2,3StDEV控制限 图形输出:Xbar-R Chart of Supp21 1+3SL=602.376 Sample Mean 602 +2SL=601.660 +1SL=600.945 _ _ X=600.23 -1SL=599.515 -2SL=598.800 598 1 3 5 76600-3SL=598.084 11 Sample 13 15 17 1998 Sample Range 6 4 2 0 1 3 5 7 9 11 Sample 13 15 17 19+3SL=7.866 +2SL=6.484 +1SL=5.102 _ R=3.72 -1SL=2.338 -2SL=0.956 -3SL=0 判 图? 请判定前图是否有异常 ? 请问本图为解析用图或是控制用图 Xbar-s做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Xbar-s练习?打开Data目录下的Camshaft.mtw ? Select: Stat &Control Charts & Variables Charts for Subgroups & Xbar-sMinitab Worksheet 输入参数其他参数设置与Xbar-R图相同 其他参数设置与Xbar-R图相同 图形输出:Xbar-S Chart of Supp21 1+3SL=602.424Sample Mean602+2SL=601.693 +1SL=600.961 _ _ X=600.23 -1SL=599.499 -2SL=598.767600598 1 3 5 76-3SL=598.036 11 13 15 17 199Sample+3SL=3.211 +2SL=2.653 2 +1SL=2.095 _ S=1.537 -1SL=0.979 -2SL=0.421 0 1 3 5 7 9 11 13 15 17 19 -3SL=03Sample StDev1Sample 判 图? 请判定前图是否有异常 ? 请问本图为分析用图或是控制用图 I-MR图做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 I-MR练习? 打开下列档案: Data目录下的Coating.MTW ? Select: Stat &Control Charts & Variables Charts for Individuals & I-MR 输入参数输入变量 图形输出I-MR Chart of Coating+3SL=329.92Indiv idua l Val ue3206 6+2SL=316.36 +1SL=302.80 _ X=289.24 -1SL=275.68 -2SL=262.12 -3SL=248.57300 280 260 240 1 5 9 13 17 21 25 29 33 37 41 45Observation48 +3SL=49.97 +2SL=38.41 +1SL=26.86 __ MR=15.30 -1SL=3.74 -2SL=0 -3SL=0 1 5 9 13 17 21 25 29 33 37 41 45Mov ing Range36 24 12 0Observation 判 图? 请判定前图是否有异常 ? 请问本图为解析用图或是控制用图 I-MR-R图做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 I-MR-R练习? 打开Data目录下的Camshaft.mtw ? Select: Stat &Control Charts & Variables Charts for Subgroups & I-MR-RMinitab Worksheet 输入参数输入变量和样本数 图形输出I-MR-R/S (Between/Within) Chart of Supp21Subgroup Mean6025+3SL=602.169 +2SL=601.523 +1SL=600.876 _ X=600.23600 6 5 598 1 3 5 7 9 1 11 13 15 17 19 21 23 25-1SL=599.584 -2SL=598.937 -3SL=598.291MR of Subgroup Mean+3SL=2.382 2 +2SL=1.831 +1SL=1.280 1 __ MR=0.729 -1SL=0.178 -3SL=0 -2SL=0 1 3 5 7 9 11 13 15 17 19 21 23 25010Sample Range+3SL=8.83 +2SL=7.17 5 +1SL=5.52 _ R=3.87 -1SL=2.22 0 1 3 5 7 9 11 13 15 17 19 21 23 25 -2SL=0.56 -3SL=0Sample 判 图? 请判定前图是否有异常 ? 请问本图为分析用图或 是控制用图 Z-MR(标准化的单值移动极差)图做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 Z-MR练习?打开Data目录下的Exh_qc.MTW ? Select: Stat &Control Charts & Variables Charts for Individuals & Z-MR ?当过程数据少而无法很好 评估过程参数时使用 输入参数输入变量输入自变量 决定估计选择标准差的估计方法 图形输出 P图做法决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析判定及采取措施 P图练习? P图只能适用在二项分布的质量特性性。 ? 在做p图时,要注意其样本数必须达到 1/p~5/p,如此之下的图才比较具有意义。 输入数据?打开数据文档样本数 105 109 100 120 146 104 117 192 200 163 107 122 146 188 104 106 129 114 125 133 162 180 124 103 172 不合格数 4 2 0 5 3 2 4 3 5 2 1 5 1 0 2 3 1 6 1 3 3 2 0 7 3?将数据输入到Minitab表中 ?Select : Stat& Control Charts &Attributes Charts&P 输入参数输入变量 输入样本数 决定判异准则选择判异准则 计数型的判异准则 与计量型的不太一样 图形输出P Chart of 不合格数0.07 0.06 0.05 Proportion 0.04 0.03 0.02 0.01 0.00 1 3 5 7 9 11 13 15 Sample 17 19 21 23 25 LCL=0 _ P=0.02017 UCL=0.052331Tests performed with unequal sample sizes NP图做法决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 NP图练习? np图只能适用在二项分布的质量特性性。 ? 在做np图时,要注意其样本数必须达到 1/p~5/p,如此之下的图才比较具有意义。 输入数据?打开数据文档样本数 105 109 100 120 146 104 117 192 200 163 107 122 146 188 104 106 129 114 125 133 162 180 124 103 172 不合格数 4 2 0 5 3 2 4 3 5 2 1 5 1 0 2 3 1 6 1 3 3 2 0 7 3?将数据输入到Minitab表中 ?Select : Stat& Control Charts &Attributes Charts&NP 图形输出NP Chart of 不合格数10 UCL=9.00 81Sample Count64__ NP=3.4720 13 15 Sample Tests performed with unequal sample sizes 1 3 5 7 9 11 17 19 21 23 25LCL=0 C图做法决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 C图练习? c图只能适用在泊松分布的质量特性上。 ? 在做c图时,要注意其样本数必须达到取样 时至少包含一个缺陷以上,如此之下的图 才比较具有意义。 ? 另外就是基本上c图的样本要一定才可以。 如果样本数不一样,则应当使用u图。 ?打开数据文档次数 样本数 缺陷数 1 3 7 2 3 4 3 3 12 4 3 3 5 3 5 6 3 4 7 3 2 8 3 8 9 3 8 10 3 13 11 3 5 12 3 3 13 3 4 14 3 4 15 3 7 16 3 10 17 3 5 18 3 6 19 3 4 20 3 7 21 3 16 22 3 7 23 3 8 24 3 8 25 3 4 26 3 10 27 3 9 28 3 9 29 3 6 30 3 5输入数据?将数据输入到 Minitab表中 ?Select: Stat &Control Charts & Attributes Charts&C 输入参数输入变量 决定判异准则判异准则同P图一样 图形输出C Chart of 缺陷数18 16 14 Sample Count 12 10 8 6 4 2 0 1 4 7 10 13 16 Sample 19 22 25 28 LCL=0 _ C=6.771UCL=14.57 U图做法决定要研究或控制的Y特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 U图练习? u图只能适用在泊松分布的质量特性 上。 ? 在做u图时,要注意其样本数必须达到 取样时至少包含一个缺陷以上,如此之 下的图才比较具有意义。 ?打开数据文档组号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 面积 1 1 1 1 1 1.5 1.5 1.5 1.5 1.8 1.8 1.8 1.2 1.2 1.3 1.3 1.3 1.3 1.3 1.7 1.7 1.7 1.6 1.6 1.6 缺陷数 4 2 3 3 1 6 7 7 5 5 3 20 0 1 3 2 4 1 3 6 4 3 3 2 4输入数据?将数据输入到 Minitab表中 ?Select : Stat &Control Chart &Attributes Charts&U 输入参数输入变量 输入样本量 图形输出U Chart of 缺陷数12 10 8 UCL=6.94 6 4 2 0 1 3 5 7 9 11 13 15 Sample 17 19 21 23 25 LCL=01Sample Count Per Unit_ U=2.90Tests performed with unequal sample sizes EWMA做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 EWMA的全称为Exponentially Weighted Moving Average,即指数加权移动平均控制图. EWMA图的特点: 1、对过程位置的稍小变动十分敏感; 2 、图上每一点都综合考虑了前面子组的信息; 3 、对过程位置的大幅度移动没有Xbar图敏感; 4 、可应用于单值,也可应用于子组容量大于1的场合. EWMA图的适用场合: 可用于检测任意大小的过程位置变化,因此常用于监 控已受控过程,以发现过程均值相对于目标值的漂移 EWMA练习? Select: Stat &Control Chart & Time Weighted Charts & EWMA 输入参数确定权重系数λ 的值,λ由 所需的EWMA图对位置 偏移检测灵敏度所决定, 要求检测灵敏度越高, λ 值越小.如需检测1σ的过 程偏移, λ=0.2,如需检测 2σ的过程偏移,λ=0.4.常 取λ=0.2, 1&λ&2. 图形输出 CUSUM做法决定要研究或控制的Y或X特性 收集数据 输入minitab中 用minitab绘图及分析 判定及采取措施 CUSUM的全称为Cumulative Sum,即累积和控制图. CUSUM图的特点: 1、可以检测每个样本值偏离目标值的偏差的累积和; 2、可应用于单值,也可应用于子组容量大于1的场合; 3、要求每个子组的样本容量相等. CUSUM图的适用场合: CUSUM图适用于在过程受控时,检测过程实际值 偏离目标的异常点,作用与EWMA图类似. CUSUM练习例:某机场每天离港、进港航班多 达千架次,航班延误情况很是严重. 航空公司在6σ管理中把航班延误 作为重点解决的质量项目,规定航 班起飞时间比时刻表晚5分钟为延 误,其中不包括因恶劣天气等无法 抗拒因数造成的延误.通过一段时 间的治理,航班延误率从过去的 10%降到现在的2%左右,公司决定 采取过程控制,把航班延误率控制 在2%的较好水平.? Select: Stat &Control Chart & Time Weighted Charts & CUSUM组号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30n 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100NP 2 3 2 7 1 3 0 2 2 4 1 1 2 1 3 0 0 2 3 2 2 2 1 1 6 2 1 1 2 1 输入参数决策区间点击此选项 过程允许偏移量 图形输出 MINITAB的制程能力分析 制程能力之分类计量型(基于正态分布) 计数型(基于二项分布) 计数型(基于泊松分布) MINITAB 能力分析的选项(计量型)?Capability Analysis (Normal) ?Capability Analysis (Between/Within) ?Capability Analysis (Nonnormal) ?Capability Analysis (Multiple Variable normal) ?Capability Analysis (Multiple Variable Nonnormal) ?Capability Analysis (Binomial) ?Capability Analysis (Poission) ?Capability Sixpack (Normal) ?Capability Sixpack (Between/Within) ?Capability Sixpack (Nonnormal) Capability Analysis (Normal)? 该命令会划出带理论正态曲线的直方图, 这可直观评估数据的正态性。输出报告中 还包含过程能力统计表,包括子组内和总 体能力统计。 Capability Analysis (Between/Within)? 该命令会划出带理论正态曲线的直方图, 可以直观评估数据的正态性。 ? 该命令适用于子组间存在较大变差的场 合。输出报告中还包含过程能力统计表, 包括子组间/子组内和总体能力统计。 Capability Analysis (Nonnormal)? 该命会会划出带非正态曲线的直方图,这 可直观评估数据是否服从其他分布。输出 报告中还包含总体过程总能力统计 ?Capability Analysis (Multiple Variable normal) ?Capability Analysis (Multiple Variable Nonnormal)---上述两个命令用于对多个变量进行分析 制程能力分析做法决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 STEP1决定Y特性决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明?Y特性一般是指客户所关心所重 视的特性。 ?Y要先能量化,尽量以定量数据 为主。 ?Y要事先了解其规格界限,是单边 规格,还是双边规格。 ?目标值是在中心,或则不在中心 ?测量系统的分析要先做好。 STEP2决定Y特性决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 ?在收集Y特性时要 注意层别和分组。 ?各项的数据要按时间 顺序做好相应的整理 STEP3决定Y特性决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 ?将数据输入MINTAB中, 或则在EXCEL中都可以。 STEP4决定Y特性决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 ??用MINITAB&STAT& QUALITY TOOLS &CAPABILITY ANALYSIS (NORMAL) STEP5决定Y特性决定Y特性 收集Y特性数据 输入MINITAB数据表 进行分析 结果说明 ?利用MINITAB的各项图形 来进行结果说明 练习样本 1 2 3 4 5 6 7 8 9 10 X1 99.70 99.32 99.89 99.15 99.66 97.74 101.18 101.54 101.49 97.16 X2 98.72 100.97 99.83 99.71 100.80 98.82 100.24 100.96 100.67 98.26 X3 100.24 100.87 101.48 99.17 101.06 99.24 99.62 100.62 99.36 97.59 X4 101.28 99.24 99.56 99.30 101.16 98.64 99.33 100.67 100.38 100.09 X5 101.20 98.21 100.90 98.80 100.45 98.73 99.91 100.49 102.10 99.78 输入数据?Select: Stat &Quality Tools & Capabilty Analysis(Normal)注意输入方式 输入选项根据不同的数据输入 方式选择分析方法输入上下规格界限 选择标准差的估计方法一般选择复合的标准差估计方式 一般选择复合的标准差估计方式 选项的输入选择是否作 正态型转换 如果需要计算Cpm 则需要输入目标值过程能力表现 形式的选择 以Cpk, Ppk结果的输出样本数值超过分 析规格界限的分 布率模拟曲线落在 控制线以外的 分布率Cpm是指样本数值相对 于对于目标值的一个 能力值,也就是样本 是否靠近目标值的概 率 Cp:过程能力指数,又称为潜在过程能力指数, 为容差的宽度与过程波动范围之比. Cp=(USL-LSL)/6σ 其中:σ=R/d2 Cpk:过程能力指数,又称为实际过程能力指数, 为过程中心?与两个规范限最近的距离 min{USL- ?, ?-LSL}与3σ之比. Cpk= min{USL- ?, ?-LSL}/ 3σ 其中:σ=R/d2 Cpm:过程能力指数,有时也称第二代过程力 指数,质量特性偏离目标值造成的质量损失. ? = σ2+(?-m)2 Cpm =(USL-LSL)/6σ′其中:σ2 Cpmk=Cpk/√1+[(?-m)/σ]2 Cpmk称为混合能力指数 ?Pp与Ppk:过程绩效指数,计算方法与计算Cp和 Cpk类似,所不同的是,它们是规范限与过程总 波动的比值.过程总波动通常由标准差s来估计. K=(2 M- ? )/T ?过程能力与缺陷率的关系: 1、假如过程中心?位于规范中心M与上 规范限USL之间,即M≤ ? ≤ USL时, p(d)=Φ[-3(2Cp-Cpk)]+Φ(-3Cpk) 2 、假如过程中心?位于规范中心M与下 规范限LSL之间,即LSL≤ ? ≤ M时, p(d)=Φ[-3(1+K)Cp]+Φ[-3(1-K)Cp]n ?1S=√? ( xi?x )2 以Zbench方式输出 结果说明?ZUSL=(USL- ?)/σ ?ZLSL=(? -LSL)/σ ?Z=(USL- LSL)/2σ 或 Z=3Cp ?双侧规范下综合Sigma Level Zbench 需通过总缺陷率进行折算 ?使用Sigma Level Z来评价过程能力的 优点是:Z与过程的不合格率p(d)或DPMO 是一一对应的. 练习?请打开Data目录下的 Camshaft.mtw,以 Zbench方式输出 填入参数 结果输出 ?Select :CalcCCalculator ?Select :CalcCProbability Distribution-Normal通过DPMO求Sigma Level 结果输出合格率Z值,Sigma Level Capability Analysis (Between/Within)组间的σ 组内的σ 总的σ=√组间的σ2+组内的σ2 √∑(Xi-X)2/(n-1)此处的Ppk&Cpk ※StDev(overall):长期标准差的估计值 StDev(B/W) :短期标准差的估计值※过程稳定系数dσ = StDev(overall) - StDev(B/W) ※过程相对稳定系数drσ =[ StDev(overall) - StDev(B/W)] / StDev(overall)过程相对稳定系数的评价参考过程相对稳定系数drσ的范围drσ&10% 10%&=drσ&20% 20%&=drσ&50% drσ&=50%评价接近稳定 不太稳定 不稳定 很不稳定 Capability Analysis (Nonnormal)?此项的分析是用在当制程不是呈现正 态分布时所使用。因为如果制程不是 正态分布硬用正态分布来分析时,容 易产生误差,所以此时可以使用其他 分布来进行分析,会更贴近真实现 像。 练习? 请使用同前之数据来进行分析。 ? 上规格:103 ? 下规格:97 ? 规格中心:100 输入相关参数Select: Stat &Quality Tools & Capabilty Analysis(Nonnormal) 填入选项要求威布尔分布的参数估计 结果图形形状参数 正态分布适用性的判定? 可以使用?Stat&basic statistic&normality test? 但数据要放到同一个column中,所以必须 针对前面的数据进行一下处理 数据调整进行数据的堆积 填写选项输入变量输入作为参考 的概率记号 结果输出P-value> 0.05,接 收为正态 分布 结果输出(加标0.5概率) 计量型制程能力分析总结? 一般的正态分布使用?Capability Analysis (Normal)? 如果是正态分布且其组内和组间差异较大 时可用?Capability Analysis (Between/Within)? 当非正态分布时则可以使用?Capability Analysis (Nonnormal) Capability Sixpack (Normal)? 复合了以下的六个图形?Xbar ?R ?原始数据分布(plot) ?直方图 ?正态分布检定 ?CPK, PPK 练习? 请以前面的数据来进行相应的Capability Sixpack (Normal)练习? Select: Stat &Quality Tools & Capabilty Sixpack(Normal) 输入各项参数输入规格 选定判异准则选择判异准则 选择标准差估计方法默认值是复合标 准差计算公式 考虑可选择项如果希望计算Cpm, 则输入目标值 结果输出 Capability Sixpack (Between/Within)? 复合了以下的六个图形?Individual ?Moving Range ?Range ?直方图 ?正态分布检定 ?CPK, PPK 同前练习及结果 Capability Sixpack (Nonnormal)? 复合了以下的六个图形?Xbar ?R ?原始数据分布 ?直方图 ?正态分布检定 ?CPK, PPK 结果输出形状参数 二项分布制程能力分析? 二项分布只适合用在?好,不好 ?过,不过 ?好,坏? 不可以用在?0,1,2,3等二项以上的选择,此种状况必须使用泊 松分布。 示例? 数据在Data目录下 的Bpcapa.mtw中 ? Select : Stat &Quality Tools &Capabilty & Analysis & Binomial 填好各项的参数输入样本数 输入历史的不良率 选好控制图的判异准则 结果及输出不良的比例(希 望它是随机分布)该线与P Chart中的 P bar 是 相同的累计不良率 泊松分布制程能力分析? 泊松分布只适合用在?计数型,有二个以上的选择时? 例如可以用在?外观检验,但非关键项部份 ?0,1,2,3等二项以上的选择,此种 状况必须使用泊松分布。 示例? 数据在Data目录下 的Bpcapa.mtw中?Select: Stat &Quality Tools & Capabilty Analysis(Poisson) 填好各项的参数 结果及输出 基础统计 描述性统计? Select: Stat &Basic Statistics &Display descriptive statistics ?假设想对两组学生的身高进行 描述性统计以便比较,数据如右:HEIGHT 175 168 181 169 166 173 173 176 180 181 155 154 162 157 167 156 159 165 163 159SEX 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 填入参数 输出结果Descriptive Statistics: HEIGHT选定栏数据修正均值 Trimmed MeanTotal Variable SEX Count N N* CumN Percent CumPct Mean SE Mean TrMean HEIGHT 1 10 10 0 10 50 50 174.20 1.72 174.38 2 10 10 0 20 50 100 159.70 1.39 159.50 Sum of Variable SEX StDev Variance CoefVar Sum Squares Minimum Q1 HEIGHT 1 5.43 29.51 3.12 722.00 166.00 168.75 2 4.40 19.34 2.75 215.00 154.00 155.75 3/4数据点与1/4数据点的差值InterQuartile Range 数据连续差异平方的均值 Variable SEX Median Q3 Maximum Range IQR Skewness Kurtosis MSSD HEIGHT 1 174.00 180.25 181.00 15.00 11.50 -0.09 -1.29 24.78 2 159.00 163.50 167.00 13.00 7.75 0.37 -1.10 20.89变异系数 输出结果(续1) 输出结果(续2)Select: Stat & Basic Statistics & Graphical Summary 输出结果(续3) 假设检验 广告宣传的虚假性?手机电池的使用寿命不是按年来计算的,而是按电 池的充放电次数来计算的。镍氢电池一般可充放电 200-300次,锂电池一般可充放电350-700次。某手机 电池厂商宣称其一种改良产品能够充放电900次,为 了验证厂商的说法,消费者协会对10件该产品进行 了充放电试验。得到的次数分别为891,863,903, 912,861,885,874,923,841,836。 广告宣传是虚假的吗?上述数据的均值为878.9,明显少于900。但 是,到底均值落在什么范围内我们就认为广 告宣传是虚假的呢?现在的问题是如 何确定这两条线 的位置900接受广告宣传 假设检验的原理?假设检验的原理是逻辑上的反证法和统计上的小概率原理? 反证法:当一件事情的发生只有两种可 能A和B,如果能否定B,则等同于间接 的肯定了A。 ? 小概率原理:发生概率很小的随机事件 在一次实验中是几乎不可能发生的。 假设检验的原理(续)?由于个体差异的存在,即使从同一总体中严格的随机 抽样,X1、X2、X3、X4、、、,也不尽不同。 它们的 不同有两种(只有两种)可能:? (1)分别所代表的总体均值相同,由于抽样误差造 成了样本均值的差别。差别无显著性 。 ? (2)分别所代表的总体均值不同。差别有显著性。? 假设检验的几个步骤? 假设检验的一般步骤,即提出假设、确定 检验统计量、计算检验统计量值、做出决 策。构造统计量 计算统计量值 做出推断 做出统计 决策提出假设 提出假设?在决策分析过程中,人们常常需要证实自 己通过样本数据对总体分布形式做出的某 种推断的正确性(比如,总体的参数θ大 于某个值θ0),这时就需要提出假设,假 设包括零假设H0与备择假设H1。 零假设的选取?假设检验所使用的逻辑上的间接证明法决定 了我们选取的零假设应当是与我们希望证实 的推断相对立的一种逻辑判断,也就是我们 希望否定的那种推断。 零假设的选取(续一)?同时,作为零假设的这个推断是不会轻易 被推翻的,只有当样本数据提供的不利于 零假设的证据足够充分,使得我们做出拒 绝零假设的决策时错误的可能性非常小的 时候,才能推翻零假设。 零假设的选取(续二)?所以,一旦零假设被拒绝,它的对立 面――我们希望证实的推断就应被视为 是可以接受的。 构造检验统计量? ?收集样本信息 利用样本信息构造检验统计量z? x ? ?0?n 计算检验统计量值?把样本信息代入到检验统计量中,得到检验 统计量的值。z? x ? ?0?n 做出决策1、 规定显著性水平α,也就是决策中所面临的风险 2、决定拒绝域(critical region)和判别值(critical value) 3、判定检验统计量是否落在拒绝域内 4、得出关于H0和关于H1的结论 显著性水平?? ?显著性水平α是当原假设正确却被拒绝的概 率 通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其 正确的可能性(概率)为95%或99% 判定法则1、如果检验统计量落入拒绝域中,则拒绝原假设 2、如果检验统计量落入接受域中,则我们说不能拒绝原假设※注意:判定法则2的含义是指我们在这个置信水平下 没有足够的证据推翻原假设;实际上,如果我们改变 置信水平或样本数量就有可能得到与先前相反的结果。 零假设和备择假设可能的零假设和备择假设的情况零假设 1.大于等于(≥) 2.小于等于(≤) 3. 等于(=) 备择假设 小于(<) 大于(>) 不等于(≠) 单侧检验(one-tailed hypothesis)?某种果汁的包装上标明其原汁含量至少为 90%。假定我们想通过假设检验对这项说 明进行检验。 检验的方向性?如果要检验的问题带有方向性,如灯泡寿 命、电池时效、头盔防冲击性等数值是越 大越好;零件废品率、生产成本等数值则 是越小越好,这类问题的检验就属于单侧 检验。 单侧检验?拒绝域和临界值左单侧检验 临界值 右单侧检验 临界值? ? 0.051???0.95? ? 0.050拒绝域接受域接受域拒绝域 单侧检验的例子?例1:一家食品公司广告说他的一种谷物一袋 有24千克。消费者协会想要检验一下这个说 法。他们当然不可能打开每袋谷物来检查, 所以只能抽取一定数量的样品。取得这个样 本的均值并将其与广告标称值作比较就能做 出结论。请给出该消费者协会的零假设和备 择假设。 单侧检验的例子(续一)解:(一)、首先找出总体参数,这里应该是总体的均值m,即谷 物的平均重量,给出原假设和备择假设,即用公式表达两个相 反的意义。 H0: m ≥ 24 (均值至少为 24) Ha: m & 24 (均值少于24) (二)、确定概率分布和用来做检验的检验统计量。 我们要检验抽取的样本均值是否达到广告宣称的数额,就 可以用样本均值离标称值的标准离差个数的多少来判断。 因此构造检验统计量x?? z* ? ? n 单侧检验的例子(续二)(三)、设定置信水平为95%。收集样本信息,假设选取了一个数目为40的样本,计算得x ? 23.76n ? 40计算检验统计量的值为(σ = 0.2).76?24 x?? 23 z? ? ??7.5895 ? n 0.2 40(四) 、 查表可以得出临界值和拒绝域,也可用计算机输出p值。计算出的Z值落入拒绝域,所以拒绝H0,即意 味着我们认为谷物的重量达不到厂商宣称的数值。 双侧检验?一些产品某一项指标必须满足在某一个范 围内,如精密零件的尺寸和重量、保险丝 适用的电流强度等等,这类问题的检验属 于双侧检验。 双侧检验? ?图例: 拒绝域和临界值? ? 025 0 . 20? ? ? 12 ? 025 0 .临 拒 接 界 绝 受 值 域 两类错误?假设检验是基于样本信息做出的结论,而 我们知道样本只是代表了总体的一部份信 息,因此必须考虑发生误差的概率。? H0为真时我们拒绝H0的错误称为第I类错误, 犯这种错误的概率用α来表示,简称为α错误或 弃真错误; ? 当H0为伪时我们接受H0的错误称为第II类错 误,犯这种错误的概率用β来表示,简称为β错 误或取伪错误。 两类错误出现的场合接受零假设 拒绝零假设零假设为真正确-无偏差I类错误零假设为假II类错误正确-无偏差 两类错误发生的概率两类错误发生的概率如下表所示: 接受H0 H0为真 H0为伪 1-α(正确决策) β (取伪错误) 拒绝H0,接受H1α(弃真错误)1- β(正确决策) 两类错误的关系接受H0拒绝H0I类错误?0II类错误0?1 假设检验的Minitab实现:单样本Z检验(1-Sample Z)?Select: Stat &Basic Statistics & 1-Sample Z?例:右表为测量9个工件所 得到的数据.假设工件 数据服从正态分布并 且总体的σ=0.2,需计算 总体均值是否等于5及 其在95%置信度下的 置信区间.Values 4.9 5.1 4.6 5 5.1 4.7 4.4 4.7 4.6 填入参数 输出结果One-Sample Z: ValuesTest of mu = 5 vs not = 5 The assumed standard deviation = 0.2 Variable Values N 9 Mean 4.78889 StDev 0.24721 SE Mean 0.06667 95% CI (4.655) Z -3.17 P 0.002 单样本t检验(1-Sample t)?Select: Stat &Basic Statistics & 1-Sample t ?例:右表为测量9个 工件所得到的数据.假 设工件数据服从正态 分布并且未知总体的 σ,需计算总体均值是 否等于5及其在95%置 信度下的置信区间.Values 4.9 5.1 4.6 5 5.1 4.7 4.4 4.7 4.6 填入参数 输出结果One-Sample T: ValuesTest of mu = 5 vs not = 5 Variable Values N 9 Mean 4.78889 StDev 0.24721 SE Mean 0.08240 95% CI (4.591) T -2.56 P 0.034 双样本t检验(2-Sample t)?Select: Stat &Basic Statistics & 2-Sample t?采用Data目录下的Furnace.mtw 填入参数 输出结果Two-Sample T-Test and CI: BTU.In, DamperTwo-sample T for BTU.In Damper 1 2 N 40 50 Mean 9.91 10.14 StDev 3.02 2.77 SE Mean 0.48 0.39P-Value&0.05 接受原假设P-Value = 0.701 DF = 88Difference = mu (1) - mu (2) Estimate for difference: -0.% CI for difference: (-1..979631) T-Test of difference = 0 (vs not =): T-Value = -0.38 Both use Pooled StDev = 2.8818 成对样本t检验(Paired t)?Select: Stat &Basic Statistics & Paired t?采用Data目录下的Exh_stat.mtw 填入参数 输出结果Paired T-Test and CI: Mat-A, Mat-BPaired T for Mat-A - Mat-B N 10 10 10 Mean 10.0 -0.410000 StDev 2.5 0.387155 SE Mean 0.4 0.122429Mat-A Mat-B DifferenceP-Value&0.05 拒绝原假设P-Value = 0.00995% CI for mean difference: (-0.686954, -0.133046) T-Test of mean difference = 0 (vs not = 0): T-Value = -3.35 单样本比例检验(1 Proportion)?Select: Stat &Basic Statistics & 1 Proportion?本案例采用总结数据形式, 直接填入参数:实验次数成功次数 输出结果:Test and CI for One ProportionTest of p = 0.6 vs p & 0.6 95% Upper Exact Sample X N Sample p Bound P-Value 1 302 498 0...631 双样本比例检验(2 Proportion)?Select: Stat &Basic Statistics & 2 Proportion?本案例采用总结数据形式,直接填入参数: 输出结果Test and CI for Two ProportionsSample X N Sample p 1 7 50 0. 5 50 0.100000 Difference = p (1) - p (2) Estimate for difference: 0.04 95% CI for difference: (-0..167141) Test for difference = 0 (vs not = 0): Z = 0.62 P-Value = 0.537 其它注意事项选择假设检验方法要注意符合其应用条件; ? 当不能拒绝H0时,即差异无显著性时,应考 虑的因素: ? 可能是样品数目不够; ? 单侧检验与双侧检验的问题。? 正态性检验(Normality test)?Select: Stat &Basic Statistics & Normality test ?本例采用Data目录下的Scores.MTW 填入参数基于ECDF的检验 基于相关分析的检验 基于卡方分析的检验注:ECDF:(Experimental Cumulative Distribution Function) 实验室累计分布函数 基于ECDF检验的输出结果 基于相关分析检验的输出结果 基于相关卡方检验的输出结果 小组讨论与练习※报纸报导某地汽油的价格是每加仑115美分,为 了验证这种说法,一位学者开车随机选择了一些 加油站,得到某年一月和二月的数据如下:一月:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118 二月:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 1251)分别用两个月的数据验证这种说法的可靠性; 2)分别给出1月和2月汽油价格的置信区间; 3)给出1月和2月汽油价格差的置信区间. 方差分析方差分析的引入 怎样得到F统计量 单因素方差分析的例子 检验方差假设 多因素方差分析 多变量图分析 小组讨论与练习 本 章 目 标1.理解方差分析的概念 2.知道方差分析解决什么样的问题 3.掌握单因素和多因素方差分析的原理 4.会利用Minitab对实际问题进行方差分析 5.能够对方差分析的结果作出解释 方差分析的引入?假设检验讨论了检验两个总体均值是否相等 的问题,但对于多个总体的均值比较,如果 仍用假设检验,就会变得非常复杂。总体 方差分析的引入(续一)? 方差分析(ANOVA:analysis of variance)能够解决多个均值 是否相等的检验问题。 ?方差分析是要检验各个 水平的均值是否相等, 采用的方法是比较各水 平的方差。 方差分析的引入(续二)?某汽车厂商要研究影响A品牌汽车销量的因素。该 品牌汽车有四种颜色,分别是黑色、红色、黄色、 银色,这四种颜色的配置、价格、款式等其他可 能影响销售量的因素全部相同。从市场容量相仿 的四个中等城市收集了一段时期内的销售数据, 见下表。A品牌汽车在四个城市的销售情况黑色 45 41 38 39 红色 36 43 39 42 黄色 23 21 19 17单位:辆银色 19 22 26 19城市 1 2 3 4 方差分析的引入(续三)方差分析实际上是用来 辨别各水平间的差别是否 超出了水平内正常误差的 程度 ? 观察值之间的差异包括 系统性差异和随机性差异。? 方差分析的引入(续四)观察值 期望值水平1差距水平2组间方差 总离差 组内方差 怎样得到F统计量SST ? ?? ( X ij ? X )j ?1 i ?1 g njSS B ? n j ? ( X j ? X ) 22g组间方差gj ?1总离差SSW ? ?? ( X ij ? X j ) 2nj组内方差j ?1 i ?1X ij 第j个水平中的第i个个体g水平的个数X 总体的均值X j 第j个水平的样本均值 怎样得到F统计量水平间(也称组间)方差和水平内(也称组内)方 差之比是一个统计量。实践证明这个统计量 遵从一个特定的分布,数理统计上把这个分 布称为F分布。即F=组间方差/组内方差注意:组间方差(SSB)+组内方差(SSw)=总方差(SST) F分布的特征??从F分布的式子看出,F分布的形状由分母和 分子两个变量的自由度确定,因此F分布有两 个参数。 F分布的曲线为偏态形式,它的尾端以横轴为 渐近线趋于无穷。自由度(25,25) 自由度(5,5)自由度(30,100) F分布的特征(续)?从上图可以看出,随着分子分母自由度的 增加,分布图逐渐趋向正态分布的钟型曲 线(但它的极限分布并不是正态分布),以前 接触过的t分布、χ2分布的图像也有类似 的性质t分布正态分布χ2分布F分布 方差分析的前提?不同组样本的方差应相等或至少很接近水平1组内方差远远 超过两水平组间方 差,我无法分离这 两种差别!水平1水平2 单因素方差分析?例1:我们要研究一家有三个分支机构的公司 各分支机构的员工素质有无显著差异,已邀 请专业的人力评测单位对每一分支机构的员 工进行了评测,结果以百分制的分数给出, 每一机构抽取五位员工的结果如下表: 员工素质人力评测观察值 1 2 3 4 5 样本均值 样本方差 样本标准差 分支一(北京) 75 82 76 85 89 81.4 35.3 5.94 分支二(上海) 88 85 77 69 72 78.2 66.7 8.17 分支二(广州) 69 65 70 74 80 71.6 32.3 5.68 检验方差是否一致?在方差分析之前,我们可利用Minitab对数据 作方差一致性检验Minitab能够读取的数据格式与上表给出的格式不同,我们必须 把数据转化为Minitab能够理解的形式,具体做法是: 将所有变量值输入工作表的第一列,对因素进行编码,按照一定 的顺序编为1、2、3...,输入后面几列。 对本例:1. 先将素质测评的得分输入工作表列一; 2. 三个分支分别编码为1、2、3,对应于变量值填入第二列; 方差一致性检验Stat→ANOVA→Test for Equal Variance数据菜单 方差一致性检验(续一)适用于正态 分布的数据适用于非正 态分布的数据 方差一致性检验(续二) 给出假设?因素是方差分析研究的对象,在这个例子 里,两个变量分别是分支机构位置和员工素 质测评分数,这里分支机构的位置就是一个 因素,因素中的内容就称为水平。该因素中 有三个水平,即机构的不同位置。学过假设 检验的知识后,我们可以给出下面的假设:H 0 : ?1 ? ?2 ? ?3H1 : 总体均值不全相等 零假设为真?若零假设为真,则可以认为只有一个抽样分 布,此时三个样本均值比较接近。三个样本 均值的均值与方差可用于估计该抽样分布的 均值与方差。x3x2 μ三个样本均值x1 零假设为真?总体均值的最优估计是三个样本均值的算术 平均数,而抽样分布的方差的估计可以由三 个样本均值的方差给出,这个估计就是? 2的 组间估计x ? ( x1 ? x2 ? x3 ) / 3 ? (81.4 ? 78.2 ? 71.6) / 3 ? 77.22 2 2 (81.4 77.2) + (78.2 77.2) + (71.6 77.2) ? 25 sx 2 ? 3 -1又由 ? 2 ? n? x2得到 ? 2的估计量 ? n ? ? x2的估计量? nsx 2 ? 5 ? 25 ? 125 零假设为假?为了说明零假设为假时的情况,假定总体 均值全不相同,由于三个样本分别来自不 同均值的总体,则样本均值不会很接近, 2 s 此时 x 将变大,使得 ? 2的组间估计变大。x3μ3x2 μ2μ1 x1三个样本均值 零假设为假(续)?每个样本方差都给出 ? 2 的一个估计,这个 估计只与每个样本内部方差有关,若样 本量相同,各个样本方差的算术平均值 就是组内方差的估计值。35.3 ? 66.7 ? 32.3 ? 的估计量 ? ? 44.8 32 检验统计量?? 2的 前面已经讨论过,当零假设为真时, 组间估计和组内估计应该很接近,即其比 值应接近于1。而当零假设不成立时, ? 2的 组间估计将偏大,从而两者的比值会大于 1,因此我们构造形如F=组间方差/组内方差的检验统计量,在一定的置信水平下,将 这个值和某个临界值作比较,就可以得出 接受还是拒绝零假设的结论。 深入理解F统计量?F统计量实际上是用来比较组间差异与组 内差异的大小,造成这种差别既有抽样的 随机性,也可能包含系统因素的影响。?组间差异是用各组均值减去总均值的离差 的平方再乘以各组观察值的个数,最后加 g 总 SS B ? n j ? ( X j ? X ) 2j ?1?组内差异则是各组内部观察值的离散程度SSW ? ?? ( X ij ? X j ) 2j ?1 i ?1 g nj 深入理解F统计量(续)??上述组间差异与组内差异必须消除自由度 不同的影响 对SSW,其自由度为n-g,因为对每一种水 平,该水平下的自由度为观察值个数-1, 共有g个水平,因此拥有自由度个数为?j=1gg(nj -1)=n-g?对SSB,其自由度为g-1,g为水平的个数。SS B /( g ? 1) ?F ? SSW /(n ? g ) 检验方差假设F的抽样分布接受域 拒绝域FcrF?SS B /( g ? 1) SSW /(n ? g ) 检验步骤?对于k个总体均值是否相等的检验:H 0 : ?1 ? ?2 ? ? ? ?kH1 : 总体均值不全相等SSW /(n ? g )?检验统计量为: F ? SS B /( g ? 1)?给定显著性水平α的拒绝域:如果F(g-1,n-g)&Fcr , 则拒绝H 0其中,g-1,n-g分别是F统计量分子分母的自由度 计算结果??对上例,计算得F=组间方差/组内方差 =125/44.8=2.79; 查F分布表得到α=0.05时临界值 Fcr(2,12)=3.89 F&Fcr,所以不能拒绝零假设,即认为三 个分支机构员工素质大体一致,不存在 显著差异。? 方差分析表?上面的计算结果可以很方便的用方差分析表 来描述。下面是用Minitab软件得到的输出结 果,p值大于0.05,不能拒绝原假设.即认为三 个分支机构员工素质评分无显著差异.方差分析表 方差来源 组间 组内 合计 自由度 离差平方和 均方FP2 12 14249.7 537.2 786.9124.9 44.82.79 0.101 多因素方差分析???方差分析也可以同时分析两个或两个以上 的因素,这就是多因素方差分析。 有的实际问题需要我们同时考虑两个因素 对实验结果的影响,例如在例1中,除了关 心分支机构的差别外,我们还想了解不同 薪酬水平是否和员工素质有关。 同时对这两个因素进行分析,就属于双因 素方差分析,通过分析,我们可以知道究 竟哪一个因素在起作用,或者两个因素的 影响都不显著。 不同配方的水泥硬化时间的分析例 2:特殊环境如水下、高温环境中,建筑材料对水泥的 硬化时间有严格的要求。现欲比较几种配方的水泥在不同 温度下的硬化时间,其他条件相同,试验结果如下表: 施工温度 配方1 冷(4℃) 凉(10℃) 温(16℃) 热(20℃) 26 38 54 103 配方编号 配方2 29 30 37 77 配方3 21 44 85 156 配方4 33 69 79 105 方差一致性检验适用于正态 分布的数据适用于非正 态分布的数据 用Minitab作双因素方差分析输入数据 运行Stat→ANOVA →Two-way… 用Minitab作双因素方差分析(续一)出现Two-way Analysis of Variance对话框后:点选C1到Response框中 点选C2到Row factor框中 点选C3到Column factor框中选择Fit additive model (可加模型) 用Minitab作双因素方差分析(续二)红 色 方 框 部 分 为 方 差 分 析 表Minitab输出结果S=√MSE 结果的进一步解释?我们将Minitab输出的方差分析表转换为下表 其中F临界值为手工加入双因素方差分析: C2, C3 方差分析表 方差来源 C2 C3 误差 合计 自由度 3 3 9 15 离差平方和 均方 F P Fcr .87 0.096 3.86 15.73 0.001 3.86 76 结果的进一步解释C2是配方变量, F<Fcr,所以不能拒绝零假设, 即认为不同配方的反应时间大体一致, 不存在显著差异。 C3是温度变量, F>Fcr,所以拒绝零假设, 即认为不同温度的反应时间不一致, 存在显著差异。 多变量图分析还是以水泥硬化试验为例 多变量图:Stat→Quality Tools→ Multi-Vari Chart 多变量图输出将反应温度各个 取值对应的硬化 时间连接起来连线上四个点分别代表 在该反应温度上对应配 方编号的反应时间 ?本例中,四种反应温度对应不同水泥配方的 反应时间差异较大,说明水泥反应温度与配 方有交互作用,与四种温度下最快的反应时 间对应的编号分别为:3,2,2,2. ?若要将因子间的交互作用和其他因子作用量 化,可以进一步采用方差分析或一般的线性 模式等方法. 小组讨论与练习1、化妆品公司要分析一 样本\城市 种新产品是否受到普遍 组编号1 组编号2 欢迎,市场部在上海、 组编号3 香港、东京三地针对目 组编号4 标人群进行了抽样调 查,消费者的评分如下: 组编号5组编号6 组编号7 组编号8 组编号9 组编号10 上海 66 74 75 79 84 56 55 68 74 88 香港 87 59 69 70 78 88 80 72 84 77 东京 79 65 70 60 49 45 51 68 59 49?用方差分析来分析三地目标人群对该产品 的看法是否相同? ANOVA的Minitab实现:单因数方差分析(One-Way)?可进行单变量方差 分析,也可进行多个均 值的比较 ?Select :Stat-ANOVAOne-Way ?采用Data目录下的 Exh-aov.MTW 填入参数选择均值 的多重比 较方法设置误差率?“Fisher’s”方法给出了各 对均值差的置信区间 ?“Hsu’MCB”方法给出了各个均值 与“最好均值”差的置信区间 结果输出?方差分析表的F检 验结果中,P值&0.05, 表示某种地毯的耐久 性有差异。 ?相对于第1,2,3 种地 毯,第4种地毯为最 佳,因为其均值最 大,另外,2,3均值的 置信区间的上限为0, 因此这两个水平为最 小水平 结果输出(续)?从中可看出2 和4,3和4差值的 置信区间均为正 值,1和2差值的 置信区间为负值, 因此可认为2和 4,3和4的均值存 在显著差异。 均值分析(Analysis of Means)?可用于测试各均值的互等性 ?Select :Stat-ANOVA-Analysis of Means ?采用Data目录下 的Exh-aov.MTW?研究两湖泊中的 浮游生物生长条 件(营养剂) 填入参数 结果输出该点均值与总体均值存在显著差异 平衡数据方差分析(Balanced ANOVA)?Select :Stat-ANOVA- Balanced ANOVA ?采用Data目录下的Exh-aov.MTW ?某公司想评价新旧两个 型号计算器对计算时间的 影响,由6位工程师分别 用新旧两种计算器对一个 工程问题和统计问题进行 计算,统计出计算时间数 据如右: (交叉数据) 填入参数问题类别和计算器类别 间的“|”表示要评估该两 个因数交互作用的影响在此模型中输入工程师、 问题和计算器类别 将工程师作为随 机因数加以考虑 点击“Results”对话框,输入下图所示信息:显示问题、计算机类别及 二因数交互作用时的均值 结果输出各因数名称、 水平数及水 平值 方差分析表,P值 均小于0.05,表明 所有因数为影响计 算时间的显著因数 相关因数不同水平对应的 均值,可以看出新型计算 器计算时间比旧型的短 ?Select :Stat-ANOVA- General Linear Model ?采用Data目录下的Exh-aov.MTW ?某农场购买了4个厂家的11种杀 虫剂用来杀灭一种飞蛾,农艺师想 比较不同公司生产的杀虫剂的有效 性,他设计的试验方案为在33个玻 璃容器中放入400只飞蛾,分别用11 种杀虫剂进行杀灭,重复进行3次试 验,4小时后观察容器中尚在生存的 飞蛾数量,并据此进行分析判定。 公司和杀虫剂之间为嵌套关系。通用线性模型 (General Linear Model) 填入参数用此方法成对比较均值 点击此对话框 结果输出因数、类别、 各因数的水平 数及各水平的 数值 方差分析表,从 表中的P值可以 看出公司及产品 均为杀虫效率的 重要影响因数。 用“Tukey”方法 对各公司产品均 值差的置信区间 测试结果。 结果输出(续)本例中A公司与 C 、D公司,B 公司与C 、D公 司,C公司与D 公司的产品均值 都存在显著差异 全嵌套数据方差分析(Fully Nested ANOVA)?Select :Stat-ANOVAFully Nested ANOVA ?采用Data目录下的 Exh-aov.MTW 填入参数 结果输出 平衡数据多响应变量方差分析(Balanced MANOVA)?Select :Stat-ANOVA- Balanced MANOVA ?采用Data目录下的 Exh-mvar.MTW ?一位工程师想研究确 定胶卷成型工序的优化 条件,他选用三个评价 项目:撕扯阻力、表面 光泽和透明度。试验因 数为成型射出速度和添 加剂含量。 填入参数撕扯阻力、表面 光泽和透明度 “|”表示交互作用 成型射出速度 和添加剂含量 点击“Results”对话框,选中下图复选框: 结果输出对每个因数用4种方法 进行了4种测试,“成型 射出速度”的P值为0.003, 表示该因数对响应变量 有显著影响. SSCP矩阵类似于单因数方差分析中的 平方和,可用来评价方差来源.对因数“成 型射出速度”,1.740,1.301,0.4205分别 相当于单相应变量方差分析中该因数对 应的平方和. SSCP for Error用于评价误差项 评价响应变量间的相关程度, 各响应变量间的相关性很若. 结果输出(续1)“Eigen”分析用来分析各因数的不 同水平对响应变量均值的影响,特 征值越大,特征向量重要度越高,第 二和第三个特征值为0,其特征向量 无意义 对每个因数用4种方法 进行了4种测试,“添加剂 含量”的P值为0.025, 表示该因数对响应变量 有显著影响. 特征向量绝对值最大的对应于响 应变量“撕扯阻力”,这表明“撕扯阻 力”在两个因数中任何一个的不同 水平设置下,均值变化最大. 结果输出(续2)交互作用项的P值 为0.302,表明其不 是显著影响因数. 通用多响应变量方差分析(General MANOVA)?Select :Stat-ANOVA- General MANOVA ?采用Data目录下的 Exh-mvar.MTW ?一位工程师想研究确 定胶卷成型工序的优化 条件,他选用三个评价 项目:撕扯阻力、表面 光泽和透明度。试验因 数为成型射出速度和添 加剂含量。 填入参数显示附加矩阵,特征分析 和单响应变量方差分析表点击 结果输出 结果输出(续) 相关与回归分析 相关分析与一元回归1.相关分析及其实现 2. 回归分析基本理论 3. 标准的一元线性回归模型 4. 一元线性回归模型的估计 5. 一元线性回归模型的检验 6. 一元线性回归模型的Minitab实现 7. 一元线性回归模型预测 8.非线性回归简介 小组讨论与练习 本 章 目 标1. 了解并掌握相关分析的基本理论及应用 2.了解并掌握一元回归模型的理论 3.理解并掌握一元回归模型的估计方法 4.掌握一元回归模型的检验方法 5.了解一元回归模型的预测 6.学会用Minitab建立模型并用于预测 7.了解并熟悉非线性回归知识 相关分析及其实现?相关分析和回归分析是研究客观现象之间数量联 系的重要统计方法,两者在有关现实经济和管理 问题的定量分析中,具有广泛的应用价值。变量之间关系 相关关系 因果关系 互为因果关系 共变关系 函数关系 确定性依存关系随机性 依存 关系 相关分析概 念度量工具种类? 相关分析是研究事物的相互关系,测定它们联系的 紧密程度,揭示其变化的具体形式和规律性的统计 方法,是构造各种经济模型、进行结构分析、政策 评价、预测和控制的重要工具。相关表 相关关系度量工具 散点图 相关系数r 种类正相关 负相关 一元相关 多元相关 线性相关 曲线相关yyyy正相关x负相关x曲线相关x不相关x 测定两变量是否线性相关?定义式: ? ?? ?x xy计算公式??y实际计算: r ? n x2 ? ( x)2 n y 2 ? ( y)2 ? ? ? ? |r|=0 不存在线性关系或存在非线性相关;n? xy ? ? x ? ? y相关系数值: |r|=1 完全线性相关0&|r|&1不同程度线性相关(0~0.3 微弱;0.3~0.5 低度; 0.5~0.8 显著;0.8~1 高度)符号:r&0 正相关;r&0 负相关 相关系数的检验:相关系数的检验( t 检验) H0 : ρ=0, H1 : ρ≠0n?2 检验统计量 t ? r 1? r2统计量t 遵从 t(n-2)分布,将r变换成 t后,可以用 t 检 验方法检验 ρ=0是否成立。拒绝域接受域拒绝域 案例实现总评估价值 销售价格?例1.某建筑公司想了解 位于某街区内的住宅地产 的销售价格y与总评估价值 x之间的相关程度到底有多 大? ?从该街区去年售出的住 宅房地产中随机抽选10所 住宅的房地产作样本,分 别的总评估价值和销售价 格资料如下:房地产x(美元)y(美元)1 2 3 4 5 6 7 8 9 1079 760 98 480 110 655 96 859 100 861 105 230 94 798 139 850 170 341 155 13795 000 116 500 156 900 111 000 110 110 100 000 130 000 170 400 211 500 185 000 绘制散点图,观察其相关关系输入数据,点击Graph-Scatterplot弹出如下对话框, 选择变量进入对话框,点击OK绘制散点图 散点图及关系表述从此散点图可以看 出,总评估价值x 与销售价格y之间 存在线性的正相关 关系,相关程度比 较大,随着总评估 价值的增大,销售 价格也呈现增长的 态势,下面我们确 切的计算其两者间 的相关系数。 计算相关系数点击 Basic Statistics― Correlation 计算 相关系数 变量选择及结果选择因变量自变量进入对话框, 点击OK结果如下表:计算得出的相关系数r 及其检验p值 回归分析基本理论? 回归分析(Regression Analysis)的起源及其应用思想。 ? 回归分析是寻求一个随机变量y对另一个或一组(随机 或非随机)变量x1, x2 …,xn的随机相依关系的一种统 计分析方法。 ? 管理决策中常遇到的回归问题,如: ? 广告支出与营业额 ? 售货员工龄与年销售额 ? 汽车使用年数与年平均修理成本 ? 轮胎等级与其装载能力yx 应用案例及变量分类?应用案例: ? 食品连锁店关于餐馆季节性营业额与附近学生总数 的回归分析应用 ?回归模型中的变量: ? 因变量或称响应变量y(Dependent Variable或 Response) ? 自变量或称影响因素x(Independent Varible或 Predictors) 回归分析一元线性回归多元线性回归非线性回归回归分析和相关分析的联系和区别1.相关分析中,x与y对等,回归分析 1.理论和方法具有一致性; 中,x与y要确定自变量和因变量; 2.相关分析中x,y均为随机变量,回 2.无相关就无回归,相关 归分析中,只有y为随机变量; 程度越高,回归越好; 3.相关系数和回归系数方向 3.相关分析测定相关程度和方向,回 归分析用回归模型进行预测和控制。 一致,可以互相推算。 标准的一元线性回归模型?(一)总体回归函数: yt ? ? ? ?xt ? ut t ? 1,2,?, nut是随机误差项,又称随机干扰项,它是一个特 殊的随机变量,反映未列入方程式的其他各种因素 对y的影响。?(二)样本回归函数:et称为残差,在概念上, et与总体误差项ut相互 对应; n是样本的容量。 a、b分别为α、β的样本估计值yt ? a ? bxt ? ett ?1,2,?, n 一元线性回归模型的估计?1. 回归系数的估计 根据实际数据,用最小二乘法,即 ? ) 2 ? min ,分别对a、b求偏导并令其为 使 ?( y i ? y 零,求得两个标准方程:?y ? na ? b?x ?xy ? a?x ? b?x2 e ?t2联立求解得:y ?x ? a? ?b?2. 总体方差的估计n n n?xy ? ?x?y b? n?x 2 ? (?x)2S ?2n?22 2 e ? y 其中: ? t ? t ? a ? y t ? b? xt y t 一元线性回归模型的检验? 回归模型检验的种类 回归模型的检验包括理论意义检验、一级检验和 二级检验。 ? 理论意义检验 ? 统计一级检验(统计学检验) ? 1.拟合程度的评价 ? 2.回归模型的显著性检验 ? 统计二级检验(经济计量型检验) 1.一元线性回归模型拟合优度的评价?判定系数(R2)是对回归模型拟合优度的评价。? ? y ) 2 ? ?( y ? y ? )2 ?( y ? y ) 2 ? ?( y总偏差 = 回归偏差 + 剩余偏差 y( y0 ? y )?) ( y0 ? yy? ? a ? bx y? ? y) (yx回归偏差 R ? 总偏差2 2. 一元线性回归模型的显著性检验?回归系数b的检验: ? 1.提出假设。 H0:β=0;H1:β≠0 ? 2.确定显著性水平α。 ? 3.计算回归系数的 t 值。?4.确定临界值。 双侧检验查t分布表所确定的临界值是(-tα/2) 和(tα/2);单侧检验所确定的临界值是(tα)。 ?5.做出判断。b?? tb ? Sb 系数检验的方法选择:当样本量n&30,用t 检验 当样本量n&30,t分布 接近于标准正态分布 Z,所以可以用正态分 布代替。 ?回归模型整体的F检验?1.提出假设: H0:R2=0;H1:R2≠0 ?2.计算检验统计量回归偏差 自由度 F? ? 剩余偏差 自由度2 ? ? ? y ? y ? 2 ? ? ? y ? y ?1n?2?3.比较做出判断 一元线性回归模型的Minitab实现例2.某家电集团1989年至1998年10年的广告费 支出与销售量的资料如下表所示:年份 广告支出 x(万元) 销售量 y(万元)89 10 20 90 20 30 91 40 35 92 50 40 93 60 50 94 80 70 95 70 65 96 97 98 140 95 110 110 80 70试根据此资料确定销售量y与广告费支出x的是 否存在线性关系,并进行模型分析。 1.根据一般原理, 我们首先需要绘制 散点图,观察其是 否存在线性关系, 如果观察结果存在 线性关系,我们才 能对其进行进一步 的分析。 输入数据,点击 Graph-Scatterplot 绘制散点图:2.弹出如下对话框:选择销售量资料C2进入因变 量Y,广告费支出C1进入自变量X,点击OK将绘制 Y与X的散点图。点击OK 散点图结果及意义:3.从此散点图 可以看出:销 售收入C2与 广告费支出 C1间存在着 明显的线性相 关关系,我们 可以进一步建 立回归模型对 其进行分析。 4.点击Stat-Regression-Regression,弹出:因变量y 自变量x点击OK 结果输出: 结果输出(续):预测方程 系数的t检验 拟合优度R2方程的F检验 一元线性回归模型预测?回归预测分为点预测和区间预测两部分 ?1.点预测的基本公式:? f ? a ? bx f y回归预测是一种有条件的预测,在进行回归预 测时,必须先给出xf的具体数值。 ?2.预测误差及发生预测误差的原因。2 ? ? ? ( x x ) 1 f 2 2? ? S ef ? ? 1 ? ? ? n ? (x ? x)2 ? t ? ? 回归预测的置信区间? 3.区间预测 yf的 ?1 ? ? ? 的置信区间为: y ? f ? t? 2 (n ? 2) ? S ef2 ? ? ( x x ) ? 1 f 2 2? ? Sef ? ? 1 ? ? 2 ? n ?( x ? x) ? t ? ?y? ?? ? x ?f ? ? y 1 2 fx 非线性回归简介?在许多场合,非线性回归函数比线性回归函数更能 够正确地反映客观现象之间的相互关系。 ?非线性回归分析必须着重解决以下两个问题: ?第一,如何确定非线性函数的具体形式。与线性回 归分析的场合不同,非线性回归函数有多种多样的 具体形式,需要根据所要研究的问题的性质并结合 实际的样本观测值做出恰当的选择。 ?第二,如何估计函数中的参数。非线性回归分析最 常用的方法仍然是最小二乘估计法,但需要根据函 数的不同类型,作适当的处理。 常见的可线性化的曲线回归方程:英文名称 Linear Logarithm Inverse Quadratic Cubic Power Compound S Logistic Growth Exponent 中文名称 线性函数 对数函数 双曲线函数 二次曲线 三次曲线 幂函数 复合函数 S形函数 逻辑函数 u是预先给定的常数 增长曲线 指数函数yy y yy方程形式y y? ?? ?? bb b b bbb00 00?? b x??? bbb1b1b1ln /x x1x x? ?xb b22b11x200x2?b3x3yy??? ?xexp1 u0 1 ? b(01bx 10?b1/x)byy??expb0exp(b0(? bb1x1)x) 常用的非线性函数的线性变换法? 下面是我们常用的4种线性变换法,分别举例 进行说明,其他的非线性方程也可以以此类 推,得到相应的线性形式。 ? 1.倒数变换。 例如:双曲线模型 ,将其代入得 令 ? 2.半对数变换。 例如:对数函数 令 ,代入得y ? b ? b /x 0 1* x ? 1 /x* y ? b ? b x 0 1y ? b0 ? b1lnxx* ? ln xy ? b0 ? b1 x* 常用的非线性函数的线性变换法(续)? 3.双对数变换。 例如:幂函数 两边取对数的变换得: 令 代入得: ? 4.多项式变换。 2 2 y ? b0 ? b1 x 1 ? b 2 x 2 ? b3 x 1 ? b4 x 2 ? b5 x 1 x 2 如二元二次多项式 2 2 * * * * x1 ? x1 , x * ? x , x ? x , x ? x , x 2 2 3 1 4 2 5 ? x1 x 2 , 令 * * * * * y ? b0 ? b1 x1 ? b2 x 2 ? b3 x 3 ? b4 x 4 ? b5 x 5 代入得:y ? b xb1xb2?xbk012klny?lnb0?b1lnx1???bklnxky?lnyy*;?b0b*??lnbx b* 0?;x?1??blnx*x1,?,xk?lnxk011kk 实际应用时要注意的问题:?1.对于一些比较复杂的非线性函数,常常需要综 合利用多种变换方法。 ?2.为了能够根据样本观测值,对通过变换得到的 非线性回归方程式进行估计,该方程中的所有变 量都不允许包含未知的参数。 ?3.严格地说,上述的各种线性变换方法只是适用 于变量为非线性的函数。 ?4.经过变换后可能出现了多元线性的形式,我们 在下一章将详细介绍其模型的建立方法。 非线性案例分析:? 例3.某超级连锁市场进行了一项实验,研究价格 p(元)对一种家用白糖品牌每周需求y(公斤)的影响. 以往这种产品的需求记录大致相等的8家超市参加 了此项试验.有8种价格被随机指定给销售这种产 品的商店并采用相同的广告措施,记录每家商店 下一周内售出白糖的公斤数。 ? 数据如下表所示:价格 3 3.1 3.2 3.3 3.4 3.5 3.6 p 需求 试根据数据分析价格与需求量之间的关系。 884 807 760 701 y 3.7 688 数据及散点图绘制:图示为销售量与价格的散点图,从图中大致看出是呈现一种 负相关的相关关系,近似直线,也象数学上用到的双曲线, 但从经济角度出发,一般商品的销售量同销售价格呈现的是 双曲线型的相关关系,所以我们需要用双曲线的形式拟合。 数据变换计算:点击Calc-Calculator弹出如下对话框, 在Expression中输入变量变换公式, Store result in variable中输入新变量名称点击OK 变换过的数据及回归命令:新产生的数列x=1/p,用新 数列x与y作回归。点击StatRegression-Regression 选择变量及结果输出:选择变换后的数据 进入回归对话框: 变量模型如下:点击OK 结果输出(续): 结果分析与模型建立:?由于在此例中我们分析销售量与价格成双曲线形的 相关关系,即:y ? b0 ? b1 / p?在模型的建立过程中我们曾用Calculator命令对变 量p进行了变换 x ? 1 / p ,得到方程:y ? b0 ? b1x?将变换后的与原方程对比,方程系数没有作变换, 所以我们可以直接写出销售量y与价格x的双曲线方 程,即为:y ? ?1180 ? 6808 / x 回归分析的一般程序定性和定量分析相 结合正确选择变量 搜集(试验)统计数据 估计回归方程 不通过 检验回归方程 不通过 通过 检验回归系数 通过 估计影响 预测变化验证理论 小组讨论与练习1.思考你自己的工作评价与哪些因素具 有相关关系,分别呈现何种相关关系, 你是否可以量化这种关系? 2.思考回归分析方法能在你的部门起什么作用? 3.结合本岗位的案例运用一元回归分析方法进行 经济数据分析与预测。 练习题:※炼钢厂出钢时所用的盛钢水的钢包,在使用 过程中,由于钢液及炉渣对包衬耐火材料的侵 蚀,使其容积不断增大,我们希望找出使用次 数与增大的容积之间的关系,试验数据如下:使用次数x2 3 4 5 6 7 8 9增大容积y6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99使用次数x10 11 12 13 14 15 16增大容积y10.49 10.59 10.60 10.80 10.60 10.90 10.76 多元回归分析多元线性回归分析基本理论 标准的多元线性回归模型 多元线性回归模型的估计 多元线性回归模型的检验 多元线性回归模型预测 多元线性回归模型的Minitab实现 多元非线性回归 小组讨论与练习 本章目标1.了解并掌握多元回归模型的理论2.理解并掌握多元回归模型的估计方法 3.掌握多元回归模型的检验方法 4.了解多元回归模型的预测 5.学会用Minitab建立模型并用于预测 6.了解并熟悉多元非线性回归的基本形式及实现 多元线性回归分析的基本理论?多元线性回归是简单线性回归的推广,指的是 多个因变量对多个自变量的回归(Multivariate Regression),最常用的是一个因变量对多个 自变量的回归。 常见的管理决策问题:? 销售量y与广告投入x1,销售人员数量x2,特定 产品的价格x3,可支配的个人收入x4,各种投 资x5,销售费用x6。 ? 食品店顾客数y与食品价格x1,座位数x2 因变量y自变量x1自变量x2……自变量xk 标准的多元线性回归模型?多元线性回归模型 ?多元线性回归方程E( yt ) ? ?1 ? ?2 x2t ? ?? ?k xktyt ? ?1 ? ?2 x2t ??? ?k xkt ? ut?1, ?2 ,?, ?k是未知参数样本数据: x1 x2 … xk y . . . . . . . . . . . . . . .b1,b2,…,bk是 计值计算估计多元回归方程? t ? b1 ? b2 x2t ? ? ? bk xkt y b1 , b2 ,?, bk是样本统计量β1,β2,…,βk的估 多元线性回归模型的性质 ? ? b1 ? b2 x1 ? b3 x2 y截距 例 二元线性回归模型: b2:假定x2固定时x1每变动1个单位引起的y的增量。 b3:假定x1固定时x2每变动1个单位引起的y的增量。 ? ? b1 ? b2 x1 ? b3 x2 是x1和x2共同变动引起的y的平均 y 变动,反映一组自变量与因变量的平均变动关系。 ? 是给定x1、x2计算得到的估计值,是y的实际 y 值的数学期望。 偏回归系数 (实际值) y j? b1 ? b2 x1 ? b3 x2 ? ? j ? ?? j ?y一组自变量对y的线性 影响而形成的系统部 分,反映x与y变动关系 的本质特征。y随机干扰: 各种偶然因素观察误 差和其他被忽视因素 的影响。b1截距x1 x2 多元线性回归模型的估计?(一)回归系数的估计?1 ? B ? ? X ' X ? X 'Y?(二)总体方差的估计 ?S2e ? ?2 tn?k?(三)最小二乘估计量的性质 标准的多元线性回归模型中,高斯.马尔可夫 定理同样成立。 多元线性回归模型的检验?一.拟合程度的评价 ?调整可决系数R 2 ? 1?2 ( y ? y ) /(n ? 1) ? t 2 2 e ? t /(n ? k )(n ? 1) ? 1 ? (1 ? R ) (n ? k )?式中,n是样本容量;k是模型中回归系数的个数。 ?调整可决系数 R 2的特点。 多元线性回归模型的显著性检验?回归系数 b 的检验 ?1.提出假设。 H0: βj =0;H1: βj≠0 ?2.确定显著水平α。 ?3.计算回归系数的t 值。t ?? ?jbj?式中, S b 是的标准差的估计值。 按下式计算:jSbjj ? 1,2, ? , kSbj ?S 2 ? ? jj? jj 是(X’X)-1的第 j 个对角线元素, S2 是 ?式中, 随机误差项方差的估计值。 多元线性回归模型的显著性检验(续一)?4.确定临界值。 双侧检验查t分布表所确定的临界值是(-tα/2) 和(tα/2);单侧检验所确定的临界值是(tα)。 ?5.做出判断。双侧检验图示:拒绝域接受域拒绝域 多元线性回归模型的显著性检验(续二)? 回归方程的显著性检验 ? 具体的方法步骤 ? 回归模型方差分析表离差名称 回归平方和 残差平方和 总离差平方和 平 方 和SSR ? ? (yt ? y ) 2自由度 k-1 n-k均方差 SSR/(k-1) SSE/(n-k)?t ? y) 2 SSE ? ? (ySST ? ? et2? F统计量SSR /( k - 1) F? SSE /( n - k ) 多元线性回归模型预测?基本公式:? f ? b1 ? b2 x 2 f ? ? ? bk x kf y式中,xjf(j=2,3,……k)是给定的xj在预测期的具? f 是xj y 体数值;b j 是已估计出的样本回归系数;给定时y的预测值。 多元线性回归模型的Minitab实现? 很多人在研究多元回归问题时可能感到比较复杂, 下面我们用统计软件帮助大家实现多元线性回归模 型的建立、估计、检验以及预测问题。 ? 多元回归模型在建立过程中可采用两种不同的方 法,分别为:直接回归法 实现方法 逐步线性回归 向后淘汰变量法 逐步回归法 向前加入变量法 ? 例1:在研究某超市顾客人数y与该超市促销费用x1 、 超市面积x2 、超市位置x3之间关系时,选取变量如下: ? y――某超市某一周六顾客人数(千人) ? x1――该超市上周促销所花的费用(万元) ? x2――该超市的面积(百平方米) ? x3――超市所处位置(0表示市区、1表示郊区) ? 按照y变量排序后的原始数据是:y x1 x2 x32 1 2 1 3 1. 5 1 1 5 2 1. 3 1 7 2 1. 3 1 8 2 1. 5 0 10 2. 3 1. 5 1 17 2. 5 2 1 24 2. 5 2. 5 1 25 2.4 2 0 30 2. 6 2 0 31 2. 5 4 1 35 2. 5 3 0 36 4 4 1 42 4. 1 3. 5 0 44 4 3. 5 0 45 4. 3 3. 5 0 48 4. 5 5 1 50 4. 4 5 0 52 4 7 0 55 4. 1 8 0多元回归案例分析: 定性分析过程:? 数据分析之前,我们要先考虑各个自变量与因 变量之间是否存在相关关系。 ? 分别绘制顾客人数y与促销费用x1 、超市面积x2 的散点图,直观上测定其是否存在线性关系, 散点图绘制过程上一章已介绍,在此不再赘述。 ? 通过散点图可以看出,因变量y与自变量x1 、 x2 之间确实存在较明显的线性相关关系,而x3超 市位置是虚拟二元变量,我们无法从散点图中 看出其中的线性关系,但经验所知其一定影响 着因变量y,所以我们同时将其纳入分析模型。 ? 模型建立过程如下: 直接回归法:输入数据见左图 点击Stat-Regression-Regression 选择变量进入命令框:弹出如下对话框,分别选择因变量到Response,选 择影响变量到Predictors框中,以此分析促销费用x1 、 超市面积x2 、超市位置x3对顾客人数y的影响。 输出结果:拟合的多元方程 回归系数的t检验 调整后的可决系数 R 2 可决系数 R 2 回归方程的F检验 输出结果(续): 若我们上面的预测方程不显著,但确实知道其中 几个变量存在着一定的线性关系,我们也可以运 用逐步回归的方法对变量进行分析处理 。 点击弹出变量选择框如下:逐步回归实现:点击选择回归方法 点击OK回归方程常数项 方程中X1的回归系数 及其t检验值、p值 可决系数 R 2 及 R 2 调整后的可决系数 多元非线性回归y?多元非线性回归是一元非线性回归的多元 扩展,其理论基础建立在多元回归与非线 性回归的基础上。 ?在实际工作中,多元非线性回归的应用非 常广泛,大多数生产函数和需求函数都需 要用到多元非线性拟合。常用的有C―D生 产函数、产品的需求弹性分析。 ?下面我们用需求弹性分析实例介绍此类模 型的估计方法及结果处理解释。x 案例分析:?例2:厂商想研究其产品销售量与居民月平均收 入、商品价格之间的变化关系,现调查某城市 有关此商品需求的数据如下:年 次 销售量y(百件) 居民人均收入x2(百 元) 单价x3(10元) 1 2 3 4 5 6 7 8 9 101 15 13 14 20 18 24 19 23 10 0 5 8 9 9 10 10 12 13 15 7 2 2 5 4 3 4 3 5 4 3试根据数据建立销售量 y与居民人均收入 x2及商 品单价 x3之间的关系。 数据变换分析:?1.根据我们对经济规律的分析可知:产品销售量与 居民人均收入、商品单价呈现幂函数形式的关系,即: b by t ? ax 2 t2 x 3 t3?2.利用双对数变换法,同时加入随机误差项,可得 以下线性回归函数: Lyt ? ?1 ? ? 2 Lx2t ? ? 3 Lx3t ? ut式中: ? 1 ? ln a ; ? 2 ? b2; ? 3 ? b3; Ly t ? ln y t; Lx 2 t ? ln x 2 t; Lx 3t ? ln x3t?3.这样我们就得到一般的多元线性回归模型,可以 利用软件对其进行参数估计、检验,然后通过两个方 程之间的关系,写出原方程的形式。 数据的初步变换:点击Calc――Calculator弹出如下对话框, 在Expression中输入变量变换公式, Store result in variable中输入新变量名称点击OK 原数据与新产生数据列:原始数据: 原始数据与三次变量变换后的数据: 对变换后的数据进行建模:选择变换后的数据 进入回归对话框:点击OK 计算结果:变换过的数据 产生的回归方程根据两个方程间的变换关 系,对产生的回归方程进 行反对数变换,得变量间 的回归方程如下: .16 ? 0 .404 ? t ? 1 .928 x 1 y 2 t x 3t 计算结果(续): 结果解释及预测分析:? 由上式可知:居民收入的需求弹性约为1.16, 而价格的需求弹性约为-0.4。也就是说,在其 他情况不变的条件下,居民人均收入每增加 1%会使此商品的需求增加1.16%,价格每提高 1%会使此商品的需求减少0.4%。 ? 若此时我们要预测居民人均收入为2200元,商 品单价为50元时该商品的需求量y,只需将 x2=22,x3=5代入方程即得:? ? 1.928( 22) y1.16(5)?0.404? 36.30(百件) 小组讨论与练习1.思考多元回归分析方法能在你的部 门起什么作用? 2.结合本岗位的案例运用多元回归分 析方法进行经济数据分析与预测。 3.思考企业的产品与那些因素有关, 分别呈现一种怎样的相关关系? 回归分析的Minitab实现直接回归分析(Regression)?Select: Stat & Regression & Regression?采用Data目录下 的Exh_regr.MTW 填入参数响应变量预测因子 输出结果之一 输出结果之二Regression Analysis: Score2 versus Score1The regression equation is Score2 = 1.12 + 0.218 Score1 Predictor Constant Score1 Coef 1.67 SE Coef 0.40 T 10.23 12.51 P 0.000 0.000一元线性回归方程 回归系数显著性检验S = 0.127419R-Sq = 95.7%R-Sq(adj) = 95.1%Analysis of Variance Source Regression Residual Error Total DF 1 7 8 SS 2.6 2.6556 MS 2.2 F 156.56回归方程显著性检验P 0.000Unusual Observations Obs 9 Score1 7.50 Score2 2.5000 Fit 2.7502 SE Fit 0.0519 Residual -0.2502 St Resid -2.15RR denotes an observation with a large standardized residual. 结论:? 由回归系数显著性检验的t值的大小及P值 0.000&0.05,知回归系数是显著的,变量 Score1对Score2确实存在显著影响;另由 回归方程显著}

我要回帖

更多关于 minitab17 key 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信