测量中什么时候用协方差分析什么时候用方差这两者有什么区别及其应用情况

点击联系发帖人 时间：2018-06-13 14:59

重复测量协方差分析

登录网易通行证
使用网易通行证(含网易邮箱)帐号登录
提交您的投诉或建议
视频画面花屏
视/音频不同步
播放不流畅
分享给朋友:
扫描分享给微信好友和朋友圈
扫一扫分享给微信好友和朋友圈
通过代码可以让这个视频在其它地方上播放！
复制FLASH代码
复制HTML代码
复制页面地址
使用公开课APP下载视频
扫描二维码手机继续看
扫描二维码在手机上继续观看，
还可分享给您的好友。
没有公开课客户端？
登录后才能查看我的笔记
暂时没有笔记!
确定删除笔记？
即将播放下一集，请您保存当前的笔记哦！
对字幕纠错要登录哦！
内容不能少于3个字
均值也就是算术平均值，即数据集中所有数据之和除以数据个数。中位数是数据集排序后，处在中间的数。众数是数据集中出现次数最多的数。
极差是数据集中最大数减去最小数的统计量。中程数是最大数和最小数的均值。
象形统计图是用象形图像表示统计数据的图像，这一节讲象形统计图及例子。
条形图又称柱形图，是一种重要的分类汇总工具，这一节讲条形图及例子。
线形图，是将数据点描出来，然后连线形成的图像。用来表示趋势，这一节讲线形图及例子。
饼图，看起来像一块切开的饼，用于表示占比。这一节讲饼图及例子。
当线形图画成什么样子时会产生误导了，这一讲将讲到这一问题。
茎叶图是将数组中的数按位数进行比较，分别做出茎和叶，以此统计数据。这一讲讲茎叶图及例子。
盒须图是用四个四分位点分开数据集的图，能有效给出数据散布状况。这一讲讲盒须图及例子。
这一讲讲盒须图的另外一个例子，强化盒须图这一重要统计图表的概念。
集中趋势在统计学中是指一组数据向某一中心值靠拢的程度，它反映了一组数据中心点的位置所在。
研究中实际观测或调查的一部分个体称为样本，研究对象的全部称为总体。这一讲区分了这两个概念，并给出了样本均值和总体均值的求法。
方差用来表述数据和均值之间的偏离程度，总体方差的计算公式是σ2=Σ(Xi-μ)2/N，其中求和的i从1到N。
方差用来表述数据和均值之间的偏离程度，样本方差不同于总体方差，计算公式为S2=Σ(Xi-X̄)2/(n-1)，其中求和的i从1到n，这里方差用的是n-1而不是n。
标准差σ是表述数据和均值之间的偏离程度的另一个重要标志。它等于方差的平方根。
方差的公式除了σ2=Σ(Xi-μ)2/N以外，还有σ2=Σ(Xi)2/N-μ2，这一节讲授这些公式之间的推导。
随机变量是表示随机现象各种结果的变量。萨尔曼认为随机变量并不是传统意义上的变量，而是一种由随机过程映射到数值的函数。
这一节讲到连续随机变量，以及概率密度函数的概念。求概率也就是对概率密度函数进行积分。
二项分布即重复n次的伯努利试验，在每次试验中只有两种可能的结果。这一节讨论五次抛硬币中，表示正面出现次数的随机变量X，当X=n时的概率。
这一节接着前一节讲二项分布，首先作出其概率分布图。然后说明，二项分布的极限情况是正态分布。
这一节接着前一节讲二项分布，以投篮为例，讲了投中和不中概率不相等时的二项分布情况。
这一节接着前一节讲二项分布，继续以投篮为例，讲授如何运用Excel计算并绘图。
这一节讲随机变量X的期望值，强调期望值的本质就是总体无穷时的总体均值。
二项分布的期望值E(X)=np，其中n为随机试验次数，p为某一次的成功概率。这一节证明了这个公式。
泊松过程是一种累计随机事件发生次数的最基本的独立增量过程。这一节关键在于论证，它其实就是二项分布的极限情况。
泊松过程是一种累计随机事件发生次数的最基本的独立增量过程。这一节最终通过求极限，推导出了泊松过程的公式。并进行了应用举例。
大数定律的概念其实很简单，也就是样本数量足够多的时候，样本均值趋近于总体均值，或者说随机变量的期望值。
正态分布又称为高斯分布，其概率密度函数是著名的钟形曲线，它是概率论中最重要的一种分布，也是自然界最常见的一种分布。这一节通过Excel，讲解了正态分布同二项分布之间的关系。
正态分布是概率论中最重要的一种分布，也是自然界最常见的一种分布。这一节仔细讲解了正态分布的概率密度函数和累积分布函数，并给出了相应的直观理解和记忆方式。
正态分布是概率论中最重要的一种分布，也是自然界最常见的一种分布。这一节给出了几个例子，讲解这些例子是否能用正态分布来描述。
z分数在正态分布中，也就是，某值x离均值有多少个标准差远，即(x-μ)/σ，其中μ为期望值，σ为标准差。
这一节讲到正态分布概率的经验法则，即68-95-99.7法则。也就是说正态分布均值左右一个标准差内的概率是68%，两个标准差内概率为95%，三个标准差内概率为99.7%。
这一节通过标准正态分布（也就是期望值μ为0，标准差σ为1的正态分布），继续讲解68-95-99.7法则在正态分布中的应用。
这样一节是对经验法则和z分数的进一步练习，z分数并不一定只适用于正态分布，任何分布中都可以计算z分数。
中心极限定理：设从均值为μ、方差为σ2的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
样本均值的抽样分布是所有的样本均值形成的分布，即μ的概率分布。这一节通过一个模拟程序进行了图形化解释。
样本均值的抽样分布是所有的样本均值形成的分布，根据中心极限定理，样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。即随着样本容量n变大，抽样分布标准差越小，越收拢。
均值标准误差也就是样本均值抽样分布的标准差，它等于σ/根号n，其中σ是原总体分布的标准差，n为样本容量。这一节详细介绍了这个公式。
男性户外活动一天平均喝2L水，标准差0.7L，如果为50个男性的户外活动准备110L水，不够喝的概率是多少？这一节主要讲解这个问题，进一步熟悉抽样分布的实际应用。
置信区间是指由样本统计量所构造的总体参数的估计区间。这一节通过一个例题引出了置信区间这一概念。
伯努利分布是一个离散概率分布。伯努利试验失败，随机变量为0，成功则为1。这一节给出了一个例子，其成功机率为60%，然后计算了相应的统计量。
努利分布是一个离散概率分布。伯努利试验失败，随机变量为0，成功则为1。其成功机率为p，失败机率为1-p，均值为p，方差为p(1-p)。这一节推导了这些公式。
误差范围表达了统计结果中的随机波动的大小。这一节通过一个伯努利分布的例子来讲解这一问题，伯努利试验成功概率p的置信区间如果是33%到53%（43%±10%），那么误差范围也就是10%。
误差范围表达了统计结果中的随机波动的大小。这一节通过一个伯努利分布的例子来讲解这一问题，伯努利试验成功概率p的置信区间如果是33%到53%（43%±10%），那么误差范围也就是10%。这一节继续上一节讲完这个问题。
置信区间，比如99%置信区间，也就是&相信&99%几率，某统计量所落在的区间。这里之所以用&置信&donfident，是因为一般总体标准差是由样本标准差估计，并不是准确值造成的。这一节通过一个例题，更明确地讲解了置信区间的概念。
当样本容量很小时，样本均值抽样分布不应该采用正态分布，而应采用t分布。t分布用于对呈正态分布的总体的均值进行估计，在样本容量小时非常有用。
假设检验是统计在人文科学、自然科学中应用最广泛的方法之一。通常设定两个假设：零假设和备择假设，然后通过拒绝零假设，来接受备择假设，从而完成检验。p值中p表示概率，指的是零假设若成立，得到测量样本情况的概率。这一节通过例题讲解了假设检验和p值。
这一节继续上一节的内容，讲解假设检验的内容。单侧检验也就是只看抽样分布一侧的情况，这一节主要讲这种情况。这一节的例子中，备择假设同上一节中双侧检验的情况不一样。
当样本容量很小时，样本均值抽样分布不应该采用正态分布，而应采用t分布。z统计量服从正态分布，而t统计量服从t分布，这一节给出了样本容量30的界限，经验上告诉你如何在z统计量和t统计量之间进行取舍。
若零假设事实上成立，但统计检验的结果不支持零假设（拒绝零假设），这种错误称为第一型错误。若零假设事实上不成立，但统计检验的结果支持零假设（接受零假设），这种错误称为第二型错误。
小样本值的假设检验使用t分布，而不使用正态分布。这一节以一个例子讲解了小样本情况假设检验的步骤。
这一节接着上一讲的例子，讲解了小样本值时，使用t统计量如何确定总体均值的置信区间。
这一节仍然是假设检验的例子。这次的总体是伯努利分布，伯努利分布的均值μ也就是占比p。这一节讲解了如何对此进行假设检验。
相互独立的随机变量X、Y，令随机变量Z为两者之差，即Z=X-Y，那么Z的方差就等于X和Y的方差之和，即Var(Z)=Var(X)+Var(Y)。这一节重点讲解了这一性质。
一个随机变量X和一个随机变量Y，分别抽取样本计算均值得到X̄和Ȳ，令Z=X̄-Ȳ，于是可以得到统计量Z的抽样分布，当样本量足够大时，根据中心极限定理，Z的抽样分布也近似是正态分布。
这一节紧接着上一节，一个随机变量X和一个随机变量Y，其均值分别为μX和μY，那么μX-μY也可以求出一个置信区间。
由于上一节讲得比较含糊，这一节是对上一节末尾含糊出的澄清。
对于某减肥新方法的实验组，分别求其样本均值和方差，另外对普通减肥方法的对照组求样本均值和方差，如何通过假设检验知道这种新方法是否有效呢？这一节讲解这一问题。
选举时，一部分男性中有p1人投给某候选人，其它人没投给此候选人，女性中有p2人投给此候选人，其它人没投给此候选人。那么如何使用抽样的方法得知男性和女性投给此候选人的占比p1和p2之间有没有差值呢？这就是这一节所处理的实际问题。这一节列出了式子。
选举时，一部分男性中有p1人投给某候选人，其它人没投给此候选人，女性中有p2人投给此候选人，其它人没投给此候选人。那么如何使用抽样的方法得知男性和女性投给此候选人的占比p1和p2之间有没有差值呢？这就是这一节所处理的实际问题。这一节紧接着上一节解出了置信区间。
选举时，一部分男性中有p1人投给某候选人，其它人没投给此候选人，女性中有p2人投给此候选人，其它人没投给此候选人。那么如何使用抽样的方法得知男性和女性投给此候选人的占比p1和p2之间有没有差值呢？之前两节计算了置信区间，这一节将直接从假设检验角度审视这一问题。
线性回归是利用最小平方误差对自变量和因变量之间关系进行建模的一种回归分析。这一节介绍了平方误差的概念，并解释了直线拟合中最基本的原理。
线性回归是利用最小平方误差对自变量和因变量之间关系进行建模的一种回归分析。这一节开始推导线性回归的公式，最佳拟合曲线为y=mx+b，其中m=(x均值·y均值-xy均值)/[(x均值)2-x2均值]，b=ȳ-mx̄。由于推导过程较长，所以分成了四个部分，这是第一部分，进行最初步的代数运算。
线性回归是利用最小平方误差对自变量和因变量之间关系进行建模的一种回归分析。这一节开始推导线性回归的公式，最佳拟合曲线为y=mx+b，其中m=(x均值·y均值-xy均值)/[(x均值)2-x2均值]，b=ȳ-mx̄。由于推导过程较长，所以分成了四个部分，这是第二部分，进行第二步代数运算，并将式子同三维空间的二次曲面联系起来。
线性回归是利用最小平方误差对自变量和因变量之间关系进行建模的一种回归分析。这一节开始推导线性回归的公式，最佳拟合曲线为y=mx+b，其中m=(x均值·y均值-xy均值)/[(x均值)2-x2均值]，b=ȳ-mx̄。由于推导过程较长，所以分成了四个部分，这是第三部分，利用微积分中的基本偏导知识进行推导，并列出方程。
线性回归是利用最小平方误差对自变量和因变量之间关系进行建模的一种回归分析。这一节开始推导线性回归的公式，最佳拟合曲线为y=mx+b，其中m=(x均值·y均值-xy均值)/[(x均值)2-x2均值]，b=ȳ-mx̄。由于推导过程较长，所以分成了四个部分，这是第四部分，解出方程，并给出最后结果。
(1,2)、(2,1)、(4,3)三点如何进行线性回归，这一节利用公式求出了与这三点拟合最好的直线。
决定系数R2，是指y的总波动情况中，可以以直线关系说明的部分所占的比率。R2越大，表示直线拟合得越好。这一节详细讲解了这一概念，并推导出R2的计算公式。
这一节计算了(-2,-3)、(-1,-1)、(1,2)、(4,3)四点的回归方程。是对线性回归计算的进一步强化。
这一节计算了(-2,-3)、(-1,-1)、(1,2)、(4,3)四点的回归方程的R2值，结果是0.88，表示曲线拟合程度很好。
[第71课]协方差和回归线
协方差的定义是Cov(X,Y)=E[(X-E[X])·(Y-E[Y])]，这一节通过对该定义公式的推导，最后将协方差同线性回归良好地结合了起来。推导出，回归线的斜率m=Cov(X,Y)/Var(X)。
χ2分布是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布常用于假设检验和置信区间的计算。若来自正态总体的k个随机变量、……、相互独立，且数学期望为0、方差为1（即服从标准正态分布），则随机变量X=∑Zi2，被称为服从自由度为k的χ2分布，记作X~χ2(k)。
这一节以一个简单的餐厅一周每日顾客量预计和观测值的例子，使用χ2检验进行了假设检验。χ2检验由皮尔逊重新发现，运用很广泛。
列联表是以列表方式表示两个或多个变量或属性共同出现的频率。这一节使用一个列联表的例子，再一次练习了χ2检验。
方差分析（ANOVA），是用于两个及两个以上样本均数差别的显著性检验。这一节从计算总平方和SST，总平方和可以理解为计算方差时，不除以n的那部分。
方差分析中，由于各种因素的影响，研究所得的数据呈现波动状，这种波动可以分为组间波动和组内波动两种情况。这一节讲解了两者的差异和联系。
F检验，是指一种统计学意义上服从F-分布的零假设的检验。这一节继续前两节的内容，对特定例子进行了F检验。
相关性是指两个或多个事物同时发生，具有关联，而因果性是指因为A所以B，两者具有明显的差异。这一节通过实际例子讲解这一问题。
演绎推理是从一些数据或事实出发，演绎得到其它正确的事实。这一节讲解了它和归纳推理的区别，并用一个问题解释了这种区别。
演绎推理是从一些数据或事实出发，演绎得到其它正确的事实。这一解通过一个解方程的例子，进一步解释了演绎推理的概念。
演绎推理是从一些数据或事实出发，演绎得到其它正确的事实。这一节通过一个分配率证明公式的例子，进一步解释了演绎推理的概念。
归纳推理是寻找规律或趋势，然后推广。这一节通过一个数组的例子，解释了归纳推理的概念。
归纳推理是寻找规律或趋势，然后推广。这一节通过另一个数组的例子，进一步解释了归纳推理的概念。
归纳推理是寻找规律或趋势，然后推广。这一节通过一个反例，进一步解释了归纳推理同演绎推理的区别。
归纳推理是寻找规律或趋势，然后推广。这一节通过一个图形序列的例子，讲解了如何在归纳推理中寻找规律。
学校：可汗学院
讲师：Salman Khan
授课语言：英文
类型：数学国际名校公开课可汗学院
课程简介：这门课是统计学入门课程，将涵盖统计学所有的主要知识，包括：随机变量、均值方差标准差、统计图表、概率密度、二项分布、泊松分布、正态分布、大数定律、中心极限定理、样本和抽样分布、参数估计、置信区间、伯努利分布、假设检验和p值、方差分析、回归分析等内容。视频由可汗学院免费提供，详见：（All Khan Academy materials are available for free at ）
扫描左侧二维码下载客户端MINITAB统计程序中方差分析指令的巧用Ⅱ.协方差分析中的应用
月lJ舀协方差分析法,是方差分析法与回归分析法相结合而产生的一种资料分析法。其主要功用是用处理前的试验记录矫正处理后的试验记录,以避免由于处理前基数不一对处理后差异显著性所带来的影响,从而提高试验结果的精度。国内外,在热带作物灼研究中协方差分析法均得到了非常广泛且有效的应用〔,,“夕。19别年,Mtlrray在橡胶树合纽研究上应用协方差分析使处理的比较精度大为提高;1966年,Narayanan用协方差分析法于橡胶树吧料试验的结果分析上,发现对产量、树围、种子收集的试验比较清度的提高都十分明显。此外,对可可、剑麻、油徐、椰子、果树、茶树等多年生植物及畜枚试验研究协方差分听法也有极广泛的应用。协方差分析法约计算冗繁而一般的应用统计程序又没有专设这种分析指令。以下笔者根据统计量之间的内部联系,将MIN工TAB〔“〕统计程序应用于资料的协方差分祈上。这种方法使用方便,计算简捷,所得结果与常规计算方法的完全一致。一、乘积和的计算技...&
(本文共20页)
权威出处：
为方便，约定如下：门）本文中的“平方和”皆指两非贸整数的平方和．有时把“可表为两个非负整数的平方和”简述为“可表”．（2）本文所述“表法唯一”是指：若。一／Z－／，n一短十疖，则必l］－＿，N一Jb或11一样．—－）．．（3）本文所述“本原可表”是指：。可表，即n—aZ十月，a＞O，b＞O，而且还成立（cb）一1．引理介。“任何4k、I型素数皆可表且表法唯一．由引理1立得推论任何。Ik＋I型素数必本原可表．引理2‘’，’‘若。的奇素数因子户与。告本原可表，则十也本原可表．—一””一户一——””’引理3卜‘若户是4k＋3型素数，则户的任何倍数都不能本原可表．gi＄4Brah。guPla恒等式除了a—b或c—d或aha—0外，右边的两个平方和表法是不同的。证直接检验知，BffhguPla恒等式是成立的．今给出不同表法的条件：若它们是同一种表法，则必由（l）推出两式都推出aha二由（2）推出两式都推出（aZ从而aZ一bZa定理亚若n是...&
(本文共3页)
权威出处：
扩展阅读：
CNKI手机学问
有学问，才够权威！
xuewen.cnki.net
出版：《中国学术期刊（光盘版）》电子杂志社有限公司
地址：北京清华大学 84-48信箱大众知识服务
京ICP证040431号&
服务咨询：400-810--9993
订购咨询：400-819-9993
传真：010-方差、协方差及关联性
时间： 11:32:47
&&&& 阅读：1670
&&&& 评论：
&&&& 收藏：0
标签：最近在学习R语言，其中涉及涉及到关联分析时碰到的一些函数，其中有三个彼此关联的函数：var：计算某个变量的方差cov：计算两个变量的协方差cor：计算两个变量的相关性这些概念的理论学校里肯定都学过，不过现在确实是一点也想不起来了，而且更重要的是当时也不知道为什么要有这些统计概念。然后现在只得在度娘上搜了一下，共找到期望、方差、标准差、协方差和相关性。在概率论和统计学中，一个离散性随机变量的期望值（或数学期望、或均值，亦简称期望，物理学中称为期待值）是试验中每次可能结果的概率乘以其结果的总和。换句话说，期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。在统计学中，当估算一个变量的期望值时，一个经常用到的方法是重复测量此变量的值，然后用所得数据的平均值来作为此变量的期望值的估计，平均数一般用μ表示。在概率分布中，期望值和方差或标准差是一种分布的重要特征。在经典力学中，物体重心的算法与期望值的算法十分近似。方差(Variance)又称为变异量或变异数，是应用数学中的一个概念。在概率论和统计学中，一个随机变量的方差描述的是它的离散程度，也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差，恰巧也是它的二阶累积量。方差的算术平方根称为该随机变量的标准差。方差的公式简单的可描述为变量的所有观测值与其期望之差的平方的总和再除以样本数量：650) this.width=650;" src="http://upload.wikimedia.org/math/5/2/7/527ef4eaf439.png" alt="\operatorname{Var}(X) = \operatorname{E}\left[(X - \mu)^2 \right]" />标准差（英语：Standard Deviation），数学符号σ，在概率统计中最常使用作为统计分布程度（statistical dispersion）上的测量。标准差定义为方差的算术平方根，反映组内个体间的离散程度；标准差与期望值之比为标准离差率。标准差的观念是由卡尔·皮尔逊（Karl Pearson）引入到统计中。标准差的应用简单来说，标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差，代表大部分的数值和其平均值之间差异较大；一个较小的标准差，代表这些数值较接近平均值。例如，两组数的集合{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7，但第二个集合具有较小的标准差。标准差可以当作不确定性的一种测量。例如在物理科学中，做重复性测量时，测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值，测量值的标准差占有决定性重要角色：如果测量平均值与预测值相差太远（同时与标准差数值做比较），则认为测量值与预测值互相矛盾。这很容易理解，因为如果测量值都落在一定数值范围之外，可以合理推论预测值是否正确。标准差应用于投资上，可作为量度回报稳定性的指标。标准差数值越大，代表回报远离过去平均数值，回报较不稳定故风险越高。相反，标准差数值越小，代表回报较为稳定，风险亦较小。正态分布的规则在实际应用上，常考虑一组数据具有近似于正态分布的概率分布。若其假设正确，则约68%数值分布在距离平均值有1个标准差之内的范围，约95%数值分布在距离平均值有2个标准差之内的范围，以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”。650) this.width=650;" src="http://upload.wikimedia.org/wikipedia/commons/thumb/8/8c/Standard_deviation_diagram.svg/350px-Standard_deviation_diagram.svg.png" alt="350px-Standard_deviation_diagram.svg.png" />标准差与平均值之间的关系一组数据的平均值及标准差常常同时作为参考的依据。从某种意义上说，如果用平均值来考量数值的中心的话，则标准差也就是对统计的分散度的一个“自然”的测度。协方差（Covariance）在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。期望值分别为650) this.width=650;" src="http://upload.wikimedia.org/math/6/0/3/adab2c7ca8f71dcc3f7f80a7.png" alt="E(X)=\mu" />与650) this.width=650;" src="http://upload.wikimedia.org/math/b/f/6/bf680d71c50d67e8a2950c.png" alt="E(Y)=\nu" />的两个实数随机变量X 与Y 之间的协方差定义为：650) this.width=650;" src="http://upload.wikimedia.org/math/5/f/b/5fbe23eb934ddb586d5a.png" alt="\operatorname{cov}(X, Y) = \operatorname{E}((X - \mu) (Y - \nu))" />其中E是期望值。观上来看，协方差表示的是两个变量的总体的误差，这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致，也就是说如果其中一个大于自身的期望值，另外一个也大于自身的期望值，那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反，即其中一个大于自身的期望值，另外一个却小于自身的期望值，那么两个变量之间的协方差就是负值。如果X 与Y 是统计独立的，那么二者之间的协方差就是0。在概率论和统计学中，相关（Correlation，或称相关系数或关联系数），显示两个随机变量之间线性关系的强度和方向。在统计学中，相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下，有许多根据数据特点而定义的用来衡量数据相关的系数。统计学上的相关相关系数的计算过程可表示为：将每个变量都转化为标准单位，乘积的平均数即为相关系数。两个变量的关系可以直观地用散点图表示，当其紧密地群聚于一条直线的周围时，变量间存在强相关。一个散点图可以用五个统计量来概括。所有x值得平均数，所有x值的SD，所有y值得平均数，所有y值的SD，相关系数r.将第一个变量记为x ,第二个变量记为y ,相关系数为r，则可以通过以下公式：r = [（以标准单位表示的x）X（以标准单位表示的y）]的平均数本文出自 “” 博客，请务必保留此出处标签：原文：http://yubowang.blog.51cto.com/2101
教程昨日排行
&&国之画&&&& &&&&&&
&& &&&&&&&&&&&&&&
鲁ICP备号-4
打开技术之扣，分享程序人生！方差标准差协方差有什么区别_百度知道
方差标准差协方差有什么区别
那协方差什么意思呢
方差(Variance)是实际值与期望值之差的平方平均数, 而标准差(Standard deviation)是方差的算术平方根. 协方差用的比较少，主要是度量两个变量的相关性（在股票方面有应用）。
采纳率：40%
均值描述的是样本集合的中间点，它告诉我们的信息是很有限的，而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例，[0，8，12，20]和[8,9，11，12]，两个集合的均值都是10，但显然两个集合差别是很大的，计算两者的标准差，前者是8.3，后者是1.8，显然后者较为集中，故其标准差小一些，标准差描述的就是这种“散布度”。之所以除以n-1而不是除以n，是因为这样能使我们以较小的样本集更好的逼近总体的标准差，即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方.上面几个统计量看似已经描述的差不多了，但我们应该注意到，标准差和方差一般是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，面对这样的数据集，我们当然可以按照每一维独立的计算其方差，但是通常我们还想了解更多.协方差就是这样一种用来度量两个随机变量关系的统计量.协方差的结果有什么意义呢？如果结果为正值，则说明两者是正相关的(从协方差可以引出“相关系数”的定义).而协方差也只能处理二维问题，那维数多了自然就需要计算多个协方差,使用对称矩阵,且对角线是各个维度上的方差。协方差矩阵计算的是不同维度之间的协方差，而不是不同样本之间的
方差(Variance)是实际值与期望值之差平方的平均值,而标准差(Standard deviation)是方差平方根.
为您推荐：
其他类似问题
您可能关注的内容
协方差的相关知识
换一换
回答问题，赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。}

我爱游戏网