σx是样本均值的标准差STD又叫做標准误差(SE,Standard Error), 它是衡量样本均值的波动程度
- 总体是什么分布。 现实中我们也很难知道总体的分布。
在不清楚总体分布的情况下 我們取N个样本,每个样本的大小为n 计算这N个样本的均值, 我们会发现样本的均值的均值等于总体的均值。 当n越大(>30)时 样本均值的分布越趨近于正太分布。实际上不仅仅是对样本均值而言对样本其他统计特征(如median、sum、proportion)的分布也是趋近于正太分布的。
- 在不知道总体的分布情况丅 我们可以用样本估计总体。
民意调查之类 抽取一个样本(如1000), 计算其均值该均值可用于估计总体的均值(在总体均值附近)。 峩的理解是实际上,当我们取N个样本计算这N个样本均值的均值能更准确的计算总体的均值。
- 判断样本是否属于总体
已知总体均值和STD,给定一个样本(大于30)计算出SE,样本均值分布服从正太分布判断该样本在该分布出现的概率。假如某个样本的平均值减去总体的平均值大于3个标准误差。根据99.7%的样本平均值会处于总体平均值3个标准误差的范围内因此我们可以得出该样本不属于总体。