也许你会使用数百种统计假设检驗但一般在机器学习项目中你只需要使用一小部分。
本文是一个机器学习项目中最流行的统计假设检验的速查表包含使用Python接口的示例。
每个统计检验都以相同的方式介绍包括:
- 用于使用检验的Python接口。
注:当涉及诸如预期的数据分布或样本大小之类的假设时如果违反叻假设,给定检验的结果可能会小幅地降级而不是在违反假设时立即无法使用。
通常数据样本需要具有领域代表性,并且要大到足以將其分布暴露给分析
在某些情况下,可以校正数据以满足假设例如通过去除离群值将近似正态分布校正为正态,或者在样本具有不同方差时使用统计检验中的自由度校正命名为二个实例。
最后对于给定的关注点可能存在多个检验(如,正态性检验)我们无法通过統计数据获得清晰的问题答案。我们一般得到的是概率答案因此,我们可以通过以不同的方式思考同一个问题来得到不同的答案也因此,我们可能需要对数据进行多种不同的检验
本教程分为四个部分; 他们是: