??介绍评价二分类模型的一些標准各评价指标的得分之和
TP—将正类预测为正类数
FN—将正类预测为负类数
FP—将负类预测为正类数
TN—将负类预测为负类数
??通俗地说就是所有样本被正确预测的占比。
??通俗地说就是预测为正类的样本中实际为正类的占比。定义:
??通俗地说就是实际为正类的样本中正确预测为正类的占比。定义:
相当于精确率和召回率的调和平均数定义:
TPR—真阳性,同召回率
FPR—假阳性负样本中错误预测为正的占比
二分类模型返回一个概率值,通过调整阈值即大于该阈值为正类,反之负类可以得到哆个(FPR,TPR)点,描点画图得到的曲线即为ROC曲线如下图所示:
??AUC为ROC曲线下的面积,越接近1说明分类效果越好
??直观的解释AUC,可以这样理解:
从正负样本各随机抽取一个样本Sample1、Sample2分类器返回概率值P1、P2,AUC=P(P1>P2)其反应的是分类器对样本的排序能力,好的分类器应该返回正样本以更高概率值
??和ROC曲线类似,通过调整阈值可以得到多个(FPR,TPR)点描点画图时把阈值作为横轴,FPR描点形成一条曲线TPR描点形成一条曲线。KS值就為Max(TPR-FPR)
KS值越大,表示模型能够将正、负样本区分开的程度越大但是分隔并不一定表示正确。通常来讲KS>0.2即表示模型有较好的预测准确性。
?????????????????????? 于杭州
?????????????????????? 改于南京市建邺区新城科技园
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。