首页 > 代码库 > 机器学习实战笔记(Python实现)-07-分类性能度量指标

机器学习实战笔记(Python实现)-07-分类性能度量指标

1、混淆矩阵

下图是一个二类问题的混淆矩阵,其中的输出采用了不同的类别标签

技术分享

常用的衡量分类性能的指标有:

  • 正确率(Precision),它等于 TP/(TP+FP) ,给出的是预测为正例的样本中的真正正例的比例。
  • 召回率(Recall),他等于 TP/(TP+FN),给出的是预测为正例的真实正例占所有真实正例的比例。

2、ROC曲线 

技术分享

 

图中的横轴是伪正例的比例(假阳率=FP/(FP+TN)),而纵轴是真正例的比例(真阳率=TP/(TP+FN))。ROC曲线给出的是当阈值变化时假阳率和真阳率的变化情况。左下角的点所对应的是将所有样例判为反例的情况,而右上角的点对应的则是将所有样例判为正例的情况。虚线给出的是随机猜测的结果曲线。

对不同的ROC曲线进行比较的一个指标是曲线下的面积(Area Unser the Curve)。AUC给出的是分类器的平均性能值,当然它并不能完全代替对整条曲线的观察。一个完美分类器的AUC为1.0,而随机猜测的AUC则为0.5。 

 

 

THE END.

 

机器学习实战笔记(Python实现)-07-分类性能度量指标