首页 > 代码库 > 计算auc的代码-python

计算auc的代码-python

自己写的计算auc的代码,用scikit-learn的auc计算函数sklearn.metrics.auc(xyreorder=False)做了一些测试,结果是一样的,如有错误,欢迎指正。

思路:1.首先对预测值进行排序,排序的方式用了python自带的函数sorted,详见注释。

   2.对所有样本按照预测值从小到大标记rank,rank其实就是index+1,index是排序后的sorted_pred数组中的索引

   3.将所有正样本的rank相加,遇到预测值相等的情况,不管样本的正负性,对rank要取平均值再相加

        4.将rank相加的和减去正样本排在正样本之后的情况,再除以总的组合数,得到auc

 1 # -*- coding: utf-8 -*- 2 """ 3 Created on Wed May  3 10:48:28 2017 4  5 @author: Vincent 6 """ 7 import numpy as np 8 from sklearn import metrics 9 y = np.array(   [1,     0,  0,   1,   1,  1,  0,  1,  1,  1])10 pred = np.array([0.9, 0.9,0.8, 0.8, 0.7,0.7,0.7,0.6,0.5,0.4])11 fpr, tpr, thresholds = metrics.roc_curve(y, pred, pos_label=1)12 print(metrics.auc(fpr, tpr))13 def getAuc(labels, pred) :14     ‘‘‘将pred数组的索引值按照pred[i]的大小正序排序,返回的sorted_pred是一个新的数组,15        sorted_pred[0]就是pred[i]中值最小的i的值,对于这个例子,sorted_pred[0]=816     ‘‘‘17     sorted_pred = sorted(range(len(pred)), key = lambda i : pred[i])18     pos = 0.0 #正样本个数19     neg = 0.0 #负样本个数20     auc = 0.0 21     last_pre = pred[sorted_pred[0]]22     count = 0.023     pre_sum = 0.0  #当前位置之前的预测值相等的rank之和,rank是从1开始的,所以在下面的代码中就是i+124     pos_count = 0.0  #记录预测值相等的样本中标签是正的样本的个数25     for i in range(len(sorted_pred)) :26         if labels[sorted_pred[i]] > 0:27             pos += 1        28         else:29             neg += 1       30         if last_pre != pred[sorted_pred[i]]: #当前的预测概率值与前一个值不相同31             #对于预测值相等的样本rank需要取平均值,并且对rank求和32             auc += pos_count * pre_sum / count  33             count = 1          34             pre_sum = i + 1     #更新为当前的rank    35             last_pre = pred[sorted_pred[i]] 36             if labels[sorted_pred[i]] > 0:37                 pos_count = 1   #如果当前样本是正样本 ,则置为138             else:39                 pos_count = 0   #反之置为040         else:41             pre_sum += i + 1    #记录rank的和42             count += 1          #记录rank和对应的样本数,pre_sum / count就是平均值了43             if labels[sorted_pred[i]] > 0:#如果是正样本44                 pos_count += 1  #正样本数加145     auc += pos_count * pre_sum / count #加上最后一个预测值相同的样本组46     auc -= pos *(pos + 1) / 2 #减去正样本在正样本之前的情况47     auc = auc / (pos * neg)  #除以总的组合数48     return auc49 print(getAuc(y, pred))

 

计算auc的代码-python