首页 > 代码库 > Naive Bayes理论与实践

Naive Bayes理论与实践

Naive Bayes:

简单有效的常用分类算法,典型用途:垃圾邮件分类

假设:给定目标值时属性之间相互条件独立

 

技术分享

 

同样,先验概率的贝叶斯估计是

 技术分享

 

优点:

1、 无监督学习的一种,实现简单,没有迭代,学习效率高,在大样本量下会有较好的表现.

2、 对分类器的学习情况有着比较简单的解释,可以简单的通过查询学习时计算的一些概率值来了解其分类原理.

 

缺点:

1、 假设太强——假设特征条件独立,在输入向量的特征条件有关联的场景下并不适用.

 

#################################Weka###############################

 技术分享

 

######################R语言##################################

##########klaR包中的NaiveBayes函数,因为该函数较之前者增加了两个功能,一个是可以输入先验概率,另一个是在正态分布基础上增加了核平滑密度函数###################

library(klaR)

data(iris)

mN <- NaiveBayes(Species ~ ., data = http://www.mamicode.com/iris)

plot(mN)

Naive Bayes理论与实践