机器学习常见算法个人总结（面试用） - 程序员工具箱

2000万优秀解决方案库，覆盖所有编程及软件开发类，极速查询

今日已更新 1114 篇代码解决方案

首页 > 代码库 > 机器学习常见算法个人总结（面试用）

机器学习常见算法个人总结（面试用）

2024-11-22 03:59:39 202人阅读

By Kubi Code

朴素贝叶斯

参考[1]

事件A和B同时发生的概率为在A发生的情况下发生B或者在B发生的情况下发生A

对于给出的待分类项，求解在此项出现的条件下各个目标类别出现的概率，哪个最大，就认为此待分类项属于哪个类别

工作原理

假设现在有样本
再假设现在有分类目标
那么
而
因为
而具体的
好的，就是这么工作的^_^

工作流程

准备阶段
确定特征属性，并对每个特征属性进行适当划分，然后由人工对一部分待分类项进行分类，形成训练样本。
训练阶段
计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计
应用阶段
使用分类器进行分类，输入是分类器和待分类样本，输出是样本属于的分类类别

属性特征

特征为离散值时直接统计即可（表示统计概率）
特征为连续值的时候假定特征符合高斯分布:

Laplace校准(拉普拉斯校验)

当某个类别下某个特征划分没有出现时，会有

遇到特征之间不独立问题

参考改进的贝叶斯网络，使用DAG来进行概率图的描述

优缺点

朴素贝叶斯的优点：

对小规模的数据表现很好，适合多分类任务，适合增量式训练。
缺点：
对输入数据的表达形式很敏感（离散、连续，值极大极小之类的）。

机器学习常见算法个人总结（面试用）

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们