首页 > 代码库 > MLiA.第1章.机器学习基础

MLiA.第1章.机器学习基础

1.机器学习的真实含义:利用计算机来彰显数据背后的真实含义。或者说把无序的数据转换成有用的信息。

2.数值常用的几种表示形式:十进制、二值型、枚举类型。

3.如何选择合适的算法?

首先考虑使用机器学习算法的目的。考虑想不想预测目标变量的值?

如果要预测目标变量的值,则可以选择监督学习算法,否则可以选择无监督学习算法。若选择监督学习算法,则确定目标变量类型,若果是离散型,如是/否、1/2/3等,则可以选择分类算法;如果目标变量时连续型的数值,如0.0-100.0、-999到999等,则可以选择使用回归算法。

如果不想预测目标变量的值,则可以选用无监督学习算法。进一步分析是否需要将数据划分为离散的组。如果这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。

4.学习机器学习算法,必须了解数据实例,每个数据实例由多个特征值组成。分类是基本的机器学习任务。

 

MLiA.第1章.机器学习基础