首页 > 代码库 > 机器学习实战笔记-1基础
机器学习实战笔记-1基础
机器学习基础
什么是机器学习
机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义。简单的说机器学习就是把无序数据转换成有用的信息。
关键术语
特征(属性):对一类物体我们关心的性质,比如鸟的体重、翼展、脚蹼、后背颜色等
训练集:已经有分类的大量数据,是用来训练机器学习算法的数据样本集合。
训练样本:实例数据
目标变量:机器学习的预测结果
训练数据:用来训练算法
测试数据:用来评估算法
监督学习:
无监督学习:
机器学习主要任务
机器学习的主要任务时分类和回归。
分类和回归都属于监督学习。分类和回归的区别是回归用于预测数值型数据。
在无监督学习中:
聚类:将数据集合分层有类似的对象组成的多个类的过程
密度分析:寻找描述数据统计值的过程
如果选择合适算法:
选择的依据:
1使用算法的目的,2分析或者收集的数据是什么
选择的过程:
1根据目的首先划分是监督学习,还是无监督学习。如果要预测目标变量的值,则可以选择监督学习算法,否则选择无监督学习算法
2如果是监督学习:进一步确定目标变量的类型,如果是离散型,选择分类算法;否则选择回归算法
3如果是非监督学习:进一步分析是否仅仅需要将数据划分为离散的组,如果是则选择聚类算法,否则选择密度估计算法。
开发的步骤
1 收集数据:爬虫、传感器等
2 准备输入数据:格式处理等
3 分析输入数据:确保数据集中无垃圾数据。
4 训练算法:(无监督学习不需要训练算法)
5 测试数据:
6 使用算法
机器学习实战笔记-1基础
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。