机器学习：监督学习和无监督学习

首页 > 代码库 > 机器学习：监督学习和无监督学习

机器学习：监督学习和无监督学习

2024-10-09 13:41:39 219人阅读

**************************************

注：本系列博客是博主学习Stanford大学 Andrew Ng 教授的《机器学习》课程笔记。博主深感学过课程后，不进行总结非常easy遗忘。依据课程加上自己对不明确问题的补充遂有此系列博客。

本系列博客包含线性回归、逻辑回归、神经网络、机器学习的应用和系统设计、支持向量机、聚类、将维、异常检測、推荐系统及大规模机器学习等内容。

**************************************

机器学习定义

机器学习是人工智能的一个分支，目标是赋予机器一种新的能力。（专门研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，又一次组织已有的知识结构使之不断改善自身的性能。）机器学习的应用非常广泛。比如大规模的数据挖掘（网页PV数据。医疗记录等），无人驾驶飞机、汽车，手写手别，大多数的自然语言处理任务。计算机视觉，推荐系统等。

机器学习有非常多定义。广为人知的有例如以下两条：

ArthurSamuel (1959): Machine Learning: Field of study that gives computers theability to learn without being explicitly programmed.

TomMitchell (1998) : Well-posed Learning Problem: A computer program is said tolearn from experience E with respect to some task T and some performance measureP, if its performance on T, as measured by P, improves with experience E.

样例：对于一个垃圾邮件识别的问题，将邮件分类为垃圾邮件或非垃圾邮件是任务T，查看哪些邮件被标记为垃圾邮件哪些被标记为非垃圾邮件是经验E，正确识别的垃圾邮件或非垃圾邮件的数量或比率是评測指标P。

监督学习

对具有概念标记（分类）的训练样本进行学习。以尽可能对训练样本集外的数据进行标记（分类）预測。这里，全部的标记（分类）是已知的。因此，训练样本的岐义性低。

监督学习是训练神经网络和决策树的最常见技术。这两种技术（神经网络和决策树）高度依赖于事先确定的分类系统给出的信息。

房屋价格预測-回归(Regression): 预測连续的输出值（价格)

技术分享

乳腺癌（良性，恶性）预測问题-分类(Classification): 预測离散的输出值(0, 1)

技术分享

即使有无限多种特征也能够处理（支持向量机）。

技术分享

分类、回归都是监督学习的内容。

无监督学习

对没有概念标记（分类）的训练样本进行学习。以发现训练样本集中的结构性知识。

这里，全部的标记（分类）是未知的。因此，训练样本的岐义性高。

常见的无监督学习算法有聚类。

技术分享

上面介绍了监督学习。

回忆当时的数据集，如图表所看到的。这个数据集中每条数据都已经标明是阴性或阳性，即是良性或恶性肿瘤。所以，对于监督学习里的每条数据，我们已经清楚地知道。训练集相应的正确答案，是良性或恶性。

在无监督学习中。我们已知的数据。看上去有点不一样。不同于监督学习的数据的样子，即无监督学习中没有不论什么的标签或者是有同样的标签。针对数据集。无监督学习就能推断出数据有两个不同的聚集簇。无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。它能被用在非常多地方。

无监督学习有着大量的应用。它用于组织大型计算机集群。

另外一种应用就是社交网络的分析。还有市场切割。很多公司有大型的数据库，存储消费者信息。

所以，你能检索这些顾客数据集，自己主动地发现市场分类，并自己主动地把顾客划分到不同的细分市场中，你才干自己主动并更有效地销售或不同的细分市场一起进行销售。

最后，无监督学习也可用于天文数据分析，这些聚类算法给出了令人吃惊、有趣、实用的理论，解释了星系是怎样诞生的。这些都是聚类的样例。聚类仅仅是无监督学习中的一种。

注：本文是学习Andrew Ng教授的《机器视觉》课程的学习笔记。

转载请注明出处：http://blog.csdn.net/lsh_2013/article/details/47342641

机器学习：监督学习和无监督学习

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 机器学习：监督学习和无监督学习

机器学习：监督学习和无监督学习

看完仍有疑问？有类似问题直接问程序猿