首页 > 代码库 > 机器学习入门

机器学习入门

什么是机器学习?

  利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策

学习模式?

  离线学习

  在线学习

机器学习的典型应用?

  关联规则:“啤酒+尿布”

  聚类:全球通(针对经常全球出行的人)、动感地带(针对在校学生用流量比较多)、神州行(针对工人、白领经常打长途电话)

  朴素贝叶斯:垃圾邮件

  决策树:信用卡欺诈

  ctr预估:互联网广告

  协同过滤:推荐系统

  自然语音处理:情感分析与实体识别

  深度学习:图像识别

更多应用:

  语音识别

  个性化医疗

  情感分析

  人脸识别

  自动驾驶

  智慧机器人

  私人虚拟助理

  手势控制

  视频内容自动识别

  机器实时翻译

数据特点

  交易数据(使用关系型数据)VS行为数据(NOSQL数据的发展)

  少量数据VS海量数据

  采量分析VS全量分析

数据分析(报告过去的事情)、分析方法(用户驱动、交互式分析)、参与者(数据分析师:数据+算法)

机器学习(预测未来的事情)、分析方法(数据驱动、自动进行知识发现)、参与者(算法)

算法分类(1):

  有监督学习:分类算法、回归算法

  无监督学习:聚类

  半监督学习:小孩走路

算法分类(2):

  分类与回归

  聚类

  标注

算法分类(3):

  生成模型

  判别模式

技术分享

 技术分享

 

 

 

 

 

  

机器学习入门