首页 > 代码库 > 2017/7/19 朱兴全教授学术讲座观点与总结第一讲

2017/7/19 朱兴全教授学术讲座观点与总结第一讲

前言    WHY?AI是从策略出发简单可描述(可以用清晰的规则和算法取实现)的任务,让机器去执行。我们希望复杂难以描述的任务(如无人驾驶,语音识别等情况复杂,需要推理和抽象化的任务)也可以由机器去实现ML/DL是从数据驱动出发。数据挖掘、模式识别、机器学习和神经网络都是用来解决这些复杂的情况下的任务(几者之间互相联系,相关关联,甚至区别不大)。

 


 

一、模式识别

 技术分享

解决问题:如何让机器做与人感知相关的任务?认知模型、区分模式,从而形成正确的判决(聚类与系统推荐)

①类人的观察②感知环境中感兴趣的部分(特征抽取与整合)③作出与人推理相近的判决。

举例:如何区分两种鱼?

典型的决策机制

  • 选择可分类的有用特征(鱼脸?特征抽取困难;鱼的味道?长度?宽?形状等等)
  • 可测量的稳定特征(鱼的亮度,受光照的影响;长度是一个稳定的可测量特征)
  • 步骤:获得图像、分离鱼、进行测量、作出判断。

 

特征选择

我们知道两种鱼的长度一般不一样,可以作为区分的特征,需要选择长度的阈值,同时,我们也可以看到一般鱼的长度是不一样,但是并不是严格不同,即长度不能完全区分两种鱼,此时我们考虑尝试其他的特征。机器学习中①并不存在单一特征可以区分类别,采用多个特征进行组合分析(整个情况就更加复杂)②假定各个特征之间独立,尽可能选择特征之间互相独立的特征(避免相关性,但是往往实际中,特征之间是相关的,如身高和体重),尽可能考虑多的特征。

特征维数变多出现的问题:一是模型更加复杂(容易过拟合)。二是学习的效率下降。

 

期望提取的特征:能够区分类别,选择好的特征能够正确区分类别(差的特征可能无法区别类别)

特征提取的方法有两种:一种是Feature extraction 即特征映射?通过函数映射到新的特征空间,新的特征空间采用矢量表示特征,可以体现或者容易比较两者(两者只类别还是特征之间呢?)之间的相关性。另一种是特征选择,在若干特征中选择一部分。

技术分享

 tradeoff:依据判别结果所付出的代价对模型进行调整(例如:salmon的价格高于sea bass时,我们把分类曲线往左移,那么对于salmon的判断基本不会出错,不会发生顾客用高价钱买到的却是sea bass,不会有上当受骗的嫌疑。有可能使用低价钱买到salmon(salmon被判定为sea bass时),这个时候顾客就会很高兴,下次会继续过来这里买鱼,即我们希望salmon的正确率一定要保证)

技术分享

 

模型好坏的度量:

技术分享

(ROC与AUC?)


 

二、机器学习

 机器可以替代人的技能

 技术分享

机器学习是使用大量数据去学习模型。机器考虑特征与结果的相关性比人要好,人可以考虑影响结果的2到3个特征,机器可以考虑很多个影响因素。

为什么用机器学习?从特定的样例中学习数据的一般模型,数据丰富且便宜,知识少而昂贵。建立一个模型去很好并且有效的近似数据

机器学习模型:

1、监督学习(决策树、前向神经网络和反向传播)  有监督模型的优点是提供标签,准确率高。

2、无监督学习(聚类、关联分析)  无监督学习不需要标签,所以数据数量可以很大很大,优点是适用大数据。

3、Reinforcement learning   http://www.cse.unsw.edu.au/~cs9417ml/RL1/applet.html

 

机器学习的输出:

技术分享

 


 

三、神经网络

神经元

技术分享

 

 神经网络

技术分享

神经网路主要是学习权重,怎么样得到好的权重去完成任务(怎么修改权重?谁先改?)。生物依据,只是概念上一样,功能上并不同。同一层之间不相连接,彼此之间改变互不影响,模型简单。隐藏层(hidden):我们不能确定它应该输出是怎么样,不能预测它真实的输出。输入和输出是可以得到预测的输入与输出,并且可以与真实的输出进行对比。

技术分享

Why Deep Learning?

Deep Learning可以通过input对每一层学习得到的进行解释,隐藏层可以解释(如某一层表示边缘,即每一层都有一定的归结,DL往往每一层可以表示出来,区分DL与传统NN的区别)

 


 

区别与关系

技术分享

 原来知道哪些特征好,就用那些特征,现在不知道,让它自己学习哪些特征好(特征   →   学习新的特征)。

 

技术分享

 

2017/7/19 朱兴全教授学术讲座观点与总结第一讲