首页 > 代码库 > 机器学习笔记(八)非线性变换

机器学习笔记(八)非线性变换

一、非线性问题

对于线性不可分的数据资料,用线性模型分类,Ein会很大,相应的Ein=Eout的情况下,Eout也会很大,导致模型表现不好,此时应用非线性模型进行分类,例如:

技术分享技术分享

分类器模型是一个圆形,假设模型可表示为技术分享

转化表示形式技术分享

将平方项和常数项转为一次的Z项,则将非线性的特征空间转化为线性的特征空间技术分享

可以用线性模型进行分类

二、非线性转换

技术分享

技术分享

对于把Q次方的多项式进行全部的一次转换,转换的项数一共为技术分享,转换过后的一次模型的dvc等于总的项数,

总的项数为技术分享,其中d为特征向量的长度

选择合适的转换项数,项数越多代表模型越复杂,但不要为了减少dvc,人为的在脑袋里加工转换特征,例如技术分享

在上述各种转化中,有dvc为2的甚至为1的,但都是进过自己脑海中转化过的特征,不可取

对于不同的Q次方的情况,有如下结果:

技术分享

技术分享,高次对低次具有包含的关系

技术分享

Ein随着Q的次方增大会减少技术分享,但过高的Q次方会带来Eout的增大,不具有泛化能力,做模型建立是首先考虑线性的模型,如果它做的好的话那就很好(Ein和Eout都很小),若不好(Ein始终很大),在选择高次方的模型技术分享

 

机器学习笔记(八)非线性变换