首页 > 代码库 > 第六篇:数据预处理(三) - 数据标准化
第六篇:数据预处理(三) - 数据标准化
前言
在进行缺失,异常处理之后,往往要对数据进行变换。
变换有多种情况,主要是以下两种:
- 规范化:对数据进行一定比例的缩放,让它实质落入某个具体区间。
- 离散化:将连续型数据转化为离散化。
规范化
数据规范化非常容易实现,调用scale函数即可:
它的具体变换步骤是特征值减去所有特征的均值再除以标准差。
结果区间为-1到1。如果要0-1的,则将结果平方。
离散化
离散化可自行写代码来实现:
小结
较之前面几个预处理阶段,本文所讲解的标准化阶段还是比较容易掌握的。
第六篇:数据预处理(三) - 数据标准化
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。