首页 > 代码库 > one_hot(独热码)官方示例的个人理解
one_hot(独热码)官方示例的个人理解
官方给的例子
from sklearn import preprocessingenc = preprocessing.OneHotEncoder()enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])enc.transform([[0, 1, 3]]).toarray()>>> array([[ 1., 0., 0., 1., 0., 0., 0., 0., 1.]])
这里给出了四组原始的特征表达方式
[0, 0, 3],
[1, 1, 0],
[0, 2, 1],
[1, 0, 2]
每个数组的每个位置对应不同类型的特征,显然给出的原始数据中有三大类特征(因为每个数组的长度都为3),例如[0,0,3]的一号特征的值是0,二号特征的值是0,三号的特征的值是3.
编码的过程:
第一步:
把三大类特征分别编码:1号特征(观察只有两种值),所以编码为[10, 01] // 由大到小排列 [1::10, 0:: 01]
2号特征[100,010,001]
3号特征[1000,0100,0010,0001]
第二步:
根据编码好的特征,将给出的[0, 1, 3]转换成one_hot编码 [0,1, 0,1,0, 0,0,0,1] //将特征分别用上面编好码的特征表示
恩,就是这样
one_hot(独热码)官方示例的个人理解
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。