One-Hot编码,又称为一位有效编码,是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值,然后,每个整数值被表示为二进制向量,将整数索引标记为1,其余都标为0。
OneHotEncoder()常用参数解释
drop=None
:用于从每个特征中舍去特定的分类,默认为None
,且不能与categories
、n_values
同用。dtype=np.float64
:表示编码数值格式,默认是浮点型。sparse=True:
表示编码的格式,默认为True
,即为稀疏的格式,指定False
则就不用toarray()
。handle_unknown=’error’
:其值可以指定为“error”
或者“ignore”
,即如果碰到未知的类别,是返回一个错误还是忽略它。
OneHotEncoder()用法