One-Hot编码,又称为一位有效编码,是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值,然后,每个整数值被表示为二进制向量,将整数索引标记为1,其余都标为0。
OneHotEncoder()常用参数解释
drop=None:用于从每个特征中舍去特定的分类,默认为None,且不能与categories、n_values同用。dtype=np.float64:表示编码数值格式,默认是浮点型。sparse=True:表示编码的格式,默认为True,即为稀疏的格式,指定False则就不用toarray()。handle_unknown=’error’:其值可以指定为“error”或者“ignore”,即如果碰到未知的类别,是返回一个错误还是忽略它。
OneHotEncoder()用法




