兰州网站制作公司排名网站通知系统
web/
2025/9/27 4:29:13/
文章来源:
兰州网站制作公司排名,网站通知系统,国外设计网站怎么进入,阿里云建网站教程对于缺失的数据#xff1a;
我们对连续数值的特征做标准化#xff08;standardization#xff09;#xff1a;设该特征在整个数据集上的均值为 μ #xff0c;标准差为 σ 。那么#xff0c;我们可以将该特征的每个值先减去 μ 再除以 σ 得到标准化后的每个特征值。对于…对于缺失的数据
我们对连续数值的特征做标准化standardization设该特征在整个数据集上的均值为 μ 标准差为 σ 。那么我们可以将该特征的每个值先减去 μ 再除以 σ 得到标准化后的每个特征值。对于缺失的特征值我们将其替换成该特征的均值。
numeric_features all_features.dtypes[all_features.dtypes ! object].index
all_features[numeric_features] all_features[numeric_features].apply(lambda x: (x - x.mean()) / (x.std()))
# 标准化后每个特征的均值变为0所以可以直接用0来替换缺失值
all_features[numeric_features] all_features[numeric_features].fillna(0)一个标签可能多种参数的情况
接下来将离散数值转成指示特征。举个例子假设特征MSZoning里面有两个不同的离散值RL和RM那么这一步转换将去掉MSZoning特征并新加两个特征MSZoning_RL和MSZoning_RM其值为0或1。如果一个样本原来在MSZoning里的值为RL那么有MSZoning_RL1且MSZoning_RM0。
# dummy_naTrue将缺失值也当作合法的特征值并为其创建指示特征
all_features pd.get_dummies(all_features, dummy_naTrue)
all_features.shape
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/81256.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!