1.IV值(信息价值):分箱后变量的预测能力
IV值计算过程:
1.计算每个分箱的WOE(证据权重)
2.WOE和分箱的样本占比计算IV
2.卡方值(Chi-Square):衡量分箱的“统计显著性”
卡方分箱(风控建模) 范围 取值范围:[0, +∞) 合并相邻分箱时,卡方值越小说明分布越相似,需迭代合并至阈值以下。
逻辑回归:保留高卡方,强业务特征
黑盒XGBoost,特征重要性大于卡方值
卡方检验判断 分箱后的目标变量
卡方值越大,分箱后变量和目标变量关联性越强
1.IV值(信息价值):分箱后变量的预测能力
IV值计算过程:
1.计算每个分箱的WOE(证据权重)
2.WOE和分箱的样本占比计算IV
2.卡方值(Chi-Square):衡量分箱的“统计显著性”
卡方分箱(风控建模) 范围 取值范围:[0, +∞) 合并相邻分箱时,卡方值越小说明分布越相似,需迭代合并至阈值以下。
逻辑回归:保留高卡方,强业务特征
黑盒XGBoost,特征重要性大于卡方值
卡方检验判断 分箱后的目标变量
卡方值越大,分箱后变量和目标变量关联性越强
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/942360.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!