【风控】Boost和Bagging

一、Bagging 与 Boosting 概念对比

在风控建模中,单一模型(如逻辑回归、决策树)有时预测能力有限或易过拟合,集成方法通过组合多个弱模型提升稳定性和预测性能。

特性Bagging(Bootstrap Aggregating)Boosting(梯度提升/迭代提升)
核心思想并行训练多模型,降低方差串行训练模型,降低偏差
模型关系弱模型独立训练弱模型依赖前一个模型
数据采样自助法(Bootstrap)随机采样每轮关注前一轮预测错误样本
输出融合投票/平均加权累加
优势降低过拟合、稳定性高提升预测准确性、处理偏差
风控常用算法随机森林(RF)GBDT、XGBoost、LightGBM

二、Bagging(Bootstrap Aggregating)

2.1 原理

Bagging 核心思想:通过多次随机采样训练集,构建多个模型,再将预测结果融合,减少模型方差。

  1. 对原始训练集DDD(大小NNN)进行自助采样(Bootstrap),生成BBB个训练子集D1,D2,...,DBD_1, D_2, ..., D_BD1,D2,...,DB

    • 每个子集通过有放回抽样,样本量通常等于原始训练集
  2. 在每个子集上训练基础模型BaseLearnerBase LearnerBaseLearner,如决策树hb(x)h_b(x)hb(x)

  3. 预测融合

    • 回归问题:平均值y^=1B∑b=1Bhb(x) \hat{y} = \frac{1}{B} \sum_{b=1}^B h_b(x)y^=B1b=1Bhb(x)
    • 分类问题:多数投票y^=mode(h1(x),...,hB(x)) \hat{y} = \text{mode}(h_1(x), ..., h_B(x))y^=mode(h1(x),...,hB(x))
      公式总结(分类场景):P(Y=k∣X=x)=1B∑b=1B1(hb(x)=k) P(Y = k | X=x) = \frac{1}{B} \sum_{b=1}^B \mathbf{1}(h_b(x) = k)P(Y=kX=x)=B1b=1B1(hb(x)=k)

其中1\mathbf{1}1为指示函数。

2.2 风控应用

  • **随机森林(RF)**是 Bagging 的典型实现

  • 应用场景:

    • 信用违约预测(借款人还款/逾期)
    • 欺诈交易识别
    • 客户流失预测
  • 特点:

    • 通过随机采样和特征随机选择减少过拟合
    • 高方差模型(如深决策树)性能显著提升
  • 风控优势:

    • 易处理大量特征
    • 对异常值和噪声较鲁棒
    • 可提供特征重要性指标(便于监管解释)

2.3 风控实践流程(Bagging)

  1. 数据清洗与特征工程(包括 WOE、IV 分箱)
  2. 构建训练集并进行自助采样
  3. 训练随机森林 / Bagging 集成模型
  4. 模型评估(KS、AUC、混淆矩阵)
  5. 输出风险评分或违约概率
  6. 特征贡献分析(变量重要性)

三、Boosting(梯度提升)

3.1 原理

Boosting 核心思想:串行训练弱模型,每轮重点关注前一轮预测错误的样本,逐步减小偏差。

  • 每轮生成一个弱分类器hm(x)h_m(x)hm(x)
  • 为前一轮误分类样本分配更高权重
  • 最终模型通过加权累加FM(x)=∑m=1Mαmhm(x) F_M(x) = \sum_{m=1}^M \alpha_m h_m(x)FM(x)=m=1Mαmhm(x)

其中:

  • αm\alpha_mαm是第mmm个弱模型的权重(通常与准确率相关)
  • MMM是弱模型数量
3.1.1 梯度提升(Gradient Boosting)
  • 将 Boosting 与梯度下降结合

  • 每轮拟合残差(负梯度):rim=−[∂L(yi,F(xi))∂F(xi)]∗F=F∗m−1 r_{im} = - \left[ \frac{\partial L(y_i, F(x_i))}{\partial F(x_i)} \right]*{F=F*{m-1}}rim=[F(xi)L(yi,F(xi))]F=Fm1

  • 更新预测:Fm(x)=Fm−1(x)+ν⋅hm(x) F_m(x) = F_{m-1}(x) + \nu \cdot h_m(x)Fm(x)=Fm1(x)+νhm(x)

其中ν\nuν是学习率,控制每棵树对总模型的贡献。

3.2 风控应用

  • GBDT / XGBoost / LightGBM是 Boosting 的主流实现

  • 风控场景:

    • 信用评分卡增强版
    • 欺诈行为识别(实时交易评分)
    • 风险预测、逾期预测
  • 特点:

    • 高准确率、低偏差
    • 可以处理类别、连续变量和缺失值
    • 提供特征重要性,可用于解释性分析
  • 注意事项:

    • 易过拟合 → 需调节树深、学习率、样本权重
    • 对异常样本敏感 → 可以结合稳健损失函数

3.3 风控实践流程(Boosting)

  1. 数据处理与特征工程(WOE、IV、缺失值处理)

  2. 构建训练集

  3. 训练 Boosting 模型:

    • 调节学习率、树深、弱模型数量
    • 可以使用交叉验证选择参数
  4. 模型评估(KS、AUC、PR曲线)

  5. 输出违约概率 → 风险评分

  6. 可解释性分析:

    • 特征重要性
    • SHAP 值(解释单个客户违约概率贡献)

四、Bagging vs Boosting 在风控中的对比

特性BaggingBoosting
训练方式并行训练,多模型独立串行训练,后续模型依赖前一轮
主要作用降低方差,稳健性高降低偏差,提高准确率
弱模型高方差模型,如深决策树通常弱模型为浅树
数据处理样本自助采样样本加权重,关注误分类样本
风控优势稳定、可解释性好、抗噪声高准确率,处理复杂非线性关系
典型算法随机森林 (Random Forest)GBDT、XGBoost、LightGBM

五、风控实践总结

  1. Bagging

    • 适合基准风险模型、稳健性要求高的业务
    • 易解释、抗噪声,偏向保守型信用决策
  2. Boosting

    • 适合需要高精度风险预测的场景
    • 能捕捉非线性复杂关系,可与评分卡结合形成混合模型
  3. 组合使用

    • 风控实践中,有时会将 Boosting 输出作为特征,再用逻辑回归或 Bagging 模型融合
    • 兼顾准确率和解释性

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1167980.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HoRain云--jQuery选择器全解析:高效定位DOM元素

🎬 HoRain 云小助手:个人主页 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!忍不住分享一下给大家。点击跳转到网站。 目录 ⛳️ 推荐 …

HoRain云--jQuery 语法

🎬 HoRain 云小助手:个人主页 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!忍不住分享一下给大家。点击跳转到网站。 目录 ⛳️ 推荐 …

计算机毕业设计|基于springboot + vue校园跑腿系统(源码+数据库+文档)

校园跑腿 目录 基于springboot vue校园跑腿系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue校园跑腿系统 一、前言 博主介绍:✌️大…

【单片机毕业设计】【dz-1131】基于单片机的家用煤气远程监测系统

一、功能简介项目:家用煤气远程监测系统 项目编号:dz-1131 单片机类型:STM32F103C8T6 具体功能: 1、通过MQ-5监测当前环境的煤气浓度,监测到煤气浓度大于最大值,自动关闭煤气阀门,同时声光报警 …

计算机毕业设计|基于springboot + vue大学生就业招聘系统(源码+数据库+文档)

大学生就业招聘 目录 基于springboot vue大学生就业招聘系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue大学生就业招聘系统 一、前言 博主介绍…

手把手AI论文神器实操指南:9款工具20分钟生成8万字带文献引用

一、论文写作痛点与AI工具选型对比表 作为常年和论文“死磕”的研究生,你是否也遇到过这些问题: 开题时对着空白文档发呆,不知道从哪下笔?导师批注密密麻麻,却抓不住核心修改方向?手动插入参考文献格式&a…

阿里云函数计算全面教程:常用 API 串联与实战指南

大家好,我是jobleap.cn的小九。 在 Serverless 开发中,代码编写只是第一步。如何管理复杂的依赖、配置触发器以及实现一键部署,才是生产环境的核心。本教程将带你通过 Python 3.12 uv Serverless Devs (s.yaml) 走通全流程。 一、 核心组件…

Java线程数过多的隐藏危机:警惕这个致命异常!

文章目录Java线程数过多的隐藏危机:警惕这个致命异常!一、问题的来源:线程数过多引发JVM Crash1. JVM内存模型回顾2. 线程栈溢出:另一种死亡方式3. 线程数过多引发的连锁反应二、案例分析:一个真实的悲剧案例背景问题排…

全开源跨平台的独居安全应用系统源码 带完整的搭建部署教程以及源代码包

温馨提示:文末有资源获取方式 面对快速增长的独居群体对安全工具的潜在需求,一套高效、可立即投入使用的技术解决方案显得尤为重要。我们隆重推出一套完整的独居安全应用系统源码,它集成了无感监测与自动告警的核心能力,助力开发者…

活着么app系统源码,uni-app跨端+PHP后台,7天快速上线

温馨提示:文末有资源获取方式独居不意味孤立无援,技术可以为独居生活编织一张无形的安全网。我们为您提供一套创新的轻量化安全工具系统源码,它通过巧妙的“签到”设计,实现了对独居者安全状态的持续性、无感化监测。源码获取方式…

毕业论文代码难关怎么破?这份“通关秘籍”请收好!

凌晨两点,当室友早已进入梦乡,计算机专业的李峰仍在与毕业设计代码苦战。距离提交论文只剩三周,他的图像识别算法准确率卡在78%怎么也上不去,参考文献堆满了桌面,而代码注释还是一片空白。 这不是李峰一个人的困境。每…

基于springboot 心理咨询预约系统

心理咨询预约 目录 基于springboot vue心理咨询预约系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue心理咨询预约系统 一、前言 博主介绍&…

【技术深挖】4K/8K超高清图片如何实现AI翻译?Image Translator Pro 的性能调优之路

作者:林焱(RPA自动化开发者 / Python高级工程师)一、 “高清”背后的技术陷阱在高端电商领域(如珠宝、高端家电、品牌视觉海报),原图通常是 4K 甚至 8K 的超高清分辨率。单张图片的大小往往超过 20MB。作为…

校园失物招领小程序

校园失物招领小程序 目录 基于springboot vue校园失物招领小程序系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue校园失物招领小程序系统 一、…

springboot生猪养殖信息化管理系统小程序设计开发实现

生猪养殖信息化管理系统开发背景传统生猪养殖行业普遍存在人工记录效率低、数据易丢失、养殖过程难以追溯等问题。随着物联网技术和移动互联网的普及,通过信息化手段提升养殖效率成为行业迫切需求。SpringBoot框架的成熟为快速构建稳定后端系统提供了技术基础&#…

强烈安利自考必备TOP8 AI论文写作软件

强烈安利自考必备TOP8 AI论文写作软件 2026年自考论文写作工具测评:为何值得关注? 随着自考人数逐年增长,论文写作成为许多考生面临的难题。无论是选题困难、资料查找繁琐,还是格式规范不熟悉,都可能影响最终成绩。为此…

导师推荐9个AI论文软件,助你轻松搞定本科毕业论文!

导师推荐9个AI论文软件,助你轻松搞定本科毕业论文! AI 工具如何成为论文写作的得力助手 在当前高校教育中,本科毕业论文已成为学生必须面对的重要任务。随着人工智能技术的不断进步,AI 工具正逐步成为学术写作中的重要帮手。尤其是…

Android 基础入门教程2.6.1 PopupWindow(悬浮框)的基本使用

2.6.1 PopupWindow(悬浮框)的基本使用 分类 Android 基础入门教程 本节引言: 本节给大家带来的是最后一个用于显示信息的UI控件——PopupWindow(悬浮框),如果你想知道 他长什么样子,你可以打开你手机的QQ,长按列表中的某项&…

【dz-1165】基于单片机无线照明控制系统设计

基于单片机无线照明控制系统设计 摘要 随着智能家居理念的普及和生活品质的提升,照明系统的智能化控制成为家居生活优化的重要方向。传统照明控制方式存在操作繁琐、能耗较高等问题,无法满足人们对便捷化、节能化家居环境的需求。因此,研发一…

百考通全流程智能论文助手,从选题到答辩,一站式搞定!

还在为毕业论文焦头烂额?选题没方向、结构理不清、格式总出错、原创性难保证……别担心!百考通(https://www.baikaotongai.com)为你提供覆盖论文写作全生命周期的智能解决方案,让学术之路从此轻松高效!为什…