2025认证杯二阶段C题完整论文讲解+多模型对比

基于延迟估计与多模型预测的化工生产过程不合格事件预警方法研究

摘要

化工生产过程中,污染物浓度如SO₂和H₂S对生产过程的控制至关重要。本文旨在通过数据分析与模型预测,提出一种基于延迟估计与特征提取的多模型预测方法,优化阈值设置,及时预警潜在的不合格事件。

在数据处理阶段,我们首先进行了数据的预处理、基本统计分析、百分位数计算与阈值选择,结合阈值敏感性分析评估了阈值变化对合格率的影响。通过这一过程,确定了不同百分位数的阈值,并使用多种阈值组合选择方法,以最大化合格率。同时,应用三种先进的异常检测方法——ROC曲线优化、One-Class SVM和高斯混合模型(GMM),对SO₂和H₂S浓度的异常阈值进行了对比研究。

针对延时分析模型,我们提出了两种方法:互相关分析和差分响应法,用于估计输入反应物流量变化对SO₂和H₂S浓度响应的延迟。互相关分析通过计算输入与输出之间的相关系数,识别最大相关性对应的延迟时间;而差分响应法通过识别输入信号中的显著变化点,验证延迟的准确性。

针对预测模型的构建,我们结合延迟估计与特征提取,采用分类模型预测是否发生不合格事件,并利用回归模型预测不合格事件的发生时间。通过对模型准确率、精确率、召回率和F1分数的评估,验证了预测模型的有效性与性能。

最后,我们的研究提出了一种基于延迟估计和特征提取的多模型预测方法,能够有效预测不合格事件并提供提前预警。该方法为化工生产过程中的控制策略设计提供了新的思路和技术支持。

关键词:延迟估计;阈值设置;多模型预测;分类模型;回归模型

一、模型假设

为了方便模型的建立与模型的可行性,我们这里首先对模型提出一些假设,使得模型更加完备,预测的结果更加合理。

1、假设化工生产过程中,SO₂和H₂S的浓度受多个反应过程参数的影响,且污染物浓度的变化与输入流量、反应条件等因素紧密相关。

2、假设输入数据(包括反应物流量和污染物浓度)是准确和及时获取的,且数据质量良好,没有遗漏或异常值。

3、假设在实际应用中,延迟和阈值的设置会根据实际生产过程和数据反馈进行适当调整,以应对不同生产环境和操作条件下的变化。

二、模型的建立与求解

5.1 阈值确定

在本次分析中,我们主要目的是通过数学方法分析并确定化工厂脱硫工艺中的污染物SO₂和H₂S浓度的阈值,并为生产过程中的控制提供理论支持。分析过程包括数据的预处理、统计分析、百分位数分析、阈值选择、敏感性分析等步骤,旨在通过精确的控制阈值保证产品质量。

5.1.1 数据预处理

首先,加载了输入输出数据,其中输入数据包含工艺参数,而输出数据则是
 和
 的浓度。数据清洗过程中,我们需要确保数据结构的正确性,例如去除表头行,确保每个数据项都是数值型数据。通过这些预处理步骤,我们确保了分析数据的质量。

图片

这些统计量帮助我们理解数据的基本分布特性,例如污染物浓度的波动范围与离散程度。

SO2统计信息:

最小值: -5.2016

最大值: 13.9642

平均值: -0.0000

标准差: 1.0000

H2S统计信息:

最小值: -5.9891

最大值: 7.6372

平均值: 0.0000

标准差: 1.0000

从SO₂和H₂S的统计信息来看,SO₂浓度的最小值为-5.2016,最大值为13.9642,表明SO₂浓度在测量过程中存在一定的波动,涵盖了负值和正值,这可能与测量误差或数据处理中的异常值有关。SO₂的平均值接近零,标准差为1,表明其浓度波动相对较小,数据相对集中。对于H₂S,最小值为-5.9891,最大值为7.6372,同样存在负值,可能是由于数据异常或测量误差导致。H₂S的平均值为0,标准差也为1,显示其浓度在整体上呈现较为均匀的分布,波动幅度不大。整体来看,SO₂和H₂S的数据呈现出一定的波动性和异常值的存在,可能需要进一步的数据清洗和异常值处理。

图片

图片

百分位数 SO2阈值           H2S阈值          

----------------------------------------

50 0.1648          -0.0037        

75 0.6439          0.5057         

80 0.7398          0.6331         

85 0.8356          0.8878         

90 1.0273          1.0151         

95 1.4106          1.5245         

97 1.6022          1.7792         

98 1.8897          2.1612         

99 2.2730          2.6706         

图片

图片

通过计算不同百分位数组合对应的合格率,我们可以选择最优的阈值组合。我们进一步尝试不同的百分位数组合,如
 、
 、
 等,以找出使得合格率最大化的阈值组合。

不同阈值组合下的结果:

SO2阈值 H2S阈值      SO2百分位数         H2S百分位数         合格率

-----------------------------------------------------------------

0.8356 0.8878     85              85              0.7448

0.8356 1.0151     85              90              0.7645

0.8356 1.5245     85              95              0.8173

0.8356 1.7792     85              97              0.8305

0.8356 2.1612     85              98              0.8406

0.8356 2.6706     85              99              0.8490

1.0273 0.8878     90              85              0.7890

1.0273 1.0151     90              90              0.8092

1.0273 1.5245     90              95              0.8633

1.0273 1.7792     90              97              0.8765

1.0273 2.1612     90              98              0.8866

1.0273 2.6706     90              99              0.8949

1.4106 0.8878     95              85              0.8403

1.4106 1.0151     95              90              0.8613

1.4106 1.5245     95              95              0.9171

1.4106 1.7792     95              97              0.9305

1.4106 2.1612     95              98              0.9409

5.2.2 多模型对比 

除了互相关分析,我们还采用了差分响应分析法来进一步验证延迟的估计结果。该方法通过分析输入信号的显著变化,并观察输出信号的响应,来估计延迟。具体地,首先对输入信号进行差分处理,计算输入信号的变化幅度(即每个时刻与前一时刻的差值)。然后,设置一个阈值,识别输入信号中大于该阈值的显著变化点,这些变化点被认为是输入信号的脉冲。

通过选择显著变化点(脉冲点),我们分析对应的输出响应。在每个脉冲点之后,我们计算输出信号的变化,并通过与基线(脉冲点前的输出值的均值)进行比较,确定响应达到最大值时的延迟。具体来说,我们通过以下步骤来计算延迟:

1.计算输入信号的差分:

2.选择差分超过某个阈值的变化点作为显著变化点。
3.对于每个显著变化点,记录输出信号的响应,计算其与基线的差异。
4.找到响应的最大变化位置,并将其作为延迟估计。
对于每个输入信号,我们选择了 5 个以上的显著变化点,并确保它们之间有足够的间隔(至少 50 个时间单位)。对于每个选定的脉冲点,我们计算输出信号的最大响应,并将这些响应时间作为延迟估计的候选值。如果选定的延迟值超过了 3 个有效值,我们取这些延迟的中位数作为最终的延迟估计结果。

在互相关分析法和差分响应法的基础上,我们结合两种方法的结果来得到更为可靠的延迟估计。为了合并两种方法的结果,我们给每种方法分配了不同的权重,通常互相关分析法的权重较大,脉冲响应法的权重较小。综合延迟估计可以通过加权平均计算得到:

其中,
 和
 是互相关法和脉冲响应法的权重,通常
 。通过这种加权方式,我们得到了每个输入信号对
 和
 的综合响应延迟估计。

综合延时估计结果:

输入变量 输出变量       互相关法延时          脉冲响应法延时         综合估计延时         

---------------------------------------------------------------------------------

IN1 OUT1       0               144             43             

IN1 OUT2       0               129             39             

IN2 OUT1       4                           

IN2 OUT2       40              121             64             

IN3 OUT1       25                         

IN3 OUT2       0               126             38             

IN4 OUT1       10              128             45           

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/81276.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端精度问题全解析:用“挖掘机”快速“填平精度坑”的完美解决方案

写在前面 “为什么我的计算在 React Native 中总是出现奇怪的精度问题?” —— 这可能是许多开发者在作前端程序猿的朋友们都会遇到的第一个头疼问题。本文将深入探讨前端精度问题的根源,我将以RN为例,并提供一系列实用解决方案,让你的应用告别计算误差。 一、精度问题的…

2024 睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛) 解题报告 | 珂学家

前言 题解 2024 睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛)。 国赛比省赛难一些,做得汗流浃背,T_T. RC-u1 大家一起查作弊 分值: 15分 这题真的太有意思,看看描述 在今年的睿抗比赛上,有同学的提交代码如下&#xff1…

hghac和hgproxy版本升级相关操作和注意事项

文章目录 环境文档用途详细信息 环境 系统平台:N/A 版本:4.5.6,4.5.7,4.5.8 文档用途 本文档用于高可用集群环境中hghac组件和hgproxy组件替换和升级操作 详细信息 1.关闭服务 所有数据节点都执行 1、关闭hgproxy服务 [roothgdb01 tools]# system…

userfaultfd内核线程D状态问题排查

问题现象 运维反应机器上出现了很多D状态进程,也kill不掉,然后将现场保留下来进行排查。 排查过程 都是内核线程,先看下内核栈D在哪了,发现D在了userfaultfd的pagefault流程。 uffd知识补充 uffd探究 uffd在firecracker与e2b的架构下使…

深入解析:构建高性能异步HTTP客户端的工程实践

一、架构设计原理与核心优势 HTTP/2多路复用技术的本质是通过单一的TCP连接并行处理多个请求/响应流,突破了HTTP/1.1的队头阻塞限制。在异步编程模型下,这种特性与事件循环机制完美结合,形成了高性能网络通信的黄金组合。相较于传统同步客户…

根据台账批量制作个人表

1. 前期材料准备 1)要有 人员总的信息台账 2)要有 个人明白卡模板 2. 开始操作 1)打开 人员总的信息台账,选择所需要的数据模块; 2)点击插入,选择数据透视表,按流程操作&…

《AI大模型应知应会100篇》第65篇:基于大模型的文档问答系统实现

第65篇:基于大模型的文档问答系统实现 📚 摘要:本文详解如何构建一个基于大语言模型(LLM)的文档问答系统,支持用户上传 PDF 或 Word 文档,并根据其内容进行智能问答。从文档解析、向量化、存储到…

RTK哪个品牌好?2025年RTK主流品牌深度解析

在测绘领域,RTK 技术的发展日新月异,选择一款性能卓越、稳定可靠的 RTK 设备至关重要。2025 年,市场上涌现出众多优秀品牌,本文将深入解析几大主流品牌的核心竞争力。 华测导航(CHCNAV):技术创…

SpringCloud微服务开发与实战

本节内容带你认识什么是微服务的特点,微服务的拆分,会使用Nacos实现服务治理,会使用OpenFeign实现远程调用(通过黑马商城来带你了解实际开发中微服务项目) 前言:从谷歌搜索指数来看,国内从自201…

pgsql14自动创建表分区

最近有pgsql的分区表功能需求,没想到都2025年了,pgsql和mysql还是没有自身支持自动创建分区表的功能 现在pgsql数据库层面还是只能用老三样的办法来处理这个问题,每个方法各有优劣 1. 触发器 这是最传统的方法,通过创建一个触发…

math toolkit for real-time development读书笔记一三角函数快速计算(1)

一、基础知识 根据高中知识我们知道,很多函数都可以用泰勒级数展开。正余弦泰勒级数展开如下: 将其进一步抽象为公式可知: 正弦和余弦的泰勒级数具有高度结构化的模式,可拆解为以下核心特征: 1. 符号交替特性 正弦级…

uni-app 中适配 App 平台

文章目录 前言✅ 1. App 使用的 Runtime 架构:**WebView 原生容器(plus runtime)**📌 技术栈核心: ✅ 2. WebView Native 的通信机制详解(JSBridge)📤 Web → Native 调用&#xf…

SpringBoot基础(静态资源导入)

静态资源导入 在WebMvcAutoConfiguration自动配置类中 有一个添加资源的方法: public void addResourceHandlers(ResourceHandlerRegistry registry) { //如果静态资源已经被自定义了,则直接生效if (!this.resourceProperties.isAddMappings()) {logg…

基于OpenCV的人脸识别:LBPH算法

文章目录 引言一、概述二、代码实现1. 代码整体结构2. 导入库解析3. 训练数据准备4. 标签系统5. 待识别图像加载6. LBPH识别器创建7. 模型训练8. 预测执行9. 结果输出 三、 LBPH算法原理解析四、关键点解析五、改进方向总结 引言 人脸识别是计算机视觉领域的一个重要应用&…

ElasticSearch重启之后shard未分配问题的解决

以下是Elasticsearch重启后分片未分配问题的完整解决方案,结合典型故障场景与最新实践: 一、快速诊断定位 ‌检查集群状态 GET /_cluster/health?pretty # status为red/yellow时需关注unassigned_shards字段值 ‌ 2.查看未分配分片详情 …

CSS- 3.1 盒子模型-块级元素、行内元素、行内块级元素和display属性

本系列可作为前端学习系列的笔记,代码的运行环境是在HBuilder中,小编会将代码复制下来,大家复制下来就可以练习了,方便大家学习。 HTML系列文章 已经收录在前端专栏,有需要的宝宝们可以点击前端专栏查看! 点…

Git/GitLab日常使用的命令指南来了!

在 GitLab 中拉取并合并代码的常见流程是通过 Git 命令来完成的。以下是一个标准的 Git 工作流,适用于从远程仓库(如 GitLab)拉取代码、切换分支、合并更新等操作。 🌐 一、基础命令:拉取最新代码 # 拉取远程仓库的所…

HTML 表格与div深度解析区别及常见误区

一、HTML<div>元素详解 <div>是HTML中最基本的块级容器元素&#xff0c;本身没有语义&#xff0c;主要用于组织和布局页面内容。以下是其核心用法&#xff1a; 1. 基础结构与特性 <div><!-内部可包含任意HTML元素 --><h2>标题</h2><p…

mybatisPlus 新增时 其他字段的值和 id 保持一致实现方法

MyBatis-Plus 实现 sp_id_path 与 id 同步的方案 要实现新增时 sp_id_path 自动与 id 保持一致&#xff0c;需要在实体类和插入逻辑中做相应处理。MyBatis-Plus 提供了几种方式来实现这一需求&#xff1a; 方案一&#xff1a;使用 MyBatis-Plus 的自动填充功能 这是最优雅的…

兰亭妙微设计:为生命科技赋予人性化的交互语言

在医疗科技日新月异的今天&#xff0c;卓越的硬件性能唯有匹配恰如其分的交互语言&#xff0c;方能真正发挥价值。作为专注于医疗UI/UX设计的专业团队&#xff0c;兰亭妙微设计&#xff08;www.lanlanwork.com&#xff09;始终相信&#xff1a;每一处像素的排布&#xff0c;都应…