基于特征融合的电子鼻多任务深度学习模型研究
原论文地址:https://www.sciencedirect.com/science/article/pii/S0925400524009365
引用此论文(GB/T 7714-2015):
- NI W, WANG T, WU Y, et al. Multi-task deep learning model for quantitative volatile organic compounds analysis by feature fusion of electronic nose sensing[J]. Sensors and Actuators B: Chemical, 2024, 417: 136206. DOI:10.1016/j.snb.2024.136206.
论文作者学术主页:https://www.researchgate.net/profile/Tao-Wang-261
1. 研究背景与意义
电子鼻(Electronic Nose, E-nose)技术通过模拟生物嗅觉系统,实现对复杂气体混合物的识别与定量分析,广泛应用于食品检测、环境监测和健康诊断等领域。然而,传统神经网络在电子鼻模式识别中的应用存在训练效率低、忽略气体响应序列时空特性等问题。为此,本文提出结合特征融合与多任务深度学习(MTL)的新型方法,在充分保留响应序列的空间与时间特性的基础上,同时实现气体类型分类与浓度回归预测。
2. 实验系统与数据采集
2.1 无人化气体测试系统
本研究采用研究团队开发的先进气体测试平台G919,结合自复原调理电路与自动控制脚本,采集了大规模的气体响应数据集。传感器阵列包含八个不同类型的气敏元件。
2.2 测试对象与实验设计
选取了十二种常见挥发性有机化合物(VOCs),如乙醇、丙酮、甲醇、甲苯等。气体浓度设置在10–100 ppm,单一气体实验重复十五次,其中十二次用于训练,三次用于验证。响应定义为空气电阻与目标气体电阻之比(R0/Rg)。
图1 (a) 八个传感器对NBA气体的原始电阻曲线;(b-d) 八个传感器对NBA、BAC、NHE气体的响应曲线。
3. 数据处理与特征融合
3.1 时间序列图像转换
为充分保留气体响应的时空特性,本文采用GAF(Gramian Angular Fields)、MTF(Markov Transition Fields)与GADF(Gramian Angular Difference Fields)方法,将响应时间序列分别转换为三种不同特征的图像。
图2 (a) 单通道图像生成流程;(b) 多通道图像融合示意;© 传统灰度图像示例。
通过三种图像堆叠生成三通道输入,形成每个样本2880×2880的大型图像。随后采用Lanczos重采样与高斯滤波技术压缩图像至不同尺寸(96×96至4×4),显著减少数据量同时保留关键信息。
3.2 特征压缩与增强
压缩图像后仅保留原数据的3.9%,大幅提升训练与验证效率,同时维持模型性能。
4. 多任务神经网络结构设计
4.1 MTL-CNN-LSTM模型架构
本文提出的神经网络结构包含共享卷积层(Conv+BN),分支卷积池化层(Conv+BN+MP),以及融合长短期记忆(LSTM)单元的多任务输出模块。
图3 (a) 多任务共享层示意;(b) LSTM模块结构;© 含LSTM的分支层;(d) 不含LSTM的对照结构。
其中,卷积网络主要提取空间特征,LSTM模块用于捕捉时间依赖性,显著提升模型对气体响应序列的理解能力。
4.2 训练策略
训练过程使用Adam优化器,batch size为256,分类任务采用log-loss损失函数,回归任务采用均方误差(MSE)损失函数。每种图像尺寸下均训练200轮(epochs)。
5. 结果分析与讨论
5.1 MTL-CNN与MTL-CNN-LSTM性能比较
图4 多通道特征融合与多任务学习流程总览。
LSTM嵌入后,模型在不同图像尺寸下均表现出更高的分类准确率与回归R2得分。
图5 (a) 不同图像尺寸下分类准确率与回归R2得分对比;(b) 分类与回归损失对比;©(d) 不同模型训练与验证时间对比。
在图像尺寸10×10时,CNN-LSTM模型在分类任务中达到95.31%的准确率,在回归任务中达到0.9510的R2得分,且标准误更小,表明模型训练稳定性更好。
5.2 训练过程与学习曲线
图6 (a) 5折交叉验证分类准确率曲线;(b) 分类任务训练损失曲线;© 回归任务R2得分曲线;(d) 回归任务MSE曲线。
5.3 混淆矩阵与回归预测分析
图7 (a)(b) 10×10图像训练下CNN与CNN-LSTM模型的气体分类混淆矩阵;©(d) CNN与CNN-LSTM模型气体浓度回归滴水图(Teardrop Diagram)。
CNN-LSTM模型在高浓度区域的回归预测准确性尤其突出,优于传统CNN模型。
6. 结论
本文提出了基于GAF-MTF特征融合与CNN-LSTM结构的多任务深度学习框架,成功实现了气体类型分类与浓度预测的同步高效完成。在数据压缩至仅3.9%的条件下,仍能取得95%以上的分类准确率与0.95以上的回归R2得分,验证了特征融合与时空联合建模策略在电子鼻模式识别领域的巨大潜力。