一、现实痛点:当人脸被遮挡,AI “认脸” 有多难?
你是否遇到过这样的场景?
- 中考体育测试:2025 年天津泰达街中考考场要求考生 “脸部无遮挡” 才能通过人脸识别入场,戴口罩、帽子的学生需现场调整发型。
- 智能门锁:奇景光电在 CES 2025 推出的 WiseEye 掌静脉模块,通过掌静脉 + 人脸识别双模态技术,解决了严寒环境下戴手套无法识别的问题。
- 安防监控:2024 年某装修企业因 “未告知用户” 采集人脸信息被处罚,凸显隐私保护与技术应用的矛盾。
真实场景中的人脸遮挡,正在成为 AI “认脸” 的核心挑战。据《中国安防行业数字安全建设与发展白皮书》显示,2024 年智能安防市场规模突破 1.06 万亿元,但传统人脸识别技术在 30% 面部遮挡时准确率骤降 40%,在合规与效率间陷入两难。
传统方法为何在真实数据上 “翻车”?
过去,研究者常用深度学习模型处理人脸去遮挡问题,但效果始终不理想。核心原因在于:训练数据和真实数据 “长得不一样”。
- 合成数据太 “假”:传统方法依赖合成数据(如在干净人脸图像上人工粘贴遮挡物),但合成的遮挡物往往光照不自然、边缘生硬,与真实遮挡(如口罩贴合面部的阴影、墨镜的反光)存在明显差异。
- 结构信息缺失:合成数据中的人脸多为正面、表情自然的 “标准脸”,而真实场景中遮挡人脸可能有侧脸、夸张表情、复杂光照,模型难以泛化。
这种 “合成数据→真实数据” 的 “域差距”,让模型在真实遮挡场景下频频 “翻车”。如何让 AI 看懂 “真实世界的遮挡”?这篇论文给出了突破性方案。
二、核心创新:三阶段 “步步引导”,让 AI 学会 “拆解难题”
三阶段级联引导学习框架
将人脸去遮挡拆解为三个连续阶段,像 “流水线” 一样逐步修复遮挡区域:
- 第一阶段:遮挡检测(找遮挡)
先定位遮挡的具体位置和形状,输出一张 “遮挡掩码”(白色区域为遮挡,黑色为未