FFT NPainting LAMA分步教学:从启动到完成修复只需5步
本文带你用最简单的方式,把一张带水印、杂物或瑕疵的图片,变成干净清爽的专业级作品。不需要代码基础,不用理解算法原理,只要跟着5个清晰步骤操作,就能看到立竿见影的效果。
1. 启动服务:两行命令,30秒就绪
别被“FFT”“LAMA”这些词吓到——它们只是背后默默工作的技术名字,你完全不需要懂。你要做的,只有两步:
首先,打开服务器终端(比如通过SSH连接),进入项目目录:
cd /root/cv_fft_inpainting_lama然后,一键启动Web界面:
bash start_app.sh你会立刻看到这样的提示:
===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================这说明服务已成功运行。
如果没看到这个提示,请检查是否漏掉了cd命令,或执行ps aux | grep app.py确认进程是否存在。
现在,打开你的浏览器,在地址栏输入:http://你的服务器IP:7860(例如http://192.168.1.100:7860)
你将看到一个简洁明了的图像修复界面——没有菜单嵌套、没有设置弹窗,只有左边画布、右边预览,和几个大按钮。
这个界面是科哥二次开发优化过的版本,去掉了所有冗余功能,只保留最核心的“上传→标注→修复→下载”闭环。
2. 上传图片:三种方式,总有一种适合你
上传不是技术活,是选择题。你可以任选其一:
- 点击上传:直接点击中间灰色区域,调出系统文件选择框,选中PNG/JPG/WEBP格式的图片即可;
- 拖拽上传:把图片文件直接从电脑桌面拖进网页灰框里,松手即上传;
- 粘贴上传:截图后按
Ctrl + V,图片会自动出现在画布上(Chrome/Firefox支持良好)。
小贴士:
- 优先用PNG格式,它不压缩、保细节,修复后边缘更自然;
- 图像分辨率建议控制在2000×2000像素以内——太大虽能处理,但等待时间明显变长;
- 如果原图是手机竖拍,无需提前旋转,系统会自动适配方向。
上传成功后,左侧画布会立刻显示原图,右侧预览区仍为空白(因为还没开始修复)。此时界面底部状态栏会显示:等待上传图像并标注修复区域...
3. 标注修复区域:用“画笔”圈出你想去掉的东西
这是整个流程中最关键的一步,但操作极其直观——就像用记号笔在照片上划掉不要的部分。
3.1 选择工具与调整大小
界面上方有一排图标,第一个就是画笔工具(Brush),默认已激活。
旁边有个滑块,标着“Brush Size”,拖动它可调节笔触粗细:
- 小尺寸(10–30px):适合勾勒文字、水印、电线、小瑕疵等精细边缘;
- 中尺寸(50–100px):适合涂抹人脸上的痘痘、LOGO、签名等中等目标;
- 大尺寸(150px+):适合快速覆盖大面积背景杂物,比如路人、垃圾桶、横幅。
经验之谈:宁可稍大,不可遗漏。系统对“多涂一点”的容忍度远高于“漏涂一块”。
3.2 开始绘制:白色=待修复
在需要移除的区域上,按住鼠标左键拖动,画出纯白色遮罩。
注意:不是描边,而是实心填充;不是画轮廓,而是盖满整个目标。
举几个真实例子:
- 去除右下角半透明水印?把整个水印区域涂白,边缘多延展2–3像素;
- 移除照片里误入镜头的路人?从头到脚完整涂白,包括脚底阴影;
- 修掉证件照上的红笔批注?用小画笔一笔一笔填满字迹,别留缝隙。
3.3 精修:橡皮擦帮你“反悔”
如果涂错了、涂多了,或想微调边界,点一下橡皮擦工具(Eraser),再在画布上擦除即可。
它和画笔一样支持大小调节,擦除后露出原始图像,方便你重新定位。
正确标注的标志:
- 白色区域完整覆盖目标,无缺口;
- 边缘略宽于实际物体(约2–5像素),给算法留出羽化空间;
- 右侧预览区下方状态栏变为:
已检测到有效mask标注。
4. 执行修复:点击一次,静待结果
确认标注无误后,点击界面上最醒目的蓝色按钮:
** 开始修复**
此时,状态栏会依次显示:
初始化... 执行推理... 完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20240520143218.png⏱ 处理耗时参考:
- 小图(<500px):约5秒
- 中图(800–1500px):10–20秒
- 大图(1800px+):20–60秒
你不需要做任何事,只需看着右侧预览区——图像会从模糊渐变到清晰,最终呈现一张无缝融合的新图。
修复原理一句话说清:
系统基于LAMA模型(一种先进图像修复算法),结合FFT频域增强技术,智能分析周围纹理、颜色、光照,生成与原图风格一致的“补丁”,再无缝拼接。你看到的是结果,它干的是“脑补+缝合”的活。
5. 查看与保存:结果就在眼皮底下
修复完成后,右侧预览区会立即显示完整图像。你可以:
- 放大查看细节:滚动鼠标滚轮(部分浏览器支持);
- 对比原图:点击左上角“ 清除”,重新上传原图并标注,做A/B对比;
- 下载结果:右键点击预览图 → “另存为”,或直接前往服务器路径:
/root/cv_fft_inpainting_lama/outputs/文件名形如outputs_20240520143218.png,按时间戳命名,避免覆盖。
输出路径说明:
- 所有结果均保存为PNG格式,无损压缩,保留Alpha通道(如有);
- 文件权限为当前用户可读写,可通过FTP、SFTP或宝塔面板直接下载;
- 每次修复都会生成新文件,旧文件不会被覆盖。
验证修复质量的小技巧:
把修复图和原图并排打开,眯起眼睛看过渡区域——如果看不出接缝、颜色一致、纹理连贯,那就达到了专业级效果。
6. 实战技巧:让修复效果更稳、更快、更准
上面5步是“能用”,这节教你“用好”。全是来自真实使用场景的硬核经验。
6.1 复杂边缘处理:分两次,胜过一次硬刚
比如要移除一根细电线穿过人物头发的场景:
❌ 错误做法:用小画笔沿电线全程描,稍有抖动就断线,导致修复失败;
正确做法:
- 先用中号画笔,把电线两侧各扩3像素涂白(形成一条宽带);
- 点击修复,得到初步结果;
- 下载该图,重新上传;
- 用小画笔精修发丝边缘残留痕迹。
两次操作,比一次追求完美更可靠。
6.2 多目标清理:别贪快,分区域逐个击破
一张图上有水印+路人+日期文字?
不要试图一次性全涂白。
✔ 推荐流程:
- 第一次:只涂水印,修复后下载;
- 第二次:上传上一步结果,只涂路人,修复后下载;
- 第三次:上传第二次结果,只涂日期,修复后下载。
这样每步干扰少,成功率接近100%,且便于回溯哪一步出了问题。
6.3 边缘生硬?不是模型不行,是你没给它“缓冲带”
常见疑问:“为什么修复后边缘一圈发灰/发亮?”
答案几乎总是:标注太紧贴目标边缘。
🔧 解决方案:下次标注时,刻意让白色区域向外多延展3–5像素。系统内置的边缘羽化机制会利用这部分“缓冲区”,自动柔化过渡,让融合更自然。
6.4 修复后颜色偏移?试试这个隐藏操作
极少数情况下(如原图含特殊色彩配置),修复区域可能轻微偏色。
这不是Bug,而是RGB通道解析差异。
🛠 快速应对:
- 在Photoshop/GIMP中打开结果图;
- 使用“匹配颜色”功能,以原图未修复区域为源,对修复区域进行色彩校正;
- 或直接用在线工具(如 Photopea)做一键白平衡调整。
(注:此属后期微调,非必需步骤)
7. 常见问题直答:省去反复试错的时间
我们整理了用户最高频的6个卡点,每个都给出可立即执行的解法。
Q1:点击“开始修复”没反应,状态栏一直停在“初始化…”
→ 检查服务器内存是否充足(至少2GB空闲);
→ 执行nvidia-smi(如有GPU)确认显存未被占满;
→ 重启服务:Ctrl+C停止,再bash start_app.sh。
Q2:上传后画布一片黑/花屏
→ 确认图片不是CMYK模式(需转RGB);
→ 尝试换用PNG格式重传;
→ 浏览器换Chrome最新版,禁用广告屏蔽插件。
Q3:修复后出现奇怪的色块或扭曲纹理
→ 标注区域存在镂空(比如只涂了文字外框,没填满);
→ 用橡皮擦检查是否有未发现的白色断点;
→ 重新上传,用大一号画笔整体覆盖再试。
Q4:想修复同一张图的不同部位,但“清除”后原图也没了
→ 不要点“清除”,而应:右键预览图 → “在新标签页打开” → 保存该图 → 重新上传它继续操作。
Q5:输出文件夹里找不到最新生成的图
→ 路径没错,但文件名含时间戳,可用ls -lt outputs/按时间倒序列出,取第一行;
→ 或在WebUI界面底部状态栏,完整复制“已保存至: xxx.png”中的路径。
Q6:能否批量处理100张图?
→ 当前WebUI为单图交互式设计,不支持全自动批处理;
→ 如需批量,可联系科哥获取CLI命令行脚本(需基础Linux操作能力);
→ 或使用Python调用其API接口(文档见项目根目录api_usage.md)。
8. 总结:5步闭环,就是这么简单
回顾这整套流程,它之所以高效,是因为每个环节都做了减法:
- 没有安装依赖:镜像已预装全部环境(PyTorch、OpenCV、LAMA核心模型);
- 没有参数调试:无需调learning rate、steps、strength——所有超参已固化最优;
- 没有格式转换:上传即用,输出即得,全程PNG保真;
- 没有学习成本:画笔=删除,橡皮=撤回,按钮=执行,所见即所得。
你真正投入的,只有5个动作:
① 启动服务 → ② 上传图片 → ③ 涂白目标 → ④ 点击修复 → ⑤ 下载结果
从打开终端到拿到成品图,熟练者全程不超过90秒。而这张图,可能是你明天要发给客户的方案封面,可能是要提交的课程作业,也可能是想发朋友圈却碍于水印而搁置已久的旅行照。
技术的价值,从来不是炫技,而是让“做不到”变成“点一下就好”。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。