news 2026/4/16 13:37:01

超详细步骤:用fft npainting lama完成图片内容移除

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
超详细步骤:用fft npainting lama完成图片内容移除

超详细步骤:用fft npainting lama完成图片内容移除

1. 这不是普通修图,是AI驱动的智能重绘

你有没有遇到过这样的情况:一张精心拍摄的照片,却被路人、电线杆、水印或无关文字破坏了整体美感?传统修图工具需要反复涂抹、取样、调整边缘,耗时又难保自然。而今天要介绍的这套系统——fft npainting lama,不是简单地“糊掉”目标区域,而是真正理解图像上下文,用周围纹理、光影和结构进行语义级重绘填充

它基于LAMA(Large Mask Inpainting)模型深度优化,特别强化了傅里叶域(FFT)特征建模能力,让修复不再局限于像素邻域,而是从频域捕捉全局结构一致性。这意味着:

  • 移除广告牌后,砖墙纹理自然延续,接缝几乎不可见;
  • 擦除合影中的陌生人,背景人物姿态与光影仍保持逻辑连贯;
  • 去掉PPT截图上的临时标注,文字区域被生成出符合原风格的留白与阴影。

这不是“AI修图”,这是“AI重建”。本文将带你从零开始,不跳过任何一个按钮、不省略任何一次鼠标操作,完整走通整个流程。无论你是设计师、运营人员,还是刚接触AI工具的新手,只要会上传图片、会拖动鼠标,就能立刻上手。


2. 环境准备:三分钟启动WebUI服务

这套工具已封装为开箱即用的Docker镜像,无需安装Python环境、无需下载模型权重、无需配置CUDA——所有依赖均已预置完成。

2.1 启动服务(仅需两条命令)

打开终端(SSH或本地命令行),依次执行:

cd /root/cv_fft_inpainting_lama bash start_app.sh

注意:请确保你使用的是该镜像默认路径/root/cv_fft_inpainting_lama。若部署路径不同,请先cd到对应目录。

你会看到类似以下提示:

===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================

此时服务已在后台运行,等待浏览器连接。

2.2 访问界面:别输错端口和协议

在任意现代浏览器(Chrome/Firefox/Edge)中输入:

http://你的服务器IP:7860

例如,若服务器内网IP为192.168.1.100,则访问:
http://192.168.1.100:7860

正确写法:http://(不是https://) + IP +:7860
❌ 常见错误:漏掉:7860、误写成:8080:7861、加了www.前缀

如果页面加载成功,你会看到一个简洁的双栏界面,顶部写着 ** 图像修复系统**,右上角标注着“webUI二次开发 by 科哥”。


3. 界面实操:手把手认识每一个功能区

别急着点按钮——先花30秒熟悉布局。整个界面分为左右两大功能区,逻辑清晰,无隐藏菜单:

3.1 左侧:图像编辑区(你的“画布”)

这里是你操作的核心区域,包含三个关键组件:

  • 图像上传区:中央大块浅灰色区域,支持三种方式上传:

    • 点击后弹出文件选择框;
    • 直接将.png.jpg.jpeg.webp文件拖入该区域;
    • 复制一张图片(如截图),在区域内按Ctrl+V粘贴。
  • 工具栏(位于上传区下方):

    • 🖌画笔图标:默认激活,用于绘制白色mask(即你要移除的区域);
    • 🧽橡皮擦图标:擦除已画错的mask;
    • 撤销图标:回退上一步绘制/擦除操作;
    • 裁剪图标:可选,用于先裁切再修复(非必需);
    • 🎛画笔大小滑块:拖动调节笔触粗细(1–100px),小图建议10–30,大图建议40–80。
  • 操作按钮组(紧贴底部):

    • 开始修复:核心按钮,点击即触发AI重绘;
    • 清除:一键清空当前图像与所有标注,回到初始状态。

3.2 右侧:结果展示区(你的“成果看板”)

  • 修复结果预览窗:纯白底色区域,实时显示修复后的完整图像;
  • 处理状态栏:位于预览窗下方,以文字形式反馈当前进度,例如:
    • 等待上传图像并标注修复区域...(初始态)
    • 执行推理...(AI正在计算)
    • 完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20250405142233.png(成功提示)

小技巧:状态栏出现完整路径即表示修复完成,无需等待页面刷新——你可以立即去文件系统下载。


4. 核心四步:从上传到下载的完整闭环

现在,我们以一张带水印的电商主图为例,演示标准操作流。全程无代码、无参数设置、无概念术语,只有动作指令。

4.1 第一步:上传图像(3种方式任选其一)

假设你有一张名为product_with_watermark.jpg的图片,存于电脑桌面。

  • 推荐方式:拖拽上传
    直接用鼠标将该文件拖入左侧上传区,松手即上传。几秒内缩略图自动显示,无卡顿。

  • 备选方式:点击上传
    点击上传区 → 弹出系统文件对话框 → 导航至桌面 → 选中文件 → 点击“打开”。

  • 快捷方式:粘贴上传
    在其他软件中截图该图片 → 切换回浏览器标签页 → 在上传区内按Ctrl+V

支持格式:PNG(推荐,无损)、JPG/JPEG(通用)、WEBP(轻量)。
❌ 不支持:GIF(动图)、BMP、TIFF、RAW。

4.2 第二步:精准标注需要移除的区域(关键!决定效果上限)

这是唯一需要你动手的环节,也是影响最终质量的决定性步骤。记住一个原则:白色 = AI要重绘的地方

以移除右下角“SAMPLE”水印为例:

  1. 确认画笔已激活:检查工具栏中画笔图标是否高亮(默认即为高亮);
  2. 调节画笔大小:拖动滑块至25(水印约宽100px,25px笔触可覆盖3–4次,确保无遗漏);
  3. 涂抹水印区域
    • 鼠标左键按住,在“SAMPLE”文字上缓慢拖动;
    • 重复涂抹2–3遍,确保整个文字区域被均匀、完全覆盖为纯白色
    • 不必追求边缘完美——稍超出一点反而更利于AI羽化过渡。
  4. 检查与微调
    • 若不小心涂到旁边商品上,点击橡皮擦图标,用相同大小擦除多余部分;
    • 若某处未涂满(露出底图灰),用小画笔(调至12)补涂。

正确效果:水印区域呈现为一块干净、连续、无断点的白色mask。
❌ 错误效果:白色斑驳、有缝隙、只描边未填满、涂到无关区域。

4.3 第三步:点击“ 开始修复”,静待结果(5–30秒)

  • 点击按钮后,状态栏立即变为:初始化...执行推理...
  • 此时不要关闭页面、不要刷新、不要点其他按钮;
  • 根据图像尺寸,等待时间如下:
    • 小图(<800px宽):约5–8秒
    • 中图(800–1600px):约12–22秒
    • 大图(>1600px):约25–50秒(建议提前压缩至2000px以内)

技术说明(供好奇者了解):
系统并非简单复制粘贴,而是将图像转换至傅里叶频域,分析纹理周期性、边缘方向性、色彩空间分布,再结合LAMA的深层语义理解,生成结构一致、光照匹配、细节丰富的填充内容。这正是它比传统算法更自然的根本原因。

4.4 第四步:查看、验证与下载(三步到位)

当状态栏显示完成!已保存至: xxx.png时:

  1. 立即查看效果:右侧预览窗已显示修复后图像,放大查看水印原位置——应为无缝融合的背景纹理,无色差、无模糊块、无重复图案;
  2. 验证保存路径:路径形如/root/cv_fft_inpainting_lama/outputs/outputs_20250405142233.png,其中20250405142233是精确到秒的时间戳;
  3. 下载文件
    • 方式一(推荐):通过FTP/SFTP工具(如FileZilla)连接服务器,进入/root/cv_fft_inpainting_lama/outputs/目录,下载最新.png文件;
    • 方式二:在服务器终端执行
      ls -lt /root/cv_fft_inpainting_lama/outputs/ | head -n 2
      查看最新文件名,再用scp命令拉取;
    • 方式三(仅限本地开发):若在本机运行,直接打开该路径文件夹下载。

输出格式:PNG(保留最高质量,支持透明通道)
默认保存:每次修复均生成独立文件,不覆盖历史记录。


5. 实战进阶:应对复杂场景的4个关键技巧

标准流程能解决80%需求,但真实工作常遇挑战。以下是经大量测试验证的高效策略:

5.1 技巧一:分区域多次修复(对付大面积物体)

场景:一张风景照中需移除整辆停靠的汽车(占画面1/3)。

错误做法:试图一笔涂满整辆车 → mask过大,AI易丢失结构,生成模糊色块。

正确做法

  • 第一次:只涂车顶+前挡风玻璃(关键视觉焦点)→ 修复后获得自然天空与玻璃反光;
  • 下载结果图;
  • 第二次:上传新图,涂车身侧面 → AI参考已修复的顶部,生成协调的金属质感;
  • 第三次:涂底盘与阴影 → 完成最终整合。

优势:每次mask更小,AI专注局部,纹理连贯性远超单次大范围修复。

5.2 技巧二:扩大标注法(解决边缘生硬)

现象:修复后,原物体边缘一圈有细微“白边”或“色环”。

原因:mask边界与图像实际边缘完全重合,AI缺乏羽化缓冲区。

解法

  • 用橡皮擦清理原mask;
  • 切换画笔,将笔触调大1.5倍(如原用30px,现用45px);
  • 在原物体轮廓外额外涂抹2–3像素宽的“扩展带”
  • 再次修复 → AI自动利用扩展带做渐变融合,边缘彻底消失。

5.3 技巧三:瑕疵修复专用(人像/产品细节)

场景:人像照片中黑眼圈、皮肤痘印、产品图上划痕。

要点

  • 必须用最小画笔(1–8px),精准点涂,绝不拖动;
  • 对黑眼圈:涂整个眼下区域(含过渡阴影),而非仅深色部分;
  • 对痘印:围绕痘印画一个直径约3倍于痘的圆,确保覆盖周边微红;
  • 修复后若颜色偏暖/偏冷,属正常——AI依据周围肤色智能推断,通常比手动调色更自然。

5.4 技巧四:文字移除分段处理(避免字体残留)

场景:海报上一整行艺术字“SALE 50% OFF”。

问题:单次涂抹长文本,AI易将字母间空隙误判为背景,导致修复后仍有“虚影”。

方案

  • 将文字拆为3段:SALE50%OFF
  • 先修复50%(数字+符号,结构明确);
  • 再修复SALE(大写字母,特征强);
  • 最后修复OFF(避免与OFF混淆);
  • 每次修复后观察,必要时用小画笔对残留点补涂。

6. 效果对比:真实案例直观呈现

以下为同一张图在不同操作下的效果差异(文字描述模拟视觉体验):

操作方式修复效果描述推荐指数
标准单次涂抹(水印区域)水印完全消失,背景砖墙纹理自然延续,砖缝走向一致,明暗过渡柔和,无色差
未扩大标注(直接描边)水印消失,但边缘一圈有约2px宽的浅灰色“晕染带”,需二次微调
分区域修复(汽车)车顶修复后天空云层连贯;车身修复后金属反光与原车灯高光匹配;底盘阴影与地面材质统一
小画笔点涂(人像痘印)痘印区域被平滑肤色覆盖,毛孔细节保留,周边红血丝自然淡化,无“假面感”

观察重点:不是“有没有去掉”,而是“像不像原来就长这样”。真正的高质量修复,让人第一眼无法察觉曾被修改。


7. 常见问题速查(附解决方案)

遇到问题?先对照此表,90%可当场解决:

问题现象可能原因一键解决
点击“ 开始修复”无反应,状态栏不动未上传图像,或上传失败点击“ 清除”,重新拖拽上传,观察上传区是否显示缩略图
状态栏提示未检测到有效的mask标注白色mask未覆盖、或涂成灰色/黑色、或使用了橡皮擦后未重涂用画笔重新涂抹,确保区域为纯白、饱满、无缺口
修复后图像全黑/全白/严重色偏上传了非RGB格式图(如CMYK、灰度图)用Photoshop或在线工具转为RGB模式后再上传
处理时间超2分钟,状态卡在执行推理...图像分辨率过高(>3000px)或内存不足压缩图像至2000x2000以内,或联系管理员检查GPU显存
下载的PNG打开后是空白或乱码浏览器缓存或FTP传输中断ls -lh /root/cv_fft_inpainting_lama/outputs/查看文件大小,若<1KB则失败,重试修复

技术支持:开发者科哥提供微信支持(ID:312088415),问题描述请附:

  • 截图(上传区+mask状态+状态栏)
  • 图像尺寸(如1920x1080
  • 使用的浏览器及版本

8. 总结:你已掌握专业级AI重绘能力

回顾整个流程,你其实只做了三件事:
上传一张图;
用鼠标画几笔白色;
点一下“ 开始修复”。

但背后是LAMA模型对图像语义的深度理解,是FFT频域分析对全局结构的精准建模,是科哥团队针对中文用户习惯优化的极简交互。它不强迫你理解“掩码”“潜空间”“扩散步数”,而是把最强大的技术,封装成最朴素的操作。

你现在可以:

  • 为电商团队批量去除产品图水印;
  • 帮设计师快速清理会议截图中的敏感信息;
  • 给摄影师修复老照片划痕;
  • 甚至为自媒体制作无干扰的封面素材。

真正的AI工具,不该让你学参数,而应让你省时间。

下一步,不妨找一张你最近想处理却一直搁置的图片,打开http://你的IP:7860,亲手试试——那几秒钟的等待之后,你会看到AI如何安静而坚定地,把“不想要的”变成“本来就这样”。

--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:24:24

Kaldi迁移用户必看:从传统ASR到Paraformer的转型实战指南

Kaldi迁移用户必看&#xff1a;从传统ASR到Paraformer的转型实战指南 1. 为什么Kaldi老用户该认真看看Paraformer 如果你用Kaldi搭过ASR系统&#xff0c;大概率经历过这些时刻&#xff1a;编译报错、依赖冲突、数据预处理脚本改了又改、解码图构建像解谜、调一个WER指标要反复…

作者头像 李华
网站建设 2026/4/16 12:27:31

Windows快捷键冲突解决:系统热键管理工具的全面应用指南

Windows快捷键冲突解决&#xff1a;系统热键管理工具的全面应用指南 【免费下载链接】hotkey-detective A small program for investigating stolen hotkeys under Windows 8 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 在Windows系统的日常操作中&…

作者头像 李华
网站建设 2026/4/16 12:26:44

图像修复系统升级:fft npainting lama更新日志解读

图像修复系统升级&#xff1a;FFT NPainting LaMa更新日志解读 1. 系统升级概览&#xff1a;从LaMa到工程化WebUI的演进 你可能已经用过LaMa——那个在图像修复领域以“细节自然、边缘融洽”著称的开源模型。但真正让它从实验室走向日常生产力工具的&#xff0c;不是论文里的…

作者头像 李华
网站建设 2026/4/14 21:38:20

LibreDWG在Visual Studio 2019环境下的跨平台构建指南

LibreDWG在Visual Studio 2019环境下的跨平台构建指南 【免费下载链接】libredwg Official mirror of libredwg. With CI hooks and nightly releases. PRs ok 项目地址: https://gitcode.com/gh_mirrors/li/libredwg LibreDWG作为开源的DWG文件格式处理库&#xff0c;提…

作者头像 李华
网站建设 2026/4/16 12:14:20

BetterNCM Installer:网易云音乐插件管理的创新方案

BetterNCM Installer&#xff1a;网易云音乐插件管理的创新方案 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 在数字音乐体验日益个性化的今天&#xff0c;插件管理已成为提升音乐软…

作者头像 李华