如何修改GPEN代码实现自定义功能？二次开发入门指南-编程阁

如何修改GPEN代码实现自定义功能？二次开发入门指南

你是不是也遇到过这样的情况：GPEN修复效果很惊艳，但默认输出只有单张图、不能批量处理、想加个自动裁剪人脸区域、或者想把修复结果直接叠加到原图上？别急，这篇指南就是为你准备的——不讲晦涩理论，不堆参数配置，只说怎么动手改代码，让GPEN真正听你的话。

本文面向有一定Python基础、能看懂简单PyTorch代码的开发者。不需要你从头复现模型，也不用重新训练权重。我们聚焦在已有镜像环境里，如何安全、快速、可验证地修改GPEN源码，完成真实可用的定制功能。所有操作都在预装好的CSDN星图GPEN镜像中实测通过，命令复制即用，改完就能跑。

1. 先搞清楚：GPEN代码结构到底长什么样？

别一上来就改inference_gpen.py——那只是个“启动器”。真正干活的是整个模块化结构。打开/root/GPEN目录，你会看到这些关键文件夹和文件：

/root/GPEN/ ├── inference_gpen.py ← 你每天运行的入口脚本（别大改！） ├── models/ │ ├── gpen.py ← 核心生成器模型定义（含网络结构、前向逻辑） │ └── base_model.py ← 基础模型类（加载权重、设备管理等） ├── basicsr/ ← 复用的超分工具库（已集成，不建议动） ├── facexlib/ ← 人脸检测与对齐（已预装，稳定可靠） ├── utils/ │ ├── face_restoration.py ← 人脸修复主流程（读图→检测→对齐→修复→融合→保存） │ └── options.py ← 配置解析（命令行参数最终落到这里） └── testsets/ ← 默认测试图存放位置

关键认知：
inference_gpen.py只负责解析命令行、调用utils.face_restoration；
真正的图像处理逻辑集中在utils/face_restoration.py的FaceRestoreHelper类里；
模型加载和推理在models/gpen.py的GPEN类中完成；
所有“你想加的功能”，90%都该在face_restoration.py里动手。

2. 动手改第一处：让GPEN支持批量修复图片

默认脚本一次只能处理一张图，而你手里可能有上百张老照片。我们来加一个--input-dir参数，让它自动遍历整个文件夹。

2.1 修改配置解析（`utils/options.py`）

找到parse_options()函数，在parser.add_argument()区域末尾添加：

parser.add_argument( '--input-dir', type=str, default=None, help='Path to input directory (for batch processing). If set, --input is ignored.' )

2.2 修改主流程（`utils/face_restoration.py`）

打开FaceRestoreHelper类，找到get_face_landmarks_5()和paste_face_to_input()之间的逻辑。我们在enhance()方法开头插入批量处理分支：

# 在 enhance() 方法开头，约第180行附近，找到这行： # self.input_img = cv2.imread(self.input_path, cv2.IMREAD_COLOR) # 替换为以下逻辑： if self.opt.input_dir: import glob import os img_paths = sorted(glob.glob(os.path.join(self.opt.input_dir, '*.[jJpP][pPnN][gG]'))) if not img_paths: raise ValueError(f'No images found in {self.opt.input_dir}') print(f' Found {len(img_paths)} images for batch processing') else: img_paths = [self.opt.input]

接着，把原来单图处理的主循环改成遍历：

# 找到原循环：self.restore() → self.paste_face_to_input() # 替换为： for idx, img_path in enumerate(img_paths): print(f'\n Processing [{idx+1}/{len(img_paths)}]: {os.path.basename(img_path)}') self.input_path = img_path self.input_img = cv2.imread(self.input_path, cv2.IMREAD_COLOR) if self.input_img is None: print(f' Skip invalid image: {img_path}') continue self.restore() self.paste_face_to_input() # 新增：自动生成带序号的输出名 base_name = os.path.splitext(os.path.basename(img_path))[0] output_name = f'output_{base_name}_{self.opt.suffix}.png' if self.opt.output: output_name = self.opt.output elif self.opt.input_dir: output_name = os.path.join(os.path.dirname(self.opt.input_dir), output_name) cv2.imwrite(output_name, self.output) print(f' Saved to: {output_name}')

2.3 测试你的批量功能

上传一个包含5张人像的文件夹到/root/test_batch/，然后执行：

cd /root/GPEN python inference_gpen.py --input-dir /root/test_batch/ --suffix batch_v1

你会看到控制台逐张打印处理进度，5张图全部输出到同级目录，文件名自动带上batch_v1后缀。没有报错？恭喜，你完成了第一个可落地的二次开发！

3. 再加一个实用功能：修复后自动裁剪出高清人脸区域

很多人修复完不是为了看整张图，而是要提取高清正脸用于证件照、AI训练或社交媒体头像。我们给FaceRestoreHelper加一个crop_face_only()方法。

3.1 在`utils/face_restoration.py`中新增方法

在FaceRestoreHelper类末尾（paste_face_to_input()下方），插入：

def crop_face_only(self, scale=1.0): """ Crop only the restored face region, with optional scaling. Returns: cropped face image (BGR, uint8) or None if no face detected """ if not hasattr(self, 'restored_face') or self.restored_face is None: return None # Use aligned face bbox (already computed during alignment) if not hasattr(self, 'aligned_bbox') or self.aligned_bbox is None: return None x1, y1, x2, y2 = self.aligned_bbox h, w = self.restored_face.shape[:2] # Adjust bbox to restored face coordinate space x1 = max(0, int(x1 * w / self.input_img.shape[1])) y1 = max(0, int(y1 * h / self.input_img.shape[0])) x2 = min(w, int(x2 * w / self.input_img.shape[1])) y2 = min(h, int(y2 * h / self.input_img.shape[0])) # Apply scale center_x, center_y = (x1 + x2) // 2, (y1 + y2) // 2 half_w, half_h = int((x2 - x1) * scale / 2), int((y2 - y1) * scale / 2) x1 = max(0, center_x - half_w) y1 = max(0, center_y - half_h) x2 = min(w, center_x + half_w) y2 = min(h, center_y + half_h) return self.restored_face[y1:y2, x1:x2].copy()

3.2 暴露为命令行选项

回到inference_gpen.py，在parser.add_argument()区域加一行：

parser.add_argument('--crop-face', action='store_true', help='Save cropped face only (no background)')

然后在main()函数中，调用helper.enhance()后插入：

if opt.crop_face: cropped = helper.crop_face_only(scale=opt.crop_scale if hasattr(opt, 'crop_scale') else 1.2) if cropped is not None: crop_name = f'crop_{os.path.splitext(os.path.basename(opt.input))[0]}.png' cv2.imwrite(crop_name, cropped) print(f' Cropped face saved: {crop_name}')

再加一个可调缩放参数（可选）：

parser.add_argument('--crop-scale', type=float, default=1.2, help='Scale factor for cropped face (default: 1.2)')

3.3 实测效果

运行命令：

python inference_gpen.py --input ./my_photo.jpg --crop-face --crop-scale 1.5

你会得到两张图：一张是默认的全图修复结果output_my_photo.png，另一张是放大1.5倍的高清正脸crop_my_photo.png，边缘干净、无黑边、细节锐利——这才是真正能直接用的素材。

4. 进阶技巧：不改模型，也能提升修复质量的3个代码级优化

有时候问题不在模型本身，而在前后处理链路。以下是我在实际项目中验证有效的3个轻量级优化点，全部只需改几行代码：

4.1 修复前做自适应直方图均衡（CLAHE）

低光照人像常因对比度不足导致修复模糊。在face_restoration.py的read_image()后、get_face_landmarks_5()前插入：

# 在 read_image() 返回 self.input_img 后，立即添加： if self.opt.clahe: clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8)) yuv = cv2.cvtColor(self.input_img, cv2.COLOR_BGR2YUV) yuv[:,:,0] = clahe.apply(yuv[:,:,0]) self.input_img = cv2.cvtColor(yuv, cv2.COLOR_YUV2BGR)

并在options.py中添加参数：

parser.add_argument('--clahe', action='store_true', help='Apply CLAHE before face detection')

效果：暗部细节更清晰，修复后皮肤纹理更自然，尤其对逆光、室内弱光照片提升明显。

4.2 融合时启用泊松混合（Poisson Blending）

默认的alpha融合容易在发际线、胡须边缘留下“塑料感”。替换paste_face_to_input()中的融合逻辑：

# 找到原 cv2.seamlessClone 或 alpha blend 代码段 # 替换为（需先 pip install opencv-contrib-python）： try: mask = np.zeros(self.input_img.shape[:2], dtype=np.uint8) cv2.fillConvexPoly(mask, np.array([self.face_landmarks_5]).astype(np.int32), 255) self.output = cv2.seamlessClone( self.restored_face, self.input_img, mask, (self.face_center[0], self.face_center[1]), cv2.NORMAL_CLONE ) except: # fallback to alpha blend self.output = self.input_img * (1 - self.mask) + self.restored_face * self.mask

效果：过渡更自然，几乎看不出修复痕迹，适合对真实感要求极高的场景。

4.3 输出支持WebP格式（节省70%体积）

修复图动辄5-10MB，不利于网页展示。在cv2.imwrite()前统一判断后缀：

# 在所有 save 逻辑前，添加： if output_name.lower().endswith('.webp'): success = cv2.imwrite(output_name, self.output, [cv2.IMWRITE_WEBP_QUALITY, 95]) else: success = cv2.imwrite(output_name, self.output)

效果：同样视觉质量下，WebP体积仅为PNG的30%，加载更快，分享更轻便。

5. 安全开发原则：改代码不翻车的4条铁律

二次开发不是乱改，尤其面对已封装好的深度学习模型。这4条是我踩坑总结的硬性守则：

不动核心模型文件（models/gpen.py）：除非你要改网络结构或损失函数，否则只读不写。权重加载、设备迁移、前向推理逻辑极其敏感，一行错就全崩。
所有新功能必须加开关控制：用if opt.xxx:包裹，确保默认行为完全不变。别人拉你的代码，不加参数照样能跑通。
路径操作一律用os.path.join()：避免Linux/Windows路径分隔符差异。镜像虽是Linux环境，但你本地调试可能跨平台。
日志比print更重要：把关键步骤（如“检测到X个人脸”、“裁剪尺寸W×H”）写进print()，方便快速定位是哪步出错。不要等报错才回头查。

记住：最好的二次开发，是让别人看不出你改过代码，但又能立刻用上新功能。

6. 总结：你已经掌握GPEN二次开发的核心路径

回看这一路，我们没碰CUDA、没调学习率、没重写Loss，却实实在在让GPEN变成了你专属的修复工具：

学会了定位关键文件：知道该去face_restoration.py而不是死磕inference_gpen.py；
实现了批量处理能力：500张图一键修复，不再手动点100次；
增加了人脸裁剪导出：修复即产出可用素材，省去PS二次加工；
掌握了3个画龙点睛式优化：CLAHE提亮、泊松融合、WebP压缩，全是即插即用；
牢记了安全开发铁律：不破坏原有逻辑，所有改动可开关、可回滚。

下一步你可以尝试：把修复结果自动上传到OSS、对接微信机器人发送修复图、或者用Gradio包装成网页界面……可能性只取决于你的需求，而不取决于GPEN的原始设计。

技术的价值，从来不是“它能做什么”，而是“你能让它为你做什么”。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

如何修改GPEN代码实现自定义功能？二次开发入门指南