news 2026/6/9 20:51:13

GPEN模型引用格式怎么写?CVPR论文BibTeX规范示例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GPEN模型引用格式怎么写?CVPR论文BibTeX规范示例

GPEN模型引用格式怎么写?CVPR论文BibTeX规范示例

GPEN人像修复增强模型镜像

本镜像基于GPEN人像修复增强模型构建,预装了完整的深度学习开发环境,集成了推理及评估所需的所有依赖,开箱即用。

1. 镜像环境说明

组件版本
核心框架PyTorch 2.5.0
CUDA 版本12.4
Python 版本3.11
推理代码位置/root/GPEN

主要依赖库:

  • facexlib: 用于人脸检测与对齐
  • basicsr: 基础超分框架支持
  • opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1
  • sortedcontainers,addict,yapf

2. 快速上手

2.1 激活环境

conda activate torch25

2.2 模型推理 (Inference)

进入代码目录并使用预置脚本进行推理测试:

cd /root/GPEN

使用下面命令进行推理测试,可以通过命令行参数灵活指定输入图片。

# 场景 1:运行默认测试图 # 输出将保存为: output_Solvay_conference_1927.png python inference_gpen.py # 场景 2:修复自定义图片 # 输出将保存为: output_my_photo.jpg python inference_gpen.py --input ./my_photo.jpg # 场景 3:直接指定输出文件名 # 输出将保存为: custom_name.png python inference_gpen.py -i test.jpg -o custom_name.png

推理结果将自动保存在项目跟目录下,测试结果如下:


3. 已包含权重文件

为保证开箱即用及离线推理能力,镜像内已预下载以下模型权重(如果没有运行推理脚本会自动下载):

  • ModelScope 缓存路径~/.cache/modelscope/hub/iic/cv_gpen_image-portrait-enhancement
  • 包含内容:完整的预训练生成器、人脸检测器及对齐模型。

4. 常见问题

  • 数据集准备:官网训练数据为 FFHQ 公开数据集。本算法采用监督式的训练,因此需要事先准备好高质-低质的数据对,推荐使用RealESRGAN、BSRGAN等降质方式进行低质数据生成。
  • 训练:提供训练数据对的读取地址,设置好需要的分辨率版本(推荐512x512),调整生成器和判别器的学习率以及总epoch数,即可开始训练。。

5. 参考资料

  • 官方仓库:yangxy/GPEN
  • 魔搭社区地址:iic/cv_gpen_image-portrait-enhancement

6. 引用 (Citation)

如果你在研究或项目中使用了 GPEN 模型,建议按照其原始发表论文的格式进行学术引用。以下是标准的 BibTeX 引用格式,适用于 LaTeX 文档和参考文献管理工具(如 Zotero、EndNote 等)。

@inproceedings{yang2021gpen, title={GAN-Prior Based Null-Space Learning for Consistent Super-Resolution}, author={Yang, Tao and Ren, Peiran and Xie, Xuansong and Zhang, Lei}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2021} }

这个引用条目包含了所有关键信息:

  • 作者:Tao Yang 等人
  • 论文标题:GAN-Prior Based Null-Space Learning for Consistent Super-Resolution
  • 会议名称:IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
  • 年份:2021

提示:CVPR 是计算机视觉领域最顶级的国际会议之一,被录用意味着该工作具有较高的创新性和技术价值。正确引用不仅体现学术规范,也有助于他人追溯技术来源。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:10:45

语音唤醒前处理怎么搞?这个VAD镜像直接拿去用

语音唤醒前处理怎么搞&#xff1f;这个VAD镜像直接拿去用 你是不是也遇到过这样的问题&#xff1a;想做个语音唤醒功能&#xff0c;结果发现录音里一大半都是静音、呼吸声、键盘敲击声&#xff0c;真正说话的部分只占一小段&#xff1f;每次都要手动剪辑音频&#xff0c;或者写…

作者头像 李华
网站建设 2026/6/10 14:13:37

手机也能用!FSMN-VAD适配移动端网页访问

手机也能用&#xff01;FSMN-VAD适配移动端网页访问 1. 为什么你的语音处理需要端点检测&#xff1f; 你有没有遇到过这样的问题&#xff1a;录了一段十分钟的会议音频&#xff0c;结果里面一半时间都是静音或背景噪音&#xff1f;如果要交给语音识别系统处理&#xff0c;这些…

作者头像 李华
网站建设 2026/6/10 12:06:29

2026年AI边缘计算入门必看:Qwen CPU部署实战

2026年AI边缘计算入门必看&#xff1a;Qwen CPU部署实战 1. 为什么说Qwen是边缘AI的“全能选手”&#xff1f; 在AI从云端向终端迁移的大趋势下&#xff0c;边缘计算正成为智能设备落地的关键战场。然而&#xff0c;资源受限、算力不足、部署复杂等问题始终困扰着开发者。尤其…

作者头像 李华
网站建设 2026/6/10 14:12:08

零配置运行Qwen3-0.6B,开箱即用太方便了

零配置运行Qwen3-0.6B&#xff0c;开箱即用太方便了 1. 快速启动&#xff0c;无需部署烦恼 你有没有遇到过这样的情况&#xff1a;想试一个新模型&#xff0c;结果光是环境配置就花了半天&#xff1f;依赖冲突、CUDA版本不匹配、包安装失败……这些问题在AI开发中屡见不鲜。但…

作者头像 李华
网站建设 2026/6/10 4:56:51

音乐播放器界面革命:foobox-cn如何重新定义你的听觉体验边界

音乐播放器界面革命&#xff1a;foobox-cn如何重新定义你的听觉体验边界 【免费下载链接】foobox-cn DUI 配置 for foobar2000 项目地址: https://gitcode.com/GitHub_Trending/fo/foobox-cn 在数字音乐时代&#xff0c;你是否曾因播放器界面的平庸而感到遗憾&#xff1…

作者头像 李华
网站建设 2026/6/10 16:00:00

Qwen2.5-0.5B与Phi-3-mini对比:轻量模型谁更快?

Qwen2.5-0.5B与Phi-3-mini对比&#xff1a;轻量模型谁更快&#xff1f; 1. 轻量级大模型的“速度之争”&#xff1a;Qwen2.5-0.5B vs Phi-3-mini 在边缘设备、本地开发环境和资源受限场景中&#xff0c;小模型正变得越来越重要。它们不需要昂贵的GPU&#xff0c;也能在普通笔…

作者头像 李华