news 2026/6/10 13:08:46

租用共绩算力4090实测龙猫图片编辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
租用共绩算力4090实测龙猫图片编辑

本人实测发现,本地配备的 16GB 显存显卡无法运行 LongCat-Image(龙猫图片编辑)项目,即便开启 CPU offloading(CPU 卸载)功能缓解显存压力,依然因显存不足导致运行失败。
为此,我在网上寻找共享算力资源,最终选择租用 4090 显卡进行测试,所使用的算力平台为【共绩算力】(官网:https://www.gongjiyun.com/)。

值得一提的是,该平台对个人开发者提供免费算力申请的机会,降低了测试和开发的成本。

该平台创建云主机的流程十分便捷,基础镜像已预装Miniconda等开发必备软件,无需额外配置基础环境,极大节省了前期准备时间。考虑到需妥善保存项目数据,我额外开通了共享存储卷并挂载至云主机。不过结合两次创建云主机的实测体验来看,共享存储卷存在明显短板——读写速度较慢;而云主机自带的本地存储则表现更优,读写效率显著更高,建议大家根据实际需求选择存储方式。

登录云主机后,可直接参照 LongCat-Image 的官方仓库(https://github.com/meituan-longcat/LongCat-Image)执行以下安装步骤:

# 克隆项目仓库(仅拉取main分支) git clone --single-branch --branch main https://github.com/meituan-longcat/LongCat-Image cd LongCat-Image # 创建并激活conda虚拟环境(指定Python 3.10版本) conda create -n longcat-image python=3.10 conda activate longcat-image # 安装项目依赖并以开发模式安装项目 pip install -r requirements.txt python setup.py develop # 配置Hugging Face镜像并下载模型权重 pip install "huggingface_hub[cli]" export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download meituan-longcat/LongCat-Image-Edit --local-dir ./weights/LongCat-Image-Edit

环境配置完成后,运行示例脚本进行图片编辑测试:

python scripts/inference_edit.py

需要说明的是,项目代码中已内置CPU offloading机制,核心代码如下,其作用是将部分模型权重卸载至CPU,以此降低显存占用、避免出现OOM(显存溢出)错误:

pipe.enable_model_cpu_offload()# Offload to CPU to save VRAM (Required ~19 GB); slower but prevents OOMgenerator=torch.Generator("cpu").manual_seed(43)

即便开启了该优化机制,实测运行过程中显卡显存峰值占用仍达约17GB。这也印证了本地16GB显存显卡无法运行的核心原因——显存容量不足;而4090显卡的24GB显存,恰好能满足项目稳定运行的需求。

以下为本次测试的实际效果对比:
demo中编辑前的原图:

经过LongCat-Image编辑实现将“车换成摩托车”后的效果:

从编辑效果来看,整体表现十分出色:不仅成功实现了“车换摩托车”的核心需求,细节处理也相当到位,就连阴影部分都还原得自然逼真,没有出现明显的违和感。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 6:22:43

EmotiVoice语音合成请求限流与熔断机制设计

EmotiVoice语音合成请求限流与熔断机制设计 在虚拟偶像直播中,观众实时发送弹幕触发角色语音回应——一条“加油!”的留言瞬间被成千上万用户重复刷屏。此时,后台的 EmotiVoice 语音合成服务若未设防,将面临突如其来的流量洪峰&am…

作者头像 李华
网站建设 2026/6/10 13:06:03

EmotiVoice在电子词典产品中的发音引擎替代方案

EmotiVoice在电子词典产品中的发音引擎替代方案 在教育类智能硬件不断进化的今天,用户对电子词典的语音功能早已不再满足于“能读出来”——他们希望听到的是有温度、有情绪、像真人一样的朗读。然而,大多数传统设备仍依赖预录音频或拼接式TTS技术&#…

作者头像 李华
网站建设 2026/6/10 7:28:17

EmotiVoice是否需要联网使用?本地化运行实测

EmotiVoice是否需要联网使用?本地化运行实测 在智能语音技术日益渗透日常生活的今天,越来越多的内容创作者、开发者和企业开始关注一个核心问题:我们能否在不依赖云端服务的前提下,依然生成高质量、富有情感的语音?尤其…

作者头像 李华
网站建设 2026/6/10 11:36:59

AI配音商业化路径:基于EmotiVoice提供语音服务

AI配音商业化路径:基于EmotiVoice提供语音服务 在短视频日更、虚拟主播24小时直播、游戏NPC能“读懂情绪”回话的今天,用户对声音内容的要求早已不是“把字念出来”那么简单。他们要的是有温度的声音——能传递喜悦、愤怒、温柔或坚定的情绪表达&#xf…

作者头像 李华
网站建设 2026/6/9 22:43:46

EmotiVoice如何实现语音语义重音的自动标注与呈现?

EmotiVoice如何实现语音语义重音的自动标注与呈现? 在虚拟主播深夜直播时突然情绪激动地说出“你真的以为我会相信这种借口吗?”,而这句话不仅语气逼真、重音精准落在“不是”和“借口”上,甚至连声音都和她平时一模一样——这一切…

作者头像 李华
网站建设 2026/6/10 15:09:20

HS2-HF补丁:3步解决HoneySelect2三大痛点

HS2-HF补丁:3步解决HoneySelect2三大痛点 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 还在为HoneySelect2的语言障碍而烦恼吗?&#…

作者头像 李华