news 2026/4/16 18:09:18

QwenTTS 预设音色

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
QwenTTS 预设音色
import torch import soundfile as sf from qwen_tts import Qwen3TTSModel import os # ============ 1. 设置代理 (如果需要) ============ os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890' os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890' # ============ 2. 定义你要保存模型的【指定文件夹】路径 ============ # 使用绝对路径,例如在D盘创建一个`my_tts_models`文件夹 TARGET_MODEL_DIR = r"D:\AI\short_video\tts\Qwen3-TTS-0.6B-CustomVoice" # 下载目录和导入目录都是要一个啊 # 我是用的github下载的 目录结构不变 git clone https://huggingface.co/Qwen/Qwen3-TTS-12Hz-0.6B-CustomVoic.git # ============ 3. 加载模型 (关键修正) ============ model = Qwen3TTSModel.from_pretrained( r"D:\AI\short_video\tts\Qwen3-TTS-12Hz-0.6B-CustomVoice", # 1. 必须用0.6B 2. 必须用CustomVoice cache_dir=TARGET_MODEL_DIR, # 关键参数:指定下载目录 device_map="cuda", # dtype=torch.float16, # 报错就关掉 # attn_implementation="flash_attention_2", # 如果没装flash-attn,先注释掉 ) # 强制清理GPU缓存并验证 import torch torch.cuda.empty_cache() print(f"当前显存占用: {torch.cuda.memory_allocated(0)/1024**3:.2f} GB") # 检查输入数据 print("模型加载完成,准备生成...") # ============ 4. 生成语音 (使用预设音色的纯TTS) ============ wavs, sr = model.generate_custom_voice( text="沈逸琛遭养子沈寒轩陷害被送精神病院,还被顶替作家身份。沈家逼他替婚石宕村姑娘,殊不知对方是首富千金叶婉晨。二人联手,在作家论坛戳穿沈寒轩真面目,又在招标会曝光其罪行与私生子身份。最终恶人落网,沈逸琛复仇成功,与叶婉晨终成眷属。", language="Chinese", speaker="Uncle_Fu", # 使用预设音色 instruct="用解说文案的语气", # 纯TTS,指令留空。或者直接省略此参数。 ) # ============ 5. 将生成的音频保存到【指定输出文件夹】 ============ TARGET_AUDIO_DIR = r"D:\AI\short_video\tts" # 定义你的音频输出文件夹 os.makedirs(TARGET_AUDIO_DIR, exist_ok=True) # 确保文件夹存在 output_path = os.path.join(TARGET_AUDIO_DIR, "output_custom_voice.wav") sf.write(output_path, wavs[0], sr) print(f"✅ 语音生成成功!模型已下载/加载至:{TARGET_MODEL_DIR}") print(f"✅ 音频文件已保存至:{output_path}")
SpeakerVoice DescriptionNative language
VivianBright, slightly edgy young female voice.Chinese
SerenaWarm, gentle young female voice.Chinese
Uncle_FuSeasoned male voice with a low, mellow timbre.Chinese
DylanYouthful Beijing male voice with a clear, natural timbre.Chinese (Beijing Dialect)
EricLively Chengdu male voice with a slightly husky brightness.Chinese (Sichuan Dialect)
RyanDynamic male voice with strong rhythmic drive.English
AidenSunny American male voice with a clear midrange.English
Ono_AnnaPlayful Japanese female voice with a light, nimble timbre.Japanese
SoheeWarm Korean female voice with rich emotion.Korean
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:15:23

导师推荐2026 TOP10 AI论文工具:MBA毕业论文写作全测评

导师推荐2026 TOP10 AI论文工具:MBA毕业论文写作全测评 2026年MBA论文写作工具测评:为什么你需要一份精准指南 随着人工智能技术的不断进步,AI论文工具已经成为学术研究中不可或缺的辅助工具。对于MBA学生而言,撰写高质量的毕业论…

作者头像 李华
网站建设 2026/4/16 17:06:21

慢充3.3kW占20%,普通7kW占50%,快充11kW占20%,超充20kW占10

基于蒙特卡洛思想生成10000台充电汽车充电负荷曲线充电汽车负荷预测这事挺有意思的。咱们今天直接上干货,用蒙特卡洛方法撸出一万辆车子的充电曲线。别被名字吓到,说白了就是靠大量随机采样模拟真实场景——就像在赌场扔骰子,次数多了总能逼近…

作者头像 李华
网站建设 2026/4/16 10:46:51

基于深度学习的车辆追踪系统

目录 深度学习车辆追踪系统概述关键技术组成典型应用场景挑战与优化方向 源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 深度学习车辆追踪系统概述 深度学习车辆追踪系统利用卷积神经网络(CNN)、循环神经网络&…

作者头像 李华
网站建设 2026/4/16 9:05:22

基于深度学习的工地安全帽检测系统

目录深度学习的工地安全帽检测系统概述核心技术方法系统实现流程性能优化方向应用效果评估源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!深度学习的工地安全帽检测系统概述 工地安全帽检测系统利用计算机视觉和深度学习技术&#xff…

作者头像 李华
网站建设 2026/4/16 14:02:09

基于深度学习的坐姿检测系统

目录 深度学习的坐姿检测系统概述核心技术与方法系统实现流程应用场景与优化 源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 深度学习的坐姿检测系统概述 坐姿检测系统利用计算机视觉和深度学习技术,实时监测人体坐姿状态…

作者头像 李华