项目地址:https://github.com/coqui-ai/TTS
1. 创建一个新的conda环境,如果自己会管理python环境也可以用其他方法
克隆项目下来
pip install -r requirements.txt # 安装依赖
pip install coqui-tts # 只要命令行工具的话
下载自己想要的模型 Release v0.6.1 models · coqui-ai/TTS · GitHub
import torch
from TTS.api import TTS## Init TTS 初始化,传入模型和配置文件路径
device = "cuda" if torch.cuda.is_available() else "cpu" # Get device
tts = TTS(model_path="你的路径/model_file.pth", config_path="你的路径/config.json", progress_bar=True).to(device)tts.tts_to_file(text="人生就像一场马拉松", file_path="output.wav")
下载的文件解压出来一般有:config.json model_file.pth scale_stats.npy 这些文件,config.json里面的scale_path要改为解压出来的scale_stats.npy对应的文件路径
代码中的文件路径也要指定,当然你也可以放到~/.local/tts/models 这个是linux的默认路径,具体路径可以到site-package tts的源码中改。
执行python脚本后,音频文件输出到tts_to_file方法的file_path参数指定的名字,示例中是当前路径的output.wav