文章目录
- demo代码
- 加载配置文件
- speech_tokenizer_v1.onnx(只在zero_shot的时候使用)
- campplus.onnx(只为了提取说话人音色embedding)
- `campplus_model` 的作用
- 代码解析
- 具体过程解析
- 总结
- 示意图
- CosyVoiceFrontEnd
- CosyVoiceModel
- 推理过程
- 总体推理过程
推理速度很慢:
https://github.com/FunAudioLLM/CosyVoice/issues/261
论文:
https://qq742971636.blog.csdn.net/article/details/140832222
demo代码
import os, sys
import time# cuda可见设置为3
os.environ["CUDA_VISIBLE_DEVICES"] = "3"sys.path.insert(0, os.path.abspath('third_part