ChatTTS文本转语音本地部署结合内网穿透实现远程使用生成AI音频

文章目录

    • 前言
    • 1. 下载运行ChatTTS模型
    • 2. 安装Cpolar工具
    • 3. 实现公网访问
    • 4. 配置ChatTTS固定公网地址

前言

本篇文章主要介绍如何快速地在Windows系统电脑中本地部署ChatTTS开源文本转语音项目,并且我们还可以结合Cpolar内网穿透工具创建公网地址,随时随地远程访问本地搭建的ChatTTS AI语音合成模型。

最像人声的AI来了!语音开源天花板ChatTTS火速出圈,一周就斩获20k,目前github上已经21k。这是专门为对话场景设计的语音生成模型,用于LLM助手对话任务、对话语音、视频介绍等,仅支持中英文。

请添加图片描述

ChatTTS是一种基于深度学习的文本转语音技术,它可以将文本内容转化为自然流畅的人工语音。不同于传统的TTS技术,ChatTTS能够更好地理解文本的情感、语调和语义,从而在语音输出中表达出更加准确和生动的七情六欲。通过训练大规模的语音数据和使用高级的神经网络模型,ChatTTS实现了对文本的情感理解和表达,使得语音输出更加贴近人类表达。

ChatTTS的应用场景广泛,尤其在语音助手、虚拟主播、有声书等领域有着巨大的潜力。例如,在语音助手方面,ChatTTS可以赋予语音助手更加生动、自然的声音,提升用户体验。

在虚拟主播领域,ChatTTS可以为虚拟角色赋予独特的声音和情感,使其更加接近真实人类主播的表达能力。在有声书方面,ChatTTS可以实现更加生动、有趣的阅读体验,让用户沉浸在声音的世界中。这些应用场景的成功案例表明了ChatTTS技术在不同领域的潜力和市场需求。

ChatTTS文字转语音一键安装与使用教程!自然生动免费开源

1. 下载运行ChatTTS模型

本篇文章测试环境:Windows

Github地址:https://github.com/2noise/ChatTTS
ChatTTS压缩包地址:https://pan.baidu.com/s/1VnVnW9XCjNgkjm0etQBSXg?pwd=6666
提取码:6666

点击上方网盘中自取压缩包,下载到本地后解压,解压后双击 app.exe 即可使用

dca75bfc6f985754729f28c1253f751.png

接下来只需要双击app的那个文件就可以运行了,因为这个包里已经包含了必要的组件,双击运行后会出现如下的日志,最终打印出来一个启动地址,在浏览器输入地址后就可以打开主页面了。

82cb3d6c6b91748862a2c69b4a11d51.png

然后打开一个新的浏览器输入:127.0.0.1:9966,可以看到进入到了ChatTTS界面中了

3bfcde365e7784715acb7a1dbd4482b.png

首页中上面是输入要转化的文本,下面是音色提示词以及数字转文本等参数,可以每次修改一个值尝试下效果。选择不同的音色或者音色值转化后的人语音是不一样的,需要注意的是如果文本中存在数字要勾选数字转文本,否则语音会读不准数字的发音。完成后点击立即合成声音就可以生成了,生成完毕声音会显示在下面,点击就可以播放了。

image.png

下方还提供了API调用的功能,点击生成的语音下显示API调用就可以看到调用的接口文档了。

image.png

默认地址是 http://127.0.0.1:9966,如果想修改,可打开目录下的 .env文件,将 WEB_ADDRESS=127.0.0.1:9966改为合适的ip和端口,比如修改为WEB_ADDRESS=192.168.0.10:9966以便局域网可访问

image.png

同时在日志中也可以看到对应后台数据信息,比如推理的时长、音频时长等。

image.png

可以看到以上我们成功在本地部署了ChatTTS,但是为了能实现异地或者当我们和ChatTTS不在同一个局域网也可以进行AI生成语音的工作,我们只需要借助Cpolar内网穿透工具,穿透本地ChatTTS大语言模型,就可以实现远程也可以调用,下面教大家如何安装cpolar。

2. 安装Cpolar工具

本例介绍的是windows系统,所以cpolar安装在windows上,点击下面地址访问cpolar官网,注册一个账号,然后下载并安装客户端.

Cpolar官网:https://www.cpolar.com/

  • windows系统:在官网下载安装包后,双击安装包一路默认安装即可。

cpolar安装成功后,在浏览器上访问本地9200端口【http://localhost:9200】,使用cpolar账号登录,即可看到Cpolar 管理界面,然后一切设置只需要在管理界面完成即可!

image.png

登录后,点击左侧仪表盘的隧道管理——创建隧道,创建一个ChatTTS的公网http地址隧道!

  • 隧道名称:可自定义命名,注意不要与已有的隧道名称重复
  • 协议:选择http
  • 本地地址:9966
  • 域名类型:免费选择随机域名
  • 地区:选择China Top

点击创建(点击一次创建按钮即可,不要重复点击!)

a87169da7a54c0ca834d1e32b75c348.png

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,有两种访问方式,一种是http 和https,两种都可以访问,下面选择其中一种进行远程访问,下面我们替换掉笔记中的本地地址,改为公网地址.

b24ad5360c313675f266b62e7df6b1f.png

3. 实现公网访问

使用上面的Cpolar https公网地址,在任意设备的浏览器进行访问,即可成功看到ChatTTS主界面,这样一个公网地址且可以远程访问就创建好了,使用了cpolar的公网域名,无需自己购买云服务器,即可编辑自己的日常并发布公网了!

a9837036302a21812773afc2370c80b.png
小结

如果大家需要经常异地远程来使用ChatTTS大语言模型工作,或者其他在本地部署的服务,比如个人博客站点或是私有云盘等。由于刚才创建的是随机的地址,24小时会发生变化。另外它的网址是由随机字符生成,不容易记忆。

建议把公网地址设置成固定的二级子域名,这样就不用每次都重新创建隧道来访问,下面演示一下如何创建一个固定的http公网地址来解决这个问题。

4. 配置ChatTTS固定公网地址

我们接下来为 ChatTTS 配置固定的HTTP公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。

配置固定http端口地址需要将cpolar升级到专业版套餐或以上。

登录cpolar官网,点击左侧的预留,选择保留二级子域名,设置一个二级子域名名称,点击保留,保留成功后复制保留的二级子域名名称:

b8f36844b4829c76e4f301004358bce.png
保留成功后复制保留成功的二级子域名的名称

2e8a0aee14ba9e06c699fccfad6658b.png

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道,点击右侧的编辑

image.png

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名

点击更新(注意,点击一次更新即可,不需要重复提交)

378c43aa9e914224105570436404dcf.png

更新完成后,打开在线隧道列表,此时可以看到公网地址已经发生变化,地址名称也变成了固定的二级子域名名称的域名

b4708dfed44345e61ecaeb2fff86c34.png

使用生成的公网地址访问,可以看到访问成功,这样一个ChatTTS的固定且永久不变的二级子域名公网地址就设置好了,大家可以使用这个地址随时随地异地访问ChatTTS语音大模型,来进行生成语音包 =。=~

0162a48e7ef614290c5f92d36f8b92e.png
以上就是如何在Windows本地部署ChatTTS文字转语音大模型,并结合cpolar内网穿透工具实现远程访问使用的全部流程,感谢您的观看,有任何问题欢迎留言交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/392132.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

动态规划.

目录 (一)递归到动规的一般转化方法 (二)动规解题的一般思路 1. 将原问题分解为子问题 2. 确定状态 3. 确定一些初始状态(边界状态)的值 4. 确定状态转移方程 (三)能用动规解…

【网络】HTTP协议

目录 概述 URL 结构 urlencode(URL编码) urldecode(URL解码) 工具网址 HTTP请求 请求行 请求头 请求体 HTTP响应 状态行 响应头 响应体 个人主页:东洛的克莱斯韦克-CSDN博客 概述 HTTP协议是应用层协议…

TCP 三次握手建立连接

一开始,客户端和服务端都处于 CLOSE 状态。先是服务端主动监听某个端口,处于 LISTEN 状态 1. 第一次握手 客户端会随机初始化序号(client_isn),将此序号置于 TCP 首部的「序号」字段中,同时把 SYN 标志位置…

略读ArrayList源码

ArrayList是Java集合框架中的一部分,底层是通过数组实现的,可以动态增长和缩减。 一、首先看成员变量 序列化ID定义。在Java中,如果一个类实现了Serializable接口,那么它的serialVersionUID就非常重要了。serialVersionUID用于确…

python 图片爬虫记录

感谢大家的点赞。再补充一点。 对于这个 url https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjEqB5nighYsMZE7kexaVNJfxy3OkRutNEKatksw9u5f-ckHNROLzFyx2Uty3zYWNEaeOmzsljGr3eARiDWaM9DM8G2hPuPf8uZP0NO3kNUCnM2Cjb3ZKtLhJDBwqeR4ElpJ7ID5_wIHGQ/s200 这个url最…

Python进阶 JSON数据,pyecharts制图

目录 json数据格式的转换 什么是json json本质 注意 pyecharts快速入门 画一个最简单的折线图 使用全局配置选项优化折线图 总结 json数据格式的转换 什么是json 一种轻量级的数据交换格式,可以按json指定的格式去组织和封装数据 json本质 带有特定格式的…

汇川技术|Inoproshop基本使用方法:汇川指令库、库文件

哈喽,你好啊,我是雷工! 本节熟悉了解汇川常用指令库的分类及概述,了解Inoproshop库文件; 以下为学习笔记。 01 指令简介与分类 可编程控制系统中,使CPU完成某种操作或实现某种功能的命令及多个命令的组合…

CCRC-DSA数据安全评估师:加快构建大网络安全工作格局

7月31日,第十二届ISC.AI互联网安全大会开幕式在北京国家会议中心隆重举行,本次大会以“构建大型安全防护模型,引领安全产业创新”为主题。 中央网络安全和信息化委员会办公室副主任、国家互联网信息办公室副主任王京涛出席并发表了重要讲话。…

语音平台调研

百度DuerOS开放平台 DuerOS是百度推出的对话式人工智能操作系统,即智能语音交互平台。DuerOS的技术架构包含“对话服务”和“技能框架”两大基础协议。两大协议连通起来的对话核心系统、智能设备开放平台和技能开放平台,构成了完整DuerOS的智能生态系统。…

C#初级——字典Dictionary

字典 字典是C#中的一种集合&#xff0c;它存储键值对&#xff0c;并且每个键与一个值相关联。 创建字典 Dictionary<键的类型, 值的类型> 字典名字 new Dictionary<键的类型, 值的类型>(); Dictionary<int, string> dicStudent new Dictionary<int, str…

Javascript常见算法(二)【学习】

动态规划 斐波那契数列&#xff1a; 经典的动态规划问题&#xff0c;每个数是前两个数的和。 斐波那契数列&#xff08;Fibonacci sequence&#xff09;是一个非常著名的数列&#xff0c;其中每个数是前两个数的和&#xff0c;序列以0和1开始。在JavaScript中&#xff0c;有多…

药厂子母钟系统,强抗干扰能力,满足复杂生产环境

在制药行业中&#xff0c;精确的时间同步对于确保药品生产的质量和合规性至关重要。药厂子母钟系统作为一种高度可靠的时间同步解决方案&#xff0c;不仅能够提供准确的时间信息&#xff0c;还具有强大的抗干扰能力&#xff0c;非常适合在复杂的生产环境中使用。本文将详细介绍…

[STM32]HAL库实现自己的BootLoader-BootLoader与OTA-STM32CUBEMX

目录 一、前言 二、BootLoader 三、BootLoader的实现 四、APP程序 五、效果展示 六、拓展 一、前言 听到BootLoader大家一定很熟悉&#xff0c;在很多常见的系统中都会存在BootLoader。本文将介绍BootLoader的含义和简易实现&#xff0c;建议大家学习前掌握些原理基础。 …

YOLOV8替换Lion优化器

YOLOV8替换Lion优化器 1 优化器介绍博客 参考bilibili讲解视频 论文地址&#xff1a;https://arxiv.org/abs/2302.06675 代码地址&#xff1a;https://github.com/google/automl/blob/master/lion/lion_pytorch.py """PyTorch implementation of the Lion …

C++初学(11)

不知不觉就第11篇了QWQ 11.1、指针和自由存储空间 之前提到了计算机程序在存储数据时必须跟踪的3个基本属性&#xff1a; &#xff08;1&#xff09;信息存储在何处&#xff1b; &#xff08;2&#xff09;存储的值为多少&#xff1b; &#xff08;3&#xff09;存储的信息…

未授权访问漏洞(非重点 中)

6.Hadoop 1.在 fofa 使用 port"8088" && app"Hadoop" 获取资源 2.打开后若无需登录,则存在漏洞 7.ActiveMQ 1.在 fofa 使用 body"ActiveMQ" && port"8161" 获取资源 2.打开后若点击登录,默认账户密码为 admin/adm…

【css】使用CSS绘制奥运五环--巴黎奥运

使用CSS绘制奥运五环 在2024年巴黎奥运会期间&#xff0c;本文来使用 CSS 来画一个奥运五环。奥运五环由五个相互交叠的圆环组成&#xff0c;分别代表五大洲。 奥运五环是相互连接的&#xff0c;因此在视觉上会产生重叠效果&#xff0c;这也是实现五环最有挑战性的部分 HTML结…

Rabbitmq的死信队列与如何利用死信队列实现延迟队列

如果设置了队列的 TTL 属性&#xff0c;那么一旦消息过期&#xff0c;就会被队列丢弃(如果配置了死信队列被丢到死信队列中)。而如果仅设置消息的 TTL 属性&#xff0c;即使消息过期&#xff0c;也不一定会被马上丢弃&#xff0c;因为消息是否过期是在即将投递到消费者之前判定…

HTML常用标签和CSS的运用

目录 1.HTML标签 1.1 文档结构标签 1.2 文本格式标签 1.3 列表标签 1.4 链接和媒体标签 1.5 表格标签 1.6 表单标签 1.7 分区和布局标签 1.8 元数据标签 2.css样式 2.1 字体样式 2.2 文本样式 2.3 背景样式 2.4 边框样式 2.5 间距样式 2.6 宽度和高度 2.7 显示…

AI算力租赁是什么,哪些行业会有需求?

一、AI算力租赁的定义与概述 AI算力租赁是指基于人工智能&#xff08;AI&#xff09;应用需求&#xff0c;将所需的计算能力&#xff08;即算力&#xff09;通过租赁服务的方式提供给企业和个人用户。这种服务允许用户根据需要租用人工智能计算资源&#xff0c;如图形处理单元…