ChatTTS+Python编程搞定语音报时小程序

文字转语音神器+Python编程搞定语音报时小程序

今天一个好哥们发了一个文字转语音的AI神器的短视频。这个神器的网站是[ChatTTS - Text-to-Speech for Conversational Scenarios][https://chattts.com/]，如下图所示：

Screenshot 2024-05-30 at 19.36.49

Screenshot 2024-05-30 at 19.37.24

这个开源项目可以从github.com上下载，也可以在这个网页下载。如下图所示：

Screenshot 2024-05-30 at 19.41.02

在主页上大概体验了一下，文字转语音还可以，但是有些生字（镇赉县）还是不能正常识别，比方说这个”赉“字。还有就是阿拉伯数字也不能正常识别。但是可以通过程序转成汉字，然后就可以了。言归正传，这个开源项目给我的最好的体会就是免费，于是按照上图所示的步骤，下载了源码并安装了依赖库，强调一下，这个源码运行环境在Anaconda下可以，PyCharm我的电脑不能运行，报错。

我首先想到的是利用这个API编一个语音报时的小程序，之前我编了一个万年历，这回可以实现语音播报了。我首先实现一个简单的报时小程序。

下载之后的源码文件夹拷贝到你指定的目录下面，然后进入Anaconda的Jupyter-Notebook下，打开

上面说到了，阿拉伯数字是不能准确识别的。但是用datetime模块生成的时间或者日期都是阿拉伯数字，必须转成汉字才可以利用这个开源模块实现语音播报。

环境

操作系统：macOS Sonoma

开发环境：Anaconda+Python 3.11

源码如下：

import torch
import ChatTTS
from IPython.display import Audio
import datetimechat = ChatTTS.Chat()
chat.load_models()# 定义一个类
class PeriodDay:def __init__(self):self.now = datetime.datetime.now()def get_time_of_day(self):if self.now.hour < 12:return "上午"elif 12 <= self.now.hour < 18:return "下午"else:return "晚上"# 定义一个时间转成汉字的函数def format_time_final(self):hour, minute = self.now.strftime('%H:%M').split(':')if int(minute) == 0:minute = '整'elif int(minute) < 10:minute = '零' + number_to_chinese(int(minute)) + '分'elif int(minute) < 20:minute = number_to_chinese(int(minute))[1:] + '分'else:minute = number_to_chinese(int(minute)) + '分'if 10 <= int(hour) < 20:hour = number_to_chinese(int(hour))[1:] + '时'return f'{hour} {minute}'else:return f'{number_to_chinese(int(hour))[:]}时 {minute}'def get_month_day(self):month = number_to_chinese(self.now.month)day = number_to_chinese(self.now.day)return month, day# 定义一个返回星期几的函数def get_weekday(self):date = self.now.strftime('%Y-%m-%d')# 将日期转换为datetime对象datetime_obj = datetime.datetime.strptime(date, '%Y-%m-%d')# 获取星期几的数字（0代表星期日，1代表星期一，...，6代表星期六）weekday = datetime_obj.strftime('%w')# 将星期几数字转换为中文星期几weekdays = ['星期日', '星期一', '星期二', '星期三', '星期四', '星期五', '星期六']weekday_cn = weekdays[int(weekday)return weekday_cn# 定义一个数字转成汉字的函数
def number_to_chinese(number):units = ['', '十']digits = ['零', '一', '二', '三', '四', '五', '六', '七', '八', '九']if number == 0:return '零'result = ''digit_count = 0last_zero = Truewhile number > 0:digit = number % 10number //= 10if digit == 0:result = digits[number] + '十'breakif digit != 0:if last_zero:result = digits[digit] + resultelse:result = digits[digit] + units[digit_count] + resultlast_zero = Falseelse:if not last_zero:result = digits[digit] + resultlast_zero = Truedigit_count += 1return result# 实例化一个早中晚的对象
morning_noon_evening = PeriodDay()
# 获取当前的时段
time_of_day = morning_noon_evening.get_time_of_day()# 利用当前时间提取月，日，时，分
month, day = morning_noon_evening.get_month_day()
# 将时：分转成汉字
text_time = morning_noon_evening.format_time_final()
# 要报时的文字
time_text = f"{time_of_day}好，现在是{month}月{day}日 {week_day}  北京时间{text_time}。在干嘛？"
# 定义一个转成语音的文字列表变量
texts = [time_text]
print(time_text)
# 生成语音
wavs = chat.infer(texts, use_decoder=True)# 播放语音
Audio(wavs[0], rate=24_000, autoplay=True)

运行效果如下：

INFO:ChatTTS.core:All initialized.
下午好，现在是五月三十一日 星期五  北京时间十四时 一十一分。在干嘛？10%|████▏                                     | 38/384 [00:00<00:09, 38.29it/s]15%|██████                                  | 309/2048 [00:05<00:32, 53.73it/s]