谷歌文本转语音(gtts)批量转换

  • 1. 测试环境
  • 2. 谷歌云平台注册
  • 3. gtts 使用
    • 3.1. 基本介绍
    • 3.2. 准备工作
    • 3.3. 本地环境变量设置
    • 3.4. 安装python包
  • 4. 测试

最近工作中要将文本转换成多国语音,试了下gtts,效果不错,来记录下

1. 测试环境

项目版本
操作系统Ubuntu20.04
python3.8
Google Cloud Platform试用版

注意:
1、由于需要试用谷歌云平台,所以需要能够访问谷歌的方法,在此不在赘述


2、为了申请谷歌云平台账号,需要拥有VISA信用卡或者PayPal账号,用于注册时的验证

2. 谷歌云平台注册

点击谷歌云平台,转到谷歌云平台,申请账号,注册流程按照提示来就可以,但是必须要有前文提到的东西,注册成功后,会有90天的免费体验时间。

在这里插入图片描述

3. gtts 使用

3.1. 基本介绍

gtts(google text to speech)使用由 Google 的 AI 技术提供支持的 API 将文字转换为自然而逼真的语音。可以在这个页面看到一些官方的使用文档,本文也在该文档指导下进行。

在这里插入图片描述

3.2. 准备工作

从基本介绍可以看出,gtts是通过API调用的方式实现的,因此我们必须先启用谷歌云平台中的gtts api功能。为了能够成功开启该功能,具体操作步骤如下:

  1. 登录到云控制台,新建一个项目,这里设置名字为txt2wav

    在这里插入图片描述

  2. 确认待使用项目已启用结算选项。这个是谷歌收费的,当前我们是免费使用期间,正常跳转到结算页后,是能找到我的结算账号的,如果出现没有结算账号的情况,按照这里的说明进行操作。

    在这里插入图片描述

  3. 开启gtts API。在产品搜索框内输入speech,进行搜索,并打开 Cloud Text-to-Speech API 页面,之后选择启用 API。注意该操作是启用当前激活项目的 gtts API(Google Cloud Platform后面显示的即为当前激活项目)。

    在这里插入图片描述

  4. 创建服务账号。必须通过服务账号才能访问 API,相当于认证,创建一个服务账号,可选项都可不填。注意该操作是在当前激活项目中创建服务账号(Google Cloud Platform后面显示的即为当前激活项目)。

    在这里插入图片描述

  5. 创建完成后,点击服务账号的电子邮件信息,会打开配置页面,添加新密钥,正常添加即可,最后会选择密钥格式,这里选择json格式并进行下载。

    在这里插入图片描述

3.3. 本地环境变量设置

  1. 设置用于身份验证的本地环境变量。本地每次调用 API 时,都会使用该变量指向的密钥进行身份认证,具体命令如下,将该命令添加到~/.bashrc中,并将KEYPATH换成你的密钥存储位置,具体到文件本身如/home/rsa/aaa.json
export GOOGLE_APPLICATION_CREDENTIALS="${KEY_PATH}"

3.4. 安装python包

本次测试使用的是系统自带的python3.8,也可以使用虚拟环境,使用以下指令安装gtts的python包。

pip3 install --upgrade google-cloud-texttospeech

4. 测试

注意:测试过程中,要保证能够正常访问谷歌。

  1. 本次测试样例的功能为:读取txt内文本信息,转换为语音后,保存。文本内格式如下,每一行由保存文件名称和待转换文字组成,如第一行,将会将i love you转换为语音,并保存为iloveyou.wav

    在这里插入图片描述

  2. 测试源码如下,部分代码进行了注释,gtts转换后的音频够实现指定采样率、通道、格式等信息,具体API使用手册参见这里

    #!/bin/env pythonfrom google.cloud import texttospeech
    import waveclient = texttospeech.TextToSpeechClient()voice = texttospeech.VoiceSelectionParams(```转换的语言码 en-US 代表美国,支持的语言查看 https://cloud.google.com/text-to-speech/docs/voices```language_code="en-US", ```语音播报性别选择```ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
    )audio_config = texttospeech.AudioConfig(```输出语音文件的编码方式,可以选择mp3、wav(LINEAR16)等```audio_encoding=texttospeech.AudioEncoding.LINEAR16,```输出语音文件的采样率```sample_rate_hertz = 8000
    )index = 0
    filenames = []
    with open("test.txt", "r") as f:for line in f.readlines():line = line.strip('\n')filename, text = line.split(",", 1)filename = filename.strip(" ")filenames.append(filename)text = text.strip(" ")synthesis_input = texttospeech.SynthesisInput(text=text)response = client.synthesize_speech(input=synthesis_input, voice=voice, audio_config=audio_config)with open(filename, "wb") as out:out.write(response.audio_content)out.close()f.close()
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37832.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI 换脸冒充明星直播带货:仅需 3.5 万元,随意“换脸”

昨日央视财经曝光了一些直播间使用 AI 换脸技术,冒充明星进行直播带货的现象。据悉,这种 AI 换脸技术可以在几个小时内完成,只需花费 3.5 万元就可以购买一套实时换脸的模型,可以随意替换素材,AI 实时换脸,…

【干货】2023直播电商带货playbook:违禁行为及用词指南.pdf(附下载链接)

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年4月份热门报告合集 万字干货:ChatGPT的工作原理 无需翻墙,ChatGPT直接使用 2023年创业(有创业想法)必读手册 ChatGPT调…

AIGC风起,直播带货江湖剧变?

文|螳螂观察 作者| 图霖 “24小时不间断直播,你一个人怎么做到的?” 在芒果TV新推出的综艺《女子推理社》第一案里,嘉宾对拿到直播销冠的NPC提出了疑问。 后来,众人通过查找线索找到了答案:公司另找了两人整容成销…

python虚拟数字人直播间带货

本开源项目名为“数字人控制器”。意为,本项目可以充当时下流行的虚拟人、虚拟主播、数字人,等仿人形数字形象的内核部分。 ​ 使用UE、C4D、DAZ、LIVE2D等三维引擎软件开发的数字形象可以与本“数字人控制器”对接,从而实现虚拟主播、数字导…

怎么用Elai智能数字人来直播带货?

随着直播带货的火爆,越来越多的商家和品牌想要借助这一新兴的营销方式来提升销量和品牌影响力。但是,直播带货也面临着一些挑战,比如真人主播的成本高、稳定性差、风险大等。那么,有没有一种更好的解决方案呢?Elai智能…

AifbdScore智能AI曲谱乐谱播放识别SDK midi曲谱 应用开发 五线谱 六线谱 四线谱播放

【功能介绍】 会发声的曲谱 移调或改变谱号内置合成器可以在选定节拍速度下播放全部或是单一范例乐器。 访问曲谱的图形音乐信息全部演奏数据使用迭代器获取已排序的小节和音符,包含MIDI音高、毫秒计时的开始和音长、节拍速度、拍号等等,小节被正确排序…

全民K歌下载伴奏(tkm格式转化)

已《キセキ》为例 1.在全民K歌选择自己想要的伴奏,只要加载好了之后就可以找到缓存文件。 2.在手机找到缓存 3.如图,图中两个tkm格式文件一个是原版,一个是伴奏。接下来就是转换格式问题。 4.根据我经验,au不支持tkm格式&#xf…

tt作曲家简谱打谱软件_掌握作曲家的技巧和窍门

tt作曲家简谱打谱软件 Composer has revolutionized package management in PHP. It upped the reusability game and helped PHP developers all over the world generate framework agnostic, fully shareable code. But few people ever go beyond the basics, so this post…

html5 midi,源码:MIDI 文件生成音乐乐谱(Midi To Sheet Music)

MIDI 文件生成音乐乐谱 资源下载此资源下载价格为2D币,请先登录 资源文件列表 MidiToSheetMusic-master/LICENSE.txt , 18520 MidiToSheetMusic-master/Makefile , 1181 MidiToSheetMusic-master/README.md , 1129 MidiToSheetMusic-master/img/NotePair.ico , 26918 MidiToSh…

android切换原唱伴唱,切换伴奏和原声/设置KTV播放列表

三、 灵活切换伴奏和原声 当酷我音乐盒开始播放歌曲的KTV后,切换到“正在播放”窗口就可以欣赏到原版的KTV画面了,默认情况下播放的是原人原唱。如果要切换到伴奏声道,唱卡拉OK时,在播放窗口下方有一个“伴唱”按钮,点…

Guitar Pro8.0.1吉他制谱打谱软件

Guitar Pro是一款专业的吉他编曲、打谱软件,Guitar pro的特点是它几乎涵盖了所有的乐谱形式,包括四线谱、五线谱、六线谱等等,最新的Guitar Pro8.1版本还新增了简谱,我们可以在GuitarPro8.1中使用简谱进行演奏。Guitar pro支持在制…

在线乐谱协作编辑器composing.studio

什么是 composing.studio ? composing.studio 是使用 Rust、WebAssembly 和 TypeScript 构建的在线实时协作音乐编辑器,采用了 ABC 记谱法,允许任何人创建简单的音乐作品,具有即时乐谱渲染和实时音频播放。任何人都可以通过创建一…

【高效便捷】乐谱格式转换器,让你的曲谱全都在线!

如果你是一位音乐人,那么一定会遇到需要在不同终端或软件之间转换乐谱格式的情况。乐谱格式转换器作为一款桌面端软件,支持各种乐谱格式之间的互转,而且它还有以下特点: 1.超全功能:乐谱格式转换器是一款图形化界面的…

通过线路输入功能快速创建吉他谱

通过线路输入功能快速创建吉他谱 关键词:GTP;吉他软件 Guitar Pro 是一款功能强大的乐谱演奏和制作神器,它能帮助我们学习和演奏歌曲,提高弹唱技术,为我们喜欢的歌曲制作伴奏等等。它有多种方式供我们制作曲谱&#…

AI智能曲谱识别|乐谱识别识音SDK|人声数拍SDK|智能钢琴、MIDI音乐、打谱、曲谱乐谱播放识别SDK、音序器、合成器、播放器软件

智域智联科技致力于用“智能化教学 音乐软件模块”及“在线教育AiScore 平台”赋能传统音乐教育,使音乐教 育机构智能化教育转型成为可能。 AifbdScore是一个跨平台的声音识别和评 测库,运用人工智能深度学习算法采集各 种乐器不同音高的时域、频域特征训…

Overture打谱软件免费安装下载版介绍

现在市面上的打谱软件越来越多,选择哪一个成为了最头疼的问题。一千个人心中有一千个个哈姆雷特。我们只有根据自己的需求,通过多方面的比较才能选出最适合自己的那一个。 Overture (一)排版 我们打开一份MIDI格式乐谱 这是没有…

只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声

整理:Just 出品:AI科技大本营(ID:rgznai100) 疫情期间,在家待着闲来无事,一些技术人员就喜欢以技术的方式找点乐子,顺带赚钱最好了。 将歌曲中的人声和乐器声分离是一件让想使用音乐伴奏的人头疼…

【音乐生成】乐谱生成

文章目录 介绍与研究动机数据集方法实验结果 介绍与研究动机 论文链接:AN EXPLORATION OF GENERATING SHEET MUSIC IMAGES 传统的音乐生成任务的输出格式以MIDI、WAV为主,本文研究的格式却是乐谱,那么乐谱形式的音乐相较MIDI格式的音乐有哪些…

宠物喂食器,基于涂鸦智能的解决方案

宠物喂食器,基于涂鸦智能的解决方案 作品描述作品介绍硬件部分软件部分 开发流程代码编写1. 产品创建2. MCU SDK 移植3. 时间系统实现4. 快速喂食功能实现5. 余粮检测功能6. 已出粮剩余量检测功能7. 计划喂食功能实现8. 手动喂食功能实现9. 小夜灯功能实现10. 语音控…

读书笔记——《2001太空漫游》

阿瑟克拉克神作,任何一个科幻迷都绕不开的一部作品。很早就听说过其大名,因为之前看过电影版的,总感觉少了点新鲜感,这本书就一直在书架上没有拿出来看。但是看过这本书后,我可以很负责任的说,全书都充满新…