MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)

声明

  • 本工具是个免费工具,遇到问题,还请自行解决,下面有文字教程,B站有视频教程(链接在文章末尾);

  • 其次,微软接口卡顿,连接超时等问题下方有详细说明,请仔细看一下;

  • 再次,强制升级是为了统一版本方便问题的收集与解决,如果你能理解最好,不能理解的话,那建议你还是不要用了,强扭的瓜不可能甜!

前言

微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具;

目前,MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了,当然,有什么好的意见建议可以继续留言告知(提示:少数人需要的特殊功能不在此范围,真有需要可联系定制)。

当前版本:v1.9.6.3

Bug反馈

遇到问题请先更新到最新版本试试!如果还是解决不了,请在公众号回复:加群,添加Q群后,提供触发Bug的具体场景,以便跟踪修复,感谢有你!


使用说明(以下内容请仔细阅读)

1、下载的压缩包记得先解压缩,再使用!!!

2、解压后运行主程序 MS-TTS.exe(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)

3、软件界面

3.1 接口设置

左侧最上方为TTS接口选项,当前软件支持 微软Edge 两大接口,优缺点如下:

微软Edge
角色个性化设置支持不支持
稳定性不稳定较稳定
合成速度一般
WAV格式支持不支持

接口下方代理选项专为微软接口设置,原因就是因为微软TTS服务器网络非常不稳定,如果一定要使用微软接口,有条件的话就可以使用http代理,如果没条件且又一定要使用微软接口的话,建议在01:00-11:00时间段使用,连接稳定性及合成速度相对会好一些!

3.2 选项

合成音频保存质量选项,微软接口mp3、wav两种格式都支持,Edge只支持保存mp3格式;

3.3 角色

语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)

语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择

风格:角色的说话语气风格

角色:这个角色一般是指角色的年龄段(实际使用效果不明显,且只有少部分角色支持)

语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢

音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低

添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)

3.4 简单模式-中小文本

主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义

在编辑区域点击鼠标右键,会弹出右键菜单

  • 粘贴:将复制好的文本内容粘贴到编辑区域

  • 清空:清空编辑区域所有内容

  • 插入间隔:在光标所以位置插入间隔标记,后面在进行语音合成时,将会在指定位置按照设置好的间隔时间进行停顿

  • 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

3.5 简单模式-超长文本

在表格区域点击鼠标右键,会弹出右键菜单:

  • 导入:导入需要进行tts合成的txt文本文件

    • 导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)

    • 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过

  • 清空:清空列表

  • 也可以直接选中多个txt文本文件,拖动到软件界面完成导入

3.6 SSML

SSML:是一种基于XML的语音合成标记语言,此功能一般只用于需要深度自定义的场景,使用SSML一定要按照其规定的语法及命令,否则将无法合成(命令语法错一个字母都不行),具体可点击右上方绿色文字,跳转到官方SSML文档进行学习。

SSML:主体内容不能超过2500字符(微软官方有限制)

3.7 软件设置

  • 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)

  • 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件

  • 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 路径检测显示YES表示路径正常,可正常进行音频合并

  • 保存配置:将各项设置内容保存至配置文件(./Nconfig.ini)

注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。

4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

将需要自动替换的内容按照: 原始内容,替换内容 的格式一行一条,写入“dict.txt”词典文件保存即可,如下:

5、试听合成

5.1 试听

提供最长不超过150字符内容的角色声音试听,多角色只试听第一段内容

5.2 合成

按照设置好的角色对指定内容进行TTS语音合成

5.3 停止

停止正在进行的任务

软件报病毒

软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:如果不放心请勿使用,谢谢!!!

视频教程

视频为1.9.3版本视频,多数操作相同

https://www.bilibili.com/video/BV1wg411k7SH/

下载地址

前往下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16422.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某团mtgsig逆向学习

声明&#xff1a;本文仅限学习交流使用&#xff0c;禁止用于非法用途、商业活动等。否则后果自负。如有侵权&#xff0c;请告知删除&#xff0c;谢谢&#xff01;本教程也没有专门针对某个网站而编写&#xff0c;单纯的技术研究 目录 案例分析参数分析效果展示 案例分析 目标案…

高通量代谢组学四路筛选法,揭秘“神药”二甲双胍延长寿命的机制

百趣代谢组学分享—研究背景 目前据统计中国糖尿病患者人数达9700万以上&#xff0c;数量达到世界第一。这其中2型糖尿病占到了90%以上。二甲双胍是目前治疗2型糖尿病的一线“明星”药物&#xff0c;因其较少出现低血糖和体重增加副作用而受到广大患者和医生的青睐。代谢组学文…

推荐:ChatGPT指令大全(37个)

使用时&#xff0c;可参考这些语境。会问问题&#xff0c;才是最重要的。 AGI 时代必备&#xff1a;《提问的艺术——让ChatGPT导出高质量答案》38 赞同 7 评论文章 1. 写报告&#xff1a;我现在正在 [报告的情境与目的]。我的简报主题是 [主题]&#xff0c;请提供 [数字] 种…

启蒙教师周志华亲自讲解,机器学习视频课上线了

主讲&#xff1a;周志华&#xff0c;南京大学教授 人工智能从1956年正式成为一个学科&#xff0c;机器学习是人工智能的核心研究领域之一。今天的“人工智能热潮”正是由于机器学习等技术取得了巨大进展&#xff0c;并基于大数据、大算力发挥出巨大威力。 《机器学习初步》课…

斯坦福| ChatGPT用于生成式搜索引擎的可行性

文&#xff5c;智商掉了一地 随着 ChatGPT 在文本生成领域迈出了重要一步&#xff0c;Bing 浏览器也接入了聊天机器人功能&#xff0c;因此如何保证 Bing Chat 等搜索引擎结果的精确率和真实性也成为了搜索领域的热门话题之一。 当我们使用搜索引擎时&#xff0c;往往希望搜索结…

ChatGPT应用-ArxivGPT谷歌插件 解放正在苦苦读论文的你

一句话介绍 总结arXiv中论文的关键点&#xff0c;并提供重要见解 详细介绍 ArxivGPT是一个谷歌Chrome插件&#xff0c;可帮助您快速了解arXiv论文的内容。只需单击一下&#xff0c;即可总结论文并提供关键见解&#xff0c;节省您的时间并帮助您快速掌握主要思想和概念。无论…

【ChatGPT】【Sloved】Access denied,Error reference number: 1020

问题描述 You do not have access to chat.openai.com. The site owner may have set restrictions that prevent you from accessing the site. Ray ID: 7b25a4dfce2a985bTimestamp: 2023-04-04 01:05:37 UTCYour IP address: 2602:feda:dd7:a0ba:4166:9982:e009:2e35Reque…

旋律生成学习日记(一)

123因为自己做音频方向&#xff0c;偶然看见了旋律生成这个东西&#xff0c;就想自己学着做一做&#xff0c;网上现有文章不多&#xff0c;我自己瞎琢磨琢磨。 第一章转自&#xff1a;(64条消息) 基于深度学习LSTM算法生成音乐_lstm生成音乐_lbship的博客-CSDN博客 MID数据集…

国内唯一可以在本地搭建Stable Diffusion WebUI教程-安装时无需魔法安装全程流畅到尖叫

Stable Diffusion是什么 Stable Diffusion简称SD是一款Ai图片生成工具。“输入几句话,生成精美图片。” 比如说我一开头这幅图片就是用的SD生成的。 我在我的“ChatGPT让我变成了“超人”-如何提升团队30%效能质量提高100%的阶段性总结报告”里提到过midjourney,但是midjou…

电子表格软件的开山鼻祖 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 5 月 11 日&#xff0c;在 1995 年的今天&#xff0c;我国成为第六个研制成功磁悬浮列车的国家。磁悬浮列车利用“同性相斥&#xff0c;异性相吸”的原理&#…

行业报告 | AIGC发展研究

原创 | 文 BFT机器人 01 技术篇 深度学习进化史:知识变轨 风起云涌 已发生的关键步骤&#xff1a; 人工神经网络的诞生 反向传播算法的提出 GPU的使用 大数据的出现 预训练和迁移学习 生成对抗网络 (GAN) 的发明 强化学习的成功应用 自然语言处理的突破 即将发生的关键…

手把手带你快速实现直播聊天室

废话不多说&#xff0c;直接开干&#xff01; 工具要求&#xff1a; (1) Android Studio 3.2或更高版本。 (2) SDK targetVersion至少为26。 本文聊天室是集成环信IM SDK实现聊天功能&#xff0c;及实现发送礼物、点赞和弹幕等功能。视频直播采用的是七牛相关的推拉流SDK。app …

地摊叫卖、超市播音工具-简洁的文字转语音播音软件

简介&#xff1a; 文件名称 : 播音员.exe 文件大小 : 0.5MB (568KB) 文件类型 : application/x-dosexec 运行平台 : Windows7 / Windows10 软件功能 : 自定义语录文字、图片&#xff0c;快捷发送聊天 软件特色 : 无需安装、永久免费、无自启、无广告 关于软件&#xff1a; 1、…

海威超市播音易源码+成品

介绍&#xff1a; 源码介绍&#xff1a; 目前一直在用的超市播音软件&#xff0c;送给不会编程的人&#xff0c;下载后打开直接可用&#xff01; 会编程的人&#xff0c;可以修改后使用&#xff01; 网盘下载地址&#xff1a; http://kekewangLuo.cc/VM4aIepRMTH 图片&#x…

养成这个好习惯,让播音主持成为你的加分项

我们都知道&#xff0c;习惯的力量是很大的&#xff0c;我们只有在日常生活中养成一个良好的习惯&#xff0c;才能为我们的学习“添砖加瓦”。 养成下面四个习惯&#xff0c;可以让学习播音主持的你在学习和考试中都会加分哦! 科学用声和护嗓 对于播音主持专业的学生来说&…

内容创业洗稿,知识付费拆书

作者&#xff1a; 深几度 来源&#xff1a; https://mp.weixin.qq.com/s/WXGURnbutf1BUV54ytuzjw 罗振宇又因为跨年演讲的问题成为众矢之的了&#xff0c;顺带着他的得到APP知识付费模式再一次被拖出来&#xff0c;被人批判了一番。 批判知识付费的理由已经屡见不鲜。此前公众号…

518超市播音软件如何放大音量到150的,传统播音软件声音太小(0-100)

518超市播音软件&#xff08;http://www.518boyin.com/&#xff09;最新版6.2 支持放大语音音量&#xff0c;最多可放大150%&#xff0c;而传统的播音软件声音太小。就是说播放音乐的时候音量挺大&#xff0c;到播放语音就感觉音量降低了很多。这可能是由于讲话天然没有歌曲喊的…

基于STM32的录音与播音

基于STM32的录音与播音 设计方案 本设计通过STM32的内置ADC加一个麦克风和放大电路&#xff08;可以在网上买模块&#xff09;实现音频的采集&#xff0c;然后存放在SD卡中&#xff08;这里可以参考我之前的博客FATFS文件系统&#xff09;&#xff0c;然后再读取SD卡里存放的…

海威超市播音源码+成品

源码介绍&#xff1a; 目前一直在用的超市播音软件&#xff0c;送给不会编程的人&#xff0c;下载后打开直接可用&#xff01;会编程的人&#xff0c;可以修改后使用&#xff01; 网盘下载地址&#xff1a; http://www.bytepan.com/8sfiNvAioAc 图片&#xff1a;

基于WASAPI的录音播音系统

最近写了一个小的系统&#xff0c;在VS2022平台上做的&#xff0c;主要是通过调用Windows的API接口实现录音&#xff08;PCM格式&#xff09;&#xff0c;播音&#xff08;PCM、WAV、Mp3格式&#xff09;&#xff0c;PCM格式转WAV格式、遍历指定文件夹下的所有音频文件并播放。…