Edge-TTS 语音朗读

基于微软edgeTTS开发的语音朗读转MP3软件,支持实时MP3转换,支持角色朗读, 支持在线网页浏览,支持全文转成MP3, 从光标处转成mp3, 选择内容转成mp3.,支持剪切板转成MP3.,

支持合并对话所生成的MP3为一个文件,支持升级合成声音转成立体高质量声音文件,支音频文件音量增益2倍(因源声音音量较小),支持内置播放器即转即听,支持删除空行,支持右键选择单独MP3调用内置播放器播放。

支持一键制作中高考英语听力 测试文件,支持一键生成中高考听力原文静音、叮咚声自动添加。

支持一键选择内容复读2-3次,支持一键按段或行复读2-3次。

本软件仅供人个研究测试使用。不得用于商用。

如何用浩读系列软件Edge-TTS一键生成制作中高考听力测试文件

如何用浩读系列软件Edge-TTS调用微软神经网络自然语音库制作英语高考听力测试声音文件

微软Edge-TTS神经网络自然语音合成MP3

相关下载: 浩读--语音朗读助学软件----专业外语学习一体化语音朗读软件

 

 

 

F: 第一部分:MS Edge-TTS 合成MP3简要介绍:
M: MS Edge-TTS 合成MP3是一个文本到语音朗读合成MP3的实用工具,它借助Pypi Edge-tts 模块调用微软Azure神经网络语音朗读服务进行相关文本到语音(简称TTS)的语音合成,就目前来说,Azure神经网络语音朗读目前最近人声朗读,有些场景已很难分辨出是机器合成语音,借助微软Azure神经网络语音朗读服务,可以用来配音,可以制作电子书,朗读文章,辅助教学及学习,可以编辑制作类似中考或高考听力测试音频文件,可以为教学PPT或短视频配音等。
F: 本应用同屏窗格有:
M: 普通文本窗格:主要处理不带角色普通的文本,主要是面对文章、小说、长篇文本。
F: 对话文本窗格:主要处理带有角色朗读的文本,软件可以处理同时带有8个角色的文本合成MP3,如制作类似中考或高考听力测试音频文件。
M: 网络浏览窗格:内置简易浏览器,方便浏览使用网络资源,选定内容合成MP3或复制内容转成MP3.
F: MP3合并窗格:主要处理带角色对话文本,软件会根据事先设定的角色 与相对应的语音库按段把对话文本转生成Mp3,并可以选择合并成一个声音文件,合并后声音文件可以选择转成立体声,  可以选择提升立体声音量,可以在任意段对话声音文件加入静音:有2秒、3秒、5秒、10秒、20秒、30秒的选择。
M: 在编辑功能中,软件设计的编辑功能有:
F: 打开,新建,保存,另存为,撤消,重做,复制,剪切,粘贴,全选,全清空,字体大小,空行删除,全文自动分解成单句,
M: 对话制作右键菜单添加了特色菜单: 
F: ABAB角色批量自动添加,
M: ABCABC角色批量自动添加,
F: 回车自动ABAB角色自动添加,
M: 回车自动ABCABC角色自动添加。
F: 在一键转成MP3功能中,软件设计了:
M: 全文合成MP3,选择内容合成MP3,从光标处合成MP3,剪切版合成MP3,支持全功能对话合成MP3,支持同时带8个角色的对话文本合成MP3。满足不同需求。
F: 第二部分:演示普通文本合成MP3:
M: 第一步: 首先选择文本输入途径:
F: 1. 直接复制文本粘贴到文本编辑框。
M: 2. 右键打开文本。
F: 3. 手工输入。
M: 第二步,选择朗读人。在下面朗读人选择下拉菜单选择合适的语音库。
F: 语音库1是英语、中文、日文的集合。
M: 语音库2是全球主流语言的语音库,共计100多种语言近200多个语音库。
F: 用户可以选择语音库1或2下拉菜单来选择朗读人,语音库1只是方便英语、日语及中文的选择,选择的语音库是最终确定下来的朗读人。
M: 第三步,点合成MP3. 
F: 如果您想全篇文章合成MP3,就点击全文合成MP3按钮。
M: 如果您只是想选择部分文本转成MP3, 就点击选择合成MP3按钮。
F: 如果您只是想从光标处后的文本转成MP3, 就点击从这合成MP3按钮。
M: 如果您只想复制内容转成MP3, 就点击剪切板合成MP3按钮。剪切板内容不局限本应用内的内容,可以是任意资源的文本复制内容,比如office中的word文档,网页文本内容,文本编辑软件中的文本、QQ或微对话框的文本内容等。
F: 第三部分:演示多角色的文本合成MP3:
M: 我们先来认识一下角色文本的基本的格式,文本格式要求每个角色所叙述的内容,不管叙述多长,包含有多少个句子,都要整理成一个段落。段落与段落之间不能有空行。段落首行不要有空格,段落首行要顶格。
F: 本应用最多可以处理带有8个角色的对话文本。其实也是可以设计有更多的角色,但实际应用中,很少有超过5个的。中高考的听力包括中文朗读也就3个角色,四六级,考研考博的英语听力也就是三个英语及一个中文共4个角色。超过8个角色的对话没太多的实际应用。
M: 第一步: 首先选择文本输入途径:
F: 1. 直接复制文本粘贴到文本编辑框。
M: 2. 右键打开文本。
F: 3. 手工输入。
M: 第二步:根据文本的角色设置相应的朗读人。
F: 文本的角色最好替换成本软件已设置好的8个角色,这样会高效点。
M: 如是手工输入,您可以按需要打勾菜单中的回车双角色添加,只要回车,它会自动添加一个角色,您自行添加内容。三角色操作也是一样。
F: 如果不想输入角色也可以,就先按段落把每个角色所叙述的内容输入到文本框中,输入内容后,点击右键全选, 点击右键菜单按ABAB添加角色菜单,如是三个角色,可以点击菜单按ABCABC添加角色菜单,即可以完成角色输入。
M: 角色的朗读人自己根据爱好及需要在相对应的下拉菜单确定语音库。以最后选择的语音为最终的确定的语音库为准。
F: 第三步,选择合成MP3.
M: 如果您想全篇文章合成MP3,就点击全文合成MP3按钮。
F: 如果您只是想选择部分文本转成MP3, 就点击选择合成MP3按钮。
M: 如果您只是想从光标处后的文本转成MP3, 就点击从这合成MP3按钮。
F: 如果您只想复制内容转成MP3, 就点击剪切板合成MP3按钮。剪切板内容仅局限于本文本框内的内容。如果不是本文本框内容的,请保存好本文本框内容后,粘贴外部文本内容到本文本框内才进行相应剪切板转成MP3操作。
M: 第四部分:对话MP3合成操作演示及说明。
F: 合并好后的对话声音文件是按段落生成的独立的声音文件, 在实际操作中,一般是需要把它们合并成一个声音文件。
M: 第一步,选清除上一次合成的的MP3。 合成的MP3一般是过渡的声音文件,第一个是单声道的,第二个是立体的,但音量较小。如不清除在下一次的操作中也会清除。
F: 点击显示对话MP3按钮,你可以看到左边的文本框会显示出全部按段落生成单独MP3。
M: 点击合并MP3, 立即合成成一个声音文件,点击显示对话,会在右上文本框中显示出合并好的声音文件,此时的声音文件是单声道的。
F: 点击转成立体声音,点击显示对话,会在右上文本框中显示出转化好的立体声音文件,此时的声音文件是音量较小,因源声音文件的限制。
M: 点击转成立体声增益2倍,点击显示对话,会在右下框显示出立体声增益2倍的声音文件, 此时的声音文件音量会提升。
F: 如果普通文本的声音,就只按顺序点击右下的两个按钮,一个是单独文本MP3被转立体声和单独文本MP3音量增益2倍。
M:第五部分,关于静音添加问题。
F: 特别说明一下静音的添加,因有些场景的需要,有些要求在对话后要有停顿,这时,就要添加静音. 
注意,对话文本可以先分段合成MP3,也可以先添加静音MP3。
第一步, 在文本中找到你要想添加静音的段落末,比如:
W: Text 1,  
W: Jack, are you going camping with your friends this weekend?
M: It depends. If it’s sunny, we’ll go.
W: The weatherman says it’s going to rain.
M: In that case, we’ll go to the cinema instead.
Q: Text 2,  
W: Excuse me, could you mind my bags for a moment? I want to buy some food at the convenience store.
M: No problem. But be quick. It was announced that my train will arrive in 10 minutes.
F: 我们想在对话1与2之间加入停顿10秒以便让学生做题,这时就可以点右键, 打开静音子菜单“1-10S” 或“20-60S” , 找到“10S”, 单击, 这时,文本就标注如下:
Q: Text 1,  
W: Jack, are you going camping with your friends this weekend?
M: It depends. If it’s sunny, we’ll go.
W: The weatherman says it’s going to rain.
M: In that case, we’ll go to the cinema instead.  @10
Q: Text 2,  
W: Excuse me, could you mind my bags for a moment? I want to buy some food at the convenience store.
M: No problem. But be quick. It was announced that my train will arrive in 10 minutes.
第二步, 点右键, 单击“段末批量静音MP3”,这时已完成静音任务。 
如果要加入叮咚声提醒声,也是重复一样的操作如:
Q: Text 1,  
W: Jack, are you going camping with your friends this weekend?
M: It depends. If it’s sunny, we’ll go.
W: The weatherman says it’s going to rain.
M: In that case, we’ll go to the cinema instead.  @10 @DD 
Q: Text 2,  
W: Excuse me, could you mind my bags for a moment? I want to buy some food at the convenience store.
M: No problem. But be quick. It was announced that my train will arrive in 10 minutes
单击“段末批量静音MP3”,这时已完成静音及叮咚任务。 可以同时处理静音和叮咚声音的代码生成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44822.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软TTS语音引擎实现文本朗读

科大讯飞和neospeech tts哪个更好 朋友们或许还有一个疑问,就是不知道科大讯飞和neospeech哪个更好。据我的体会,它们其实各有优点。 科大讯飞有几个语音库,比如小宇、小燕、还有一个粤语和英语的;而neospeech则有lily、liang、h…

好物推荐:文字转语音朗读软件哪个好?

不知道大家有没有像我一样的,对“语音播放”、“语音朗读”是又爱又恨的。有时工作繁忙,而同事或客户发来语音资料需要整理时,就会很烦躁,因为语音的整理起来比文字的繁琐一些。而像有时在家休息,还得看一些资料时&…

分享5个宝藏文字转语音配音软件,错过太可惜

经常看到有人问如何将文字转成语音,以及配音软件?什么样的配音工具可以做到堪比真人?文字转语音操作起来难不难?新手小白不会用怎么配音呢? 在测试了几十款款文字转语音工具后,最终给选出了下面这5款超好用…

文字转语音朗读如何操作?手把手教你如何将文字转语音

有些小伙伴喜欢在闲暇时间看小说来打发时间,特别是上下班通勤这个时间段,不过每当这个时候都是高峰期,经常出现腾不开手看小说的现象,所以面对这种情况,有声小说就是一个不错的选择。 但有时喜欢的小说比较小众&#…

[nlp] 车载语音助手

多轮对话机器之话题意图识别_Congqing He的博客-CSDN博客 https://www.csdn.net/tags/MtTakgwsMTc3MjItYmxvZwO0O0OO0O0O.html 智能座舱系列六:一文读懂车载语音系统_对话_车机_云端 车载语音助手的人机交互的流程: ASR系统,可以接受用户发起的语音对话的音频输入,并给出…

chatgpt赋能python:Python电影票订购系统——方便快捷的电影票购买方式

Python电影票订购系统——方便快捷的电影票购买方式 电影是现代社会不可或缺的一部分,人们往往在闲暇之余去电影院欣赏一部好片,来放松身心。然而,电影院在繁忙时期往往出现票源紧张、排队时间长等问题,给观影体验带来不便。此时…

手机上的python怎么运行,python在手机上怎么操作

大家好,小编来为大家解答以下问题,python在手机上怎么操作,手机上的python怎么运行,现在让我们一起来看看吧! 1、手机浏览器运行python 手机浏览器运行python是因为手机浏览器和python两者之间是可以互相兼容的&#…

嵌入式音视频疑惑汇总(持续更新)

小小的脑袋里,大大的疑问,该文是博主在工作中遇见问题后,主要面向chatGPT学习的记录笔记 1、bypass hdr 是什么? “Bypass HDR” 是指绕过高动态范围(HDR)功能的一种设置。HDR 是指一种显示技术&#xff0…

chatgpt赋能python:Python是一种广泛使用的高级编程语言,具有灵活性和易读性。借助Python可以编写各种应用和工具,其中包括用于搜索引擎优化(SEO)的应用和工具。在本文中,我们将探

Python是一种广泛使用的高级编程语言,具有灵活性和易读性。借助Python可以编写各种应用和工具,其中包括用于搜索引擎优化(SEO)的应用和工具。在本文中,我们将探讨如何配置Python以进行SEO,并介绍一些关键的…

chatgpt赋能python:Python运行机制及其在SEO中应用的探析

Python运行机制及其在SEO中应用的探析 Python是一种广泛应用于各类工程、数据分析、人工智能以及网络开发领域的高级编程语言,因其便捷易用、高效稳定等特点而深受开发者和用户的喜爱。然而,Python在SEO中究竟能扮演怎样的角色及其优缺点又是如何呢&…

chatgpt赋能python:Python免费版:解读Python知识的必备利器

Python免费版:解读Python知识的必备利器 如果你想要学习程序开发,你一定会听说过Python。作为一种高级编程语言,Python已经被广泛应用于Web开发、数据分析、科学计算和人工智能等领域。但是,如果你刚刚入门,你可能会被…

chatgpt赋能python:简单Python游戏:加深Python语言学习、锻炼编程思维

简单Python游戏:加深Python语言学习、锻炼编程思维 Python是一种极为流行的编程语言,用于许多不同的领域和行业,包括Web开发、机器学习、数据分析和游戏开发等。Python语言的简洁性和易读性使它成为初学者和专业开发者的首选。在本文中&…

chatgpt赋能python:Python同一个类中的函数如何相互调用

Python同一个类中的函数如何相互调用 在Python的面向对象编程中,一个类通常包含多个函数,这些函数相互独立,但在某些情况下需要相互调用。那么,Python同一个类中的函数如何相互调用呢?下面我们来一探究竟。 什么是函…

chatgpt赋能python:Python后退对SEO的影响

Python后退对SEO的影响 Python作为一种流行的编程语言,在各种应用场景中都有着广泛的应用。但是,对于一些需要考虑SEO优化的网站来说,Python后退往往被认为是一个不利因素。那么,Python后退对SEO究竟有什么影响,我们来…

chatgpt赋能python:Python电影数据爬取:探索电影世界的数据

Python电影数据爬取:探索电影世界的数据 Python是一个出色的编程语言,可以应对各种需要数据分析和处理的任务。在这篇文章中,我们将讨论使用Python爬取电影数据的方法,以及如何使用这些数据来分析和发现有趣的信息。本文将着重介…

chatgpt赋能python:Python能连续赋值吗?

Python能连续赋值吗? Python是一种高级编程语言,广泛用于各种程序设计领域。它有许多优秀的特性,如动态类型、高级数据结构和灵活的语法。其中一个极为方便的特性就是连续赋值,也称为“多重赋值”。 什么是连续赋值?…

chatgpt赋能python:Python处理雷达数据

Python处理雷达数据 雷达技术是一种主要用于测量目标距离、速度和方位的技术。在雷达系统中,雷达接收器接收到的信号经过一系列的处理才能得到有效的数据。在这一过程中,Python语言得到了广泛应用。本文将介绍Python如何处理雷达数据。 雷达数据的格式…

chatgpt赋能python:Python奇偶性判断:一探究竟

Python奇偶性判断:一探究竟 Python是一种流行的编程语言,使编写代码变得容易。它的语法简单,易于理解,因此很受程序员的欢迎。Python还具有很多小技巧,其中之一是它的奇偶性判断。在本篇文章中,我们将介绍…

AIGC迈向通用人工智能时代

一、AIGC“起飞”的背后 2023年1月30日,AIGC概念股突飞猛涨。一时间,AIGC再次站上风口浪尖。 AIGC(AI Generated Content)是指利用人工智能技术来生成内容,被认为是继UGC、PGC之后的新型内容生产方式,常见…

AIGC 未来已来——迈向通用人工智能时代

AIGC的各大门派是谁?典型技术都有什么? AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性? 为何科技企业争相推出大模型? 人类的创新能力会被AIGC取代吗…… 诸如此类的这些话题呈现爆发性增长,频频被科技…