手把手教你搭建一个你自己的语音合成系统

语音合成系统

    • 1.百度AI开放
    • 2. 安装语音合成 Python SDK
    • 3.新建AipSpeech
    • 4.接口说明
    • 5.登陆账号,创建应用

1.百度AI开放

  今天,我们来一起学习意下如何搭建一个属于你自己的语音合成系统,在这里我们会用到百度的语音合成服务。

第一步
首先我们打开百度AI开放平台,他的网站域名是https://ai.baidu.com
打开之后我们可以点击开放能力在这里插入图片描述
然后在中间的语音合成下点击 在线合成-基础音库这个完全免费的,
在这里插入图片描述
然后我们会看到下面的页面在这里插入图片描述
我们点击技术文档可以看到如下百度语音合成的简介:https://ai.baidu.com/ai-doc/SPEECH/Gk38y8lzk

2. 安装语音合成 Python SDK

语音合成 Python SDK目录结构├── README.md
├── aip                   //SDK目录
│   ├── __init__.py       //导出类
│   ├── base.py           //aip基类
│   ├── http.py           //http请求
│   └── speech.py //语音合成
└── setup.py              //setuptools安装

支持Python版本:2.7.+ ,3.+

安装使用Python SDK有如下方式:

如果已安装pip,执行pip install baidu-aip即可。
如果已安装setuptools,执行python setup.py install即可。

3.新建AipSpeech

AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech:

from aip import AipSpeech""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEYSECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:

接口说明

setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)

4.接口说明

接口描述:
基于该接口,开发者可以轻松的获取语音合成能力

请求说明:
合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制
举例,要把一段文字合成为语音文件:

result  = client.synthesis('你好百度', 'zh', 1, {'vol': 5,
})# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):with open('audio.mp3', 'wb') as f:f.write(result)

参数 作用:
tex: 合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节
cuid: 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,
spd: 语速,取值0-9,默认为5中语速
pit: 音调,取值0-9,默认为5中语调
**vol:**音量,取值0-15,默认为5中音量
**per:**发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女

5.登陆账号,创建应用

然后我们点击下面链接登录百度账号然后创建建一个应用https://login.bce.baidu.com/?redirect=https%3A%2F%2Fconsole.bce.baidu.com%2F%3Ffromai%3D1#/aip/overview
创建完成后,我们就可以开始写代码了,代码如下:

from aip import AipSpeech
APP_ID = '24967804'
AIP_KEY = 'L7vUpP61Ir53Dy2DLQrlAGxK'
SECRET_KEY = 'nbjrOt0rY6VUIQSrIeumFGZyHUjbjTHv'client = AipSpeech(APP_ID,AIP_KEY,SECRET_KEY)s = input('请输入合成文本:')
result = client.synthesis(s,'zh',4,{  'spd' :5,'pit' :8,'vol' :5,})if not isinstance(result,dict):with open('audio.mp3','wb') as f:f.write(result)

最后我们运行代码输入想要合成的文字就可以合成相应的语音了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23453.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT效果

官网地址:https://platform.openai.com/ 文档地址:https://platform.openai.com/docs/introduction 演示地址:https://platform.openai.com/playground?modecomplete

你安全吗?丨通过IP地址如何查到实际地址?

在电视剧《你安全吗》中,第三集和第四集开始出现一个情节,秦淮在找陈默,计算机系的双子星秦淮陈默,本来有着光明的未来,结果确实陈默在异地他乡捡垃圾做零工,让人百思不得其解。终于在第四集中,…

chatgpt赋能python:编写自定义IP地址类——让Python操作IP地址变得更简单!

编写自定义IP地址类——让Python操作IP地址变得更简单! 在网络编程中,IP地址是一个非常重要的概念。在Python中,操作IP地址通常需要对字符串进行复杂的处理。但是,通过编写自定义IP地址类,我们可以轻松地创建、操作和…

chatgpt赋能Python-python_ip地址处理

Python IP地址处理 在网络通信中,IP地址是非常重要的内容。Python作为一门强大的编程语言,自然也能处理IP地址。本文将介绍Python处理IP地址的方法,并提供一些实用的例子。 IP地址的表示方式 IP地址是一个32位的二进制数,通常表…

chatgpt赋能python:Python如何获取IP地址

Python如何获取IP地址 介绍 IP地址是计算机网络中的一个关键元素,它是用于在网络上唯一标识一台设备的地址。在Python编程中,获取IP地址是一个常见的需求,这篇文章将介绍Python如何获取IP地址。 Python获取本机IP地址 获取本机IP地址是Py…

chatgpt赋能python:Python如何查看IP地址

Python如何查看IP地址 在网络上,每个设备都需要一个IP地址才能与其他设备进行通讯。IP地址是用于在互联网上标识设备的唯一标识符。本文将介绍Python如何查看IP地址。 Python查看本机IP地址 使用Python可以很容易地查看本机的IP地址。下面是具体步骤:…

【大数据人工智能AI2.0】GPT-4 office 全家桶发布,打工人凛冬将至 :Microsoft 365 Copilot (副驾驶)简介

GPT-4 发布,只是一个开始。 GPT-4 office 全家桶发布,打工人凛冬将至 Microsoft 365 Copilot 简介 北京时间今天凌晨,微软又发布了基于 GPT-4 的办公软件全家桶——Microsoft 365 Copilot。 Copilot 这个词相信研发同学并不陌生,GitHub Copilot 就是微软收购以后搞…

chatgpt赋能python:Python字体大小怎么调?

Python字体大小怎么调? Python是一种高级编程语言,常被用于数据科学、机器学习、网络开发等领域。在Python编程中,字体大小的调整通常是一个需要处理的问题。在本篇文章中,我们将探讨Python字体大小的调整方法,并给出…

chatgpt赋能python:Python怎么输出图案

Python怎么输出图案 Python作为一种高级编程语言,拥有出色的输出图案能力。本文将通过介绍Python输出图案的方法和实例来介绍Python编程在图形绘制方面的应用。 介绍 在Python编程中,要输出图案需要使用Python中内置的turtle库。该库可以用来绘制各种…

chatgpt赋能python:如何使用Python的Turtle库画一个圆

如何使用Python的Turtle库画一个圆 如果你正在学习编程,你可能已经学会了使用Python的基本语法。现在你可能正在寻找一些有趣的项目来挑战自己。在这篇文章中,我们将介绍如何使用Python的Turtle库来画圆。 什么是Turtle库? Turtle库是Pyth…

chatgpt赋能python:Python如何绘制

Python如何绘制 Python作为一种热门的编程语言,拥有大量实用的库,其中就包括用于绘图的Matplotlib库。Matplotlib库是一个可视化数据的第三方库,具有绘制各种实用图表的强大功能,比如折线图、散点图、柱状图、饼状图等等。在Pyth…

来 Azure 学习 OpenAI 三 - 用 Python 调用 Azure OpenAi API

大家好,我是微软学生大使 Jambo。在我们申请好 Azure 和 Azure OpenAI 之后,我们就可以开始使用 OpenAI 模型了。如果你还没有申请 Azure 和 Azure OpenAI,可以参考 注册 Azure 和申请 OpenAI。 本文将会以 Azure 提供的 Openai 端口为例&am…

ChatGPT是如何运行起来的?(中)

本文我们介绍ChatGPT是如何工作的,以及为什么它能够产生连贯和多样化的对话。分上中下篇为读者们呈现。 微信搜索关注《Java学研大本营》 4 类似人类任务的模型 我们上面举的例子涉及到为数字数据建立模型,这些数据基本上来自于简单的物理学--长时间以来…

【花雕学AI】10:一位户外行者和一款人工智能AI搜索引擎的奇妙探索之旅

《花雕学AI》是一个专栏,由驴友花雕撰写,主要介绍了人工智能领域的多维度学习和广泛尝试,包含多篇文章,分别介绍了ChatGPT、New Bing和Leonardo AI等人工智能应用和技术的过程和成果。本专栏通过实际案例和故事,详细介…

宾至如归 | 开源社邀请您参加亚洲自由开源软件峰会2023(FOSSASIA SUMMIT 2023)

FOSSASIA SUMMIT(亚洲自由开源软件峰会)是一个致力于自由开源软件进步促进的技术型聚会,活动分布在新加坡、越南、泰国、印尼、柬埔寨及德国等地,在欧洲地区和东南亚地区具有广泛的技术影响力。 亚洲自由开源软件峰会2023 FOSSASI…

【元壤教育AI提示工程系列】『KeepChatGPT教程』轻松解决ChatGPT网络报错,畅享无忧沟通!

元壤教育:中国AIGC提示工程培训的佼佼者。 关注「元壤教育」公众号,系统学习AIGC系列课程,提升您10倍生产力。 装插件前是这样的 我们使用ChatGPT时,总是因为网络魔法不力的原因导致页面总是报错,如下图所示&#xff…

uniapp小程序订单页面UI

前言 之前用模板写了订单页面,由于需求改了导致这个页面做更新麻烦,弄了一下午,索性全部删除了自己写了,上面的tabs用的是b-ui框架写的,其他的都是原生写法。 🙏如果这篇文章对你有帮助还请收藏点赞关注&…

uniapp社区动态实战:根据图片数量动态改变图片大小

动态列表是各种社交属性软件中最常见的场景,其中用户在发布动态时一般会添加1-9张图片,不同的数量图片显示大小也会不同,下面就聊一下如何根据不同的图片数量动态改变图片大小。以下案例中最多支持9张图显示,每行做多显示3张,多余则进行换行,…

句子扩写软件-文案扩写软件

什么是扩写软件 扩写软件是一种工具,可以帮助用户对一段文本进行扩展,增加文本的长度和信息量,同时保持原始内容的基本意思和结构不变。简单来说,扩写软件就是通过自然语言处理技术,对原始文本进行修改或补充&#xf…