电话机器人智能语音机器人之：语音识别，让电脑听懂人说话

通过pyaudio，已经可以将人说的话保存成声音文件。
但是，我们还需要计算机可以听懂人说的话，并执行相应的命令。
在计算机科学里，这被称为“语音识别技术”，语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

通俗一点，可以把语音识别理解成2步。

把语音识别成文字
难点是发音不标准、方言、多音字、多音词等等。
理解话的意思
难点是语境、语气、上下文等等。

比如下面的例子：

在这里插入图片描述

语音识别是一门非常复杂的交叉学科。近三十年来，语音识别技术取得显著进步，开始从实验室走向市场。其中涉及到非常多的数学知识，有兴趣的话可以看一看吴军的《数学之美》当然，我们使用Python来实现一个基于语音识别的智能语音机器人，肯定不需要自己完全搞懂语音识别的复杂原理，自己从底层去实现一边。因为互联网上，已经有好多免费开放的语音识别接口，我们直接使用就可以了。接下来，就介绍如何使用百度AI的“语音识别”接口将人说的话识别成文字。

创建语音识别应用

1.进入百度AI开放平台-->控制台。（提示：需要有百度账号）2.进入“语音技术”，创建应用3.管理应用，得到AppID、API Key 、 Secret Key这3个值

安装百度AI Python包

百度AI的Python包安装非常简单。
只需要在“命令提示符”里输入 "pip install baidu-aip"就可以了。提示：需要先设置好环境变量，才可以直接在“命令提示符”里执行pip程序，如何设置环境变量可以看上一篇。

使用百度aip进行语音识别

安装百度AI的Python包之后，将语音识别为文字就非常非常简单了。首先使用 from aip import AipSpeech引入需要使用的语音识别模块。函数audio_2_txt(file)只有一个参数，就是需要识别的语音文件的路径。函数内前3行需要填写前面在百度AI开放平台创建的应用的AppID、API Key 、 Secret Key。
第5行就是创建了一个客户端。接下来，open语音文件，调用 client的asr函数对语音文件进行识别。这个函数的后3个参数也非常好理解。
第一个参数指明需要识别的文件是一个wav文件。
第二个参数指明语音文件里的声音采样频率是16000
第三个参数指明语音是用中文说的。

from aip import AipSpeech

def audio_2_txt(file):
appID = ‘’ #填写自己的App ID
appKey = ‘’ # 填写自己的 API Key
appSecret = ‘’ # 填写自己的 Secret Key
client = AipSpeech(appID, appKey, appSecret)

with open(file,'rb') as fp:result = client.asr(fp.read(),'wav',16000,{'lan':'zh',})print(result)
return result

audio_2_txt(‘C:\temp\mysong.wav’)

打印识别出来的结果，“小猪小猪”已经被正确识别出来了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/64550.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

电话机器人智能语音机器人之：语音识别，让电脑听懂人说话

相关文章

与AIoT结合是GPT大模型从数字世界走向物理世界的必经之路

快讯 | 王思聪新公司成立：疑进军外卖与人工智能领域；360版GPT首次亮相：产品还不够成熟；美国政府正在为人工智能反垄断斗争做准备

芒格：苹果的管理实在太棒了！

工资理财能实现财务自由吗

幸福长寿的秘诀 —— 查理芒格

能力圈与焦虑：焦虑是因为自己能力不够吗？

天了噜，原来有效的复盘要这样做，微妙

朋友邀请码—腾讯最新社交

黑马探花交友----1.项目搭建-注册登录-完善个人信息

黑马探花交友----5.聊天消息-即时通讯

友盟第三方登录实现QQ和微信登录

仿Twitter源代码/社交网络源码/基于脉聊二开版本

新版同城定位付费进群完整源码+对接支付/无问题

如何通过免填邀请码，实现App用户增长

唯一邀请码生成策略

DMES-2023第十三届数字营销与电商峰会大会火热报名中

2023第十三届中国数字营销与电商创新峰会嘉宾揭晓

MIMIC-IT：280万条多模态指令-响应对，八种语言通用，首个涵盖视频内容的指令数据集...

MIMIC-IT

【Mac】Mac安装telnet