电话机器人智能语音机器人之:语音识别,让电脑听懂人说话

通过pyaudio,已经可以将人说的话保存成声音文件。
但是,我们还需要计算机可以听懂人说的话,并执行相应的命令。
在计算机科学里,这被称为“语音识别技术”,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

通俗一点,可以把语音识别理解成2步。

把语音识别成文字
难点是发音不标准、方言、多音字、多音词等等。
理解话的意思
难点是语境、语气、上下文等等。

比如下面的例子:

在这里插入图片描述

语音识别是一门非常复杂的交叉学科。近三十年来,语音识别技术取得显著进步,开始从实验室走向市场。其中涉及到非常多的数学知识,有兴趣的话可以看一看吴军的《数学之美》当然,我们使用Python来实现一个基于语音识别的智能语音机器人,肯定不需要自己完全搞懂语音识别的复杂原理,自己从底层去实现一边。因为互联网上,已经有好多免费开放的语音识别接口,我们直接使用就可以了。接下来,就介绍如何使用百度AI的“语音识别”接口将人说的话识别成文字。

创建语音识别应用

1.进入百度AI开放平台-->控制台。(提示:需要有百度账号)2.进入“语音技术”,创建应用3.管理应用,得到AppID、API Key 、 Secret Key这3个值

安装百度AI Python包

百度AI的Python包安装非常简单。
只需要在“命令提示符”里输入 "pip install baidu-aip"就可以了。提示:需要先设置好环境变量,才可以直接在“命令提示符”里执行pip程序,如何设置环境变量可以看上一篇。

使用百度aip进行语音识别

安装百度AI的Python包之后,将语音识别为文字就非常非常简单了。首先使用 from aip import AipSpeech引入需要使用的语音识别模块。函数audio_2_txt(file)只有一个参数,就是需要识别的语音文件的路径。函数内前3行需要填写前面在百度AI开放平台创建的应用的AppID、API Key 、 Secret Key。
第5行就是创建了一个客户端。接下来,open语音文件,调用 client的asr函数对语音文件进行识别。这个函数的后3个参数也非常好理解。
第一个参数指明需要识别的文件是一个wav文件。
第二个参数指明语音文件里的声音采样频率是16000
第三个参数指明语音是用中文说的。

from aip import AipSpeech

def audio_2_txt(file):
appID = ‘’ #填写自己的App ID
appKey = ‘’ # 填写自己的 API Key
appSecret = ‘’ # 填写自己的 Secret Key
client = AipSpeech(appID, appKey, appSecret)

with open(file,'rb') as fp:result = client.asr(fp.read(),'wav',16000,{'lan':'zh',})print(result)
return result

audio_2_txt(‘C:\temp\mysong.wav’)

打印识别出来的结果,“小猪小猪”已经被正确识别出来了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/64550.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

与AIoT结合是GPT大模型从数字世界走向物理世界的必经之路

来源:物联网智库 作者:彭昭(智次方创始人、云和资本联合创始合伙人) 导读 今天这篇文章,我们来观察奔驰如何使用ChatGPT改进汽车的生产流程,并且探讨GPT大模型与AIoT相结合的场景以及最新实践。 这是我的第…

快讯 | 王思聪新公司成立:疑进军外卖与人工智能领域;360版GPT首次亮相:产品还不够成熟;美国政府正在为人工智能反垄断斗争做准备

一分钟速览新闻点 大疆Avata FPV无人机获得重大的新固件更新 “文澜BriVL”模型设计者、人大教授卢志武:多模态大模型有机会超越OpenAI 东南大学科研团队有了新突破:电子皮肤让机器人有触觉 王思聪新公司成立:疑进军外卖与人工智能领域 周…

芒格:苹果的管理实在太棒了!

NEW 关注Tech逆向思维视频号 最新视频→【传染性暴增30% 已肆虐57个国家 什么是奥密克戎压变体毒株?】 2月18日消息,据外媒报道,伯克希尔哈撒韦公司副董事长、被誉为“股神”沃伦巴菲特(Warren Buffett)“右手”的查理芒格(Charli…

工资理财能实现财务自由吗

前言——我们到底要什么 我相信每个人心底都有对生活而言非常重要、非常热爱的东西,但是受限于现实,我们不太可能全心全意地为热爱的东西而活。收入和财务问题算得上首当其冲的拦路虎了,解决了财务问题,很多看起来很头疼的问题也…

幸福长寿的秘诀 —— 查理芒格

查理芒格:幸福长寿的秘诀其实很简单。_哔哩哔哩_bilibili People trying to figure out what the secret to life, is to a long and happy life ? Its simple. You dont have a lot of envy. You dont have a lot of resentment. You dont overspend your incom…

能力圈与焦虑:焦虑是因为自己能力不够吗?

大家好,我是涩郎,一名「知识挖掘师」兼「知识布道师」。 前几天,我在知乎上看到这么一个问题: 焦虑是因为自己能力不够吗? 我一看,这是个好问题啊,竟然是从能力的角度的谈焦虑,这让我…

天了噜,原来有效的复盘要这样做,微妙

学习包括向自己学习、向他人学习、向书本学习,而复盘则是向自己学习的最佳方法,也有人将复盘称为“自我反思”或“自我批判”。 在实践中,复盘还有各种各样的名称,但只要是向自己学习,都可以称为“复盘”。 “纸上得来…

朋友邀请码—腾讯最新社交

2019年下半年,腾讯在社交产品上的新动作频频,腾讯又开始内测新的社交产品——朋友。朋友下载地址和邀请码请看留言 注意 朋友邀请码请看留言,如果你使用了邀请码,请留言说明哪个邀请码被用了,并生成的你的邀请码发出来…

黑马探花交友----1.项目搭建-注册登录-完善个人信息

学习目标: 项目的功能介绍工程搭建短信验证码阿里云OSS服务应用人脸识别完善个人信息 1、社交介绍 1.1、项目背景 在线社交是互联网时代的产物,已成为互联网用户的基础需求之一。移动互联网自2003年起快速发展, 促使在线社交逐渐从PC端转…

黑马探花交友----5.聊天消息-即时通讯

学习目标: 了解什么是即时通信了解探花交友的消息功能了解即时通信的技术方案了解环信的即时通讯实现环信的用户体系集成实现添加联系人、联系人列表功能实现公告列表 1、即时通信 1.1、什么是即时通信? 1.2、功能说明 在探花交友项目中也提供了类似…

友盟第三方登录实现QQ和微信登录

前言 市面上的app大部分都可以使用qq,微信这些第三方平台的账号来登录,这样可以提高用户体验,避免手工输入账号和密码的麻烦。那么第三方登录的原理到底是什么,以及使用友盟这个平台怎样实现qq和微信的联合登录?下面就…

仿Twitter源代码/社交网络源码/基于脉聊二开版本

☑️ 编号:ym309 ☑️ 品牌:无 ☑️ 语言:PHP ☑️ 大小:104MB ☑️ 类型:仿Twitter ☑️ 支持:h5 🎉 欢迎关注,私信,领取 🎉 ✨ 源码介绍 仿Twitter源代码是…

新版同城定位付费进群完整源码+对接支付/无问题

正文: 最近很多人都在找这个,但是大多都不完整不能用,好吧,给大家找了一套完美修复的出来,并且对接好了免签支付,可以直接使用,搭建简单,这个东西就不用我多说了把,推广引流神器&am…

如何通过免填邀请码,实现App用户增长

做App推广,裂变营销越来越难做怎么办? 拼命拉新,效果依然不明显,究竟是什么环节出了问题? 用户流失率大,推广中是否存在让用户极度反感的流程? … 在如今App产品高度同质化的背景下,…

唯一邀请码生成策略

需求:按照随机策略生成一个不重复的邀请码(字母数字),既要不重复又要保证性能。每个用户对应一个邀请码,必须做到唯一性。邀请码的需要手动输入所以长度不能太长,同时不能让用户猜到邀请码的生成逻辑&#…

DMES-2023第十三届数字营销与电商峰会大会 火热报名中

2023第十三届数字营销与电商峰会将于7月6-7日在上海召开! 本次峰会线上线下同步举行,将通过七大热点主题帮助品牌主突破模式能力,回归初心、精耕细作,实现可持续增长;提升产品能力,实现可持续长期增长&…

2023第十三届中国数字营销与电商创新峰会 嘉宾揭晓

2023第十三届中国数字营销与电商创新峰会将于7月6日-7日在上海召开。 本次峰会将通过七大热点主题帮助品牌主突破模式能力,回归初心、精耕细作,实现可持续增长;提升产品能力,实现可持续长期增长;优化营销能力&#xf…

MIMIC-IT:280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集...

本文来源 机器之心 编辑:蛋酱 在包含 280 万条多模态上下文指令 - 相应对的数据集上训练之后,Otter 展现出了优秀的问答能力,并在 ChatGPT 及人类的两项评估中获得了很高的评价。 近段时间来,AI 对话助手在语言任务上取得了不小…

MIMIC-IT

在包含 280 万条多模态上下文指令 - 相应对的数据集上训练之后,Otter 展现出了优秀的问答能力,并在 ChatGPT 及人类的两项评估中获得了很高的评价。 近段时间来,AI 对话助手在语言任务上取得了不小的进展。这种显著的进步不只是基于 LLM 强大…

【Mac】Mac安装telnet

1.美图 2. 安装 Homebrew 安装 Homebrew 3.安装 (base) lcc@lcc github$ brew install telnet Updating Homebrew... ==> Downloading https://homebrew.bintray.com/bottles/telnet-60.mojave.bottle.tar.gz #########################################################…