python 语音识别(百度api)

文章目录

  • 前言
  • 准备
  • 下载库
  • 代码实现以及
  • 编写我的key
  • 语音的录入:
  • 使用百度语音作为STT引擎并通过pyttsx3函数将返回的内容读出来形成简单的对话
  • 完整代码
  • 运行结果


前言

现在语音助手已经成为我们生活中ai的代表,下面让我们看一下语音助手的语音输入功能


准备

  1. 让我们搜索一下百度的开放平台

在这里插入图片描述

  1. 进入百度开放平台后选择短语音识别
    在这里插入图片描述

  2. 然后去领取免费的资源
    在这里插入图片描述

  3. 创建应用
    在这里插入图片描述

  4. 记住相关的key
    在这里插入图片描述

下载库

本次用到的库(以及引入方法):

import speech_recognition as sr
from aip import AipSpeech
import pyttsx3

代码实现以及

编写我的key

APP_ID = '27468776'
API_KEY = 'ygQgtR4DIh14lDi8gwSMCm7o'
SECRET_KEY = '7flGlZba42ZYxHudy3dSQ8YW4n89W5hc'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

语音的录入:

try:def rec(rate=16000):r = sr.Recognizer()with sr.Microphone(sample_rate=rate) as source:print("请说话")audio = r.listen(source)with open("recording.wav", "wb") as f:f.write(audio.get_wav_data())
except:print("语音录入发生错误")

使用百度语音作为STT引擎并通过pyttsx3函数将返回的内容读出来形成简单的对话

    with open('recording.wav', 'rb') as f:audio_data = f.read()result = client.asr(audio_data, 'wav', 16000, {'dev_pid': 1536,})try:result_text = result["result"][0]print("你说: " + result_text)if result_text =="于金龙":engine = pyttsx3.init()engine.say('真帅')engine.runAndWait()elif result_text=="张新凯":engine = pyttsx3.init()engine.say('真难看')engine.runAndWait()except:print("没有识别到语音")

完整代码

import pyttsx3import speech_recognition as sr
from aip import AipSpeech# Baidu Speech API, replace with your personal key
APP_ID = '27468776'
API_KEY = 'ygQgtR4DIh14lDi8gwSMCm7o'
SECRET_KEY = '7flGlZba42ZYxHudy3dSQ8YW4n89W5hc'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# Use SpeechRecognition to record
try:def rec(rate=16000):r = sr.Recognizer()with sr.Microphone(sample_rate=rate) as source:print("请说话")audio = r.listen(source)with open("recording.wav", "wb") as f:f.write(audio.get_wav_data())
except:print("语音录入发生错误")# 使用百度语音作为STT引擎
def listen():with open('recording.wav', 'rb') as f:audio_data = f.read()result = client.asr(audio_data, 'wav', 16000, {'dev_pid': 1536,})try:result_text = result["result"][0]print("你说: " + result_text)if result_text =="阿龙":engine = pyttsx3.init()engine.say('真帅')engine.runAndWait()elif result_text=="其他人":engine = pyttsx3.init()engine.say('真难看')engine.runAndWait()except:print("没有识别到语音")while True:rec()request = listen()

运行结果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23975.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python调用百度API实现语音识别(一)

咪哥杂谈 本篇阅读时间约为 2 分钟。 1 前言 上篇文章介绍了下如何用 Python 剪辑视频,想回顾的同学可以拉到文章最下面,有历史链接。 有了上篇文章野狼disco的音频,今天就来带大家玩一下百度的API,如何借用百度 API 的语音识别功…

百度语音识别服务 —— 语音识别 REST API 开发笔记

在以前的项目中用到了百度语音识别服务,在这里做一个笔记。这里还是要和大家强调一下,最好的学习资料就是官网网站。我这里只是一个笔记,一方面整理了思路,另一方面方便以后我再次用到的时候可以快速回忆起来。 百度语音识别服务…

树莓派实现语音识别与语音合成——百度云语音识别API

本文采用百度云语音识别API接口,实现低于60s音频的语音识别,也可以用于合成文本长度小于1024字节的音频,此外采用snowboy离线语音唤醒引擎可实现离线语音唤醒,实现语音交互。基于本内容可实现语音控制小车,语音控制音箱…

项目:基于百度API智能语音家居控制系统

目录 开发平台/开发环境: windows 10、Linux、arm cortex A9(Exynos 4412)、ubuntu20.04、zigebee通信、摄像头外设、cortex-M0; 项目模块: 摄像头模块;qt界面及语音识别模块;qt客户端模块;服务器模块&am…

Python调用百度API进行语音识别

目录 1.作者介绍2.基于百度API的普通话识别2.1语音识别2.2百度API调用方法 3.实验3.1实验准备3.2实验结果 4.实验代码 1.作者介绍 高志翔,男,西安工程大学电子信息学院,2021级研究生 研究方向:机器视觉与人工智能 电…

百度语音识别API的简单应用

1. prepare 根据百度开发文档的提示可以知道,API仅能处理特定格式的语音文件。 由于底层识别使用的是pcm,因此推荐直接上传pcm文件。如果上传其它格式,会在服务器端转码成pcm,调用接口的耗时会增加。 语音识别仅支持以下格式 &am…

什么是CatGPT-使用效果如何-

个人使用效果,评分优,足以满足教学和填表。 程序媛借助CatGPT(ChatGPT更佳),基本上可以秒杀不用此类工具的程序猿(男)!!! 问:为什么使用AIGC能大幅…

OpenAI ChatGPT3.5 completion API 入门指南

官方介绍 ChatGPT 由 OpenAI 最先进的语言模型 gpt-3.5-turbo 提供支持。 使用 OpenAI API,您可以使用 GPT-3.5-turbo 构建自己的程序来做一些如下的事情: 起草电子邮件或其他书面文件编写 Python 代码回答关于一组文档的问题创建对话代理程序为你的软件…

英语二-电子邮件邀请短文写作

1. 邮件模板 Dear 邀请人, Hope you have a great day. I am writing this email to invite you to attend 主题. Please kindly find the following information for your reference: Time: 时间 Address: 地点 We hope that nothing will prevent you from coming, as…

怎样收智商税

智商税的历史源远流长,史上最著名的案例,是 1313 年起天主教会开始发售的“赎罪券”:教皇宣称教徒购买此券,可以赦免罪罚,其宣传是“金币投进柜子当啷一响时,灵魂就可以升天堂了”。此案例诠释了智商税的几…

AIGC周报|让AI来画《海贼王》;苹果限制员工使用ChatGPT;李彦宏:不担心大模型会让工作消失

AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 DallE 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作。 …

谷歌正式开放智能 AI 机器人 Bard 迎战 ChatGPT,附申请教程

随着 ChatGPT 掀起了 AI 时代的浪潮之后,微软必应 Bing Chat 机器人、Office 以及百度的“文心一言”等都已经离开实验室,正式在公众的赛道上比拼了。3月21日周二,美国科技巨头谷歌公司推出了 AI 聊天机器人 Bard 的测试版本,以期…

吴恩达 ChatGPT Prompt Engineering for Developers 系列课程笔记--01 Introduction

01课程介绍Introduction 1) 两种LLM(Large Language Models) Base LLM:根据训练数据自动预测下一个单词。例如:给定"Once upon a time, there was a unicorn",LLM会自动生成下面的文章"that lived in a magical forrest with…

计算机考研复试面试系列 计算机专业英语篇

计算机考研复试面试系列 计算机专业英语篇 在复习过程中,我用心查阅并整理了在考研复试面试中可能问到的大部分问题,并分点整理了答案,可以直接理解背诵并加上自己的语言润色!极力推荐打印下来看,效率更高! 此系列一共…

AI时代的三类人:探索掌握AIGC,引领未来的人才之路

(本文阅读时间:6 分钟) 1 AI时代:ChatGPT引领AIGC技术革命 对于那些热衷于探索新技术的小伙伴而言,ChatGPT早已超越了抽象的概念,我们对其能力已有所了解。那么,ChatGPT究竟能够做些什么呢&…

AGI 大模型创业时代的创业公司新形态:11 人的 Midjourney 不是偶然 | 同为开发绘画AI的团队,Midjourney是怎么取得今天的成就的呢?

同为开发绘画AI的团队,Midjourney是怎么取得今天的成就的呢? 目录 同为开发绘画AI的团队,Midjourney是怎么取得今天的成就的呢?</

Web开发课程实验(二):Servlet+DAO实现数据库基本交互

实验内容&#xff1a; 使用servletDAO实现基本数据库交互 具体要求 编写一个静态网页&#xff0c;网页命名&#xff1a;student.html 编写一个Servlet&#xff0c;命名&#xff1a;StudentServlet 创建hit数据库&#xff08;PostgreSQL或MySQL均可&#xff09;&#xff0c;其…

占有统治地位的Transformer究竟是什么

讲个有趣的小故事 我高二那年从乙班考入了甲班&#xff0c;对于那时的我 偏科英语最高只有108班级平均英语成绩125暴躁难为人女英语老师&#xff0c;使我上英语课时战战兢兢。英语老师很时尚&#xff0c;喜欢搞花里胡哨的词语让我们放松&#xff0c;也很尊重我虽然暴躁但维护着…

8 Surprising Things You Can Do With ChatGPT 你可以用 ChatGPT 做的 8 件令人惊讶的事情

If you’ve heard about ChatGPT and think it’s just a fancy chatbot, you might be underestimating the range of what it can do. Here are some surprising things you can do with ChatGPT, whether you want to write a resume or have it dungeon-master an epic rol…

千万别错过!C/C++实现经典围棋大战,秒杀挫败柯洁的AlphaGo

在现实生活中想下围棋就必须要有棋子和棋盘&#xff0c;但是棋子好携带&#xff0c;但棋盘携带的话就和不方便了&#xff0c;所以很多人突然有雅兴想下围棋但奈何没有棋盘&#xff0c;但是随着围棋软件的出现就很好的解决了这个问题了&#xff0c;它可以让你随时随地都能过把手…