ESP32语音转文字齐护百度在线语音识别

一、导入(10分钟)
学习目的
二、新授(70分钟)
1.预展示结果(5分钟)
2.本节课所用的软硬件(5分钟)
4.图形化块介绍(10分钟)
5.单个模块的简单使用(10分钟)
6.在线语音转换工具逻辑分析(10分钟)
7.在线语音转换工具分步实现(30分钟)
三、巩固练习(5分钟)
四、课堂小结(5分钟)
五、程序下载

应用说明:

我们在日常生活中经常会用键盘进行打字,而打字的速度会比较慢,今天我们就来制作一个在线语音转换工具,通过说话,直接AI云平台将语音转换成文本,从而大大加快我们打字的速度,增加我们设备的科技含量。这样我们就可以调用这个文本来实现程序的智能控制。

应用范围:各类小的创客比赛,创新项目,语音输入转文字应用设备等。

一、导入(10分钟)

学习目的

1.了解在线语音转换工具仪的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线

3.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的程序编写

二、新授(70分钟)

1.预展示结果(5分钟)

在这里插入图片描述

功能介绍:

当绿色按键按下,开始语音识别,当绿色按键松开,在屏幕上显示语音识别的结果

2.本节课所用的软硬件(5分钟)

3.所用器件 数量

齐护教育版Mixly 1
C02mini主板或AIcam\C02 1
齐护双按键模块 1
齐护TFT显示屏 1
齐护在线语音识别模块(拾音器) 1
C02 4pin线 4
积木组件 若干
齐护C02mini

以上内容可参考:项目一

齐护语音双按键模块

以上内容可参考:项目一

齐护TFT显示屏

以上内容可参考:项目八

齐护在线语音识别模块

在这里插入图片描述

通用万向拾音(麦克风)模块,AI人工智能物联网云服语音识别模块,如要使用本公司软件暂只支持ESP32主控,或购买齐护的C02主控或AIcam主控,结合控制使用,支持ArduinoIDE Mixly软件编程 ,I2S接口

设计:色彩丰富,多种控制方式,积木式通用设计,安装方便,随意搭建;

工艺:沉金无铅PCB,SMT贴片元件,稳定耐用;

4.图形化块介绍(10分钟)

齐护语音双按键模块相关块介绍

以上内容可参考:项目一

齐护TFT显示屏相关块介绍

以上内容可参考:项目八

齐护在线语音识别相关块介绍
在这里插入图片描述

齐护在线语音识别的相关块在齐护机器人C02下的语音合成下,主要有四个块

在这里插入图片描述

第一个块是初始化百度语音,里面的密钥通过关注【齐护教育机器人】的微信公众号回复baidukey获取链接获得

首先关注【齐护教育机器人】,回复baidukey
在这里插入图片描述

然后打开得到的链接

在这里插入图片描述

在里面填入百度的API KEY和Secret KEY,再点提交就可以得到密钥了

接下来我们来讲一下如何获取百度的API KEY和Secret KEY

首先打开mixly,找到百度语音初始化这个块,然后右击,点帮助
在这里插入图片描述
在这里插入图片描述

然后点击右上角的控制台

在这里插入图片描述

登录了之后选语音能力引擎

在这里插入图片描述

然后领取免费资源

在这里插入图片描述

领取所有资源,再点应用列表,然后创建一个应用

在这里插入图片描述

在这里插入图片描述

接着就得到了API KEY和Secret KEY,然后把这二个填入之前的那个网址

在这里插入图片描述

点击提交
在这里插入图片描述

就得到了百度AI密钥
在这里插入图片描述

第二个块是初始化语音识别模块的引脚
在这里插入图片描述

第三个块是获取语音识别结果,其中需要填入齐护密钥

在Mixly软件右上角打开【上传工具】
在这里插入图片描述

点击浏览,找到生成密钥的固件

在这里插入图片描述

再点击上传到ESP

然后在【其它】内输入任意字符,比如输入数字1,点【发送】就得到了齐护密钥。

也可以到其它软件或Mixly软件上打开串口监视器,波特率115200,按一下板子上的复位,也可以返回齐护密钥。

或在工具中清除记录,重新连接,然后点一下“显示记录”,按主板的复位键。

在这里插入图片描述在这里插入图片描述

第四个块的功能是语音识别停止录音

5.单个模块的简单使用(10分钟)

齐护语音双按键模块接线

齐护语音双按键模块程序

以上内容可参考:项目一

齐护TFT显示屏相关块接线

齐护TFT显示屏相关块程序

以上内容可参考:项目八

齐护在线语音识别接线

在这里插入图片描述

齐护在线语音识别模块接C02的P3端口

齐护在线语音识别程序
在这里插入图片描述

效果
在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

6.在线语音转换工具逻辑分析(10分钟)

在这里插入图片描述

逻辑分析:

首先在屏幕上显示提示信息,然后判断按键是否按下,如果按下,开始录音,如果松开停止录音并且在屏幕上显示识别的结果

7.在线语音转换工具分步实现(30分钟)

整体接线(6分钟)

在这里插入图片描述

齐护TFT显示模块CS接C02 的P5端口,DC接C02的P6端口,齐护在线语音识别模块接C02的P3端口,齐护按键模块接C02的P1端口

分步实现(24分钟)

在这里插入图片描述

1.将识别结果通过串口打印出来(12分钟)

在这里插入图片描述

效果

在这里插入图片描述

按下按键,开始识别,松开按键,停止识别,并通过串口打印识别的结果

2.增加提示信息,并将识别结果通过屏幕显示出来(12分钟)

程序
在这里插入图片描述

效果
在这里插入图片描述

增加提示信息,并将识别结果通过屏幕显示出来

三、巩固练习(5分钟)

1,在本节课的基础上尝试修改提示信息,让本作品更符合实际运用

2,把识别结果放到变量中,对比结果然后执行其它的程序

3,采用齐护AIcam直接应用该项目:
在这里插入图片描述

在这里插入图片描述

四、课堂小结(5分钟)

本节课我们主要学习了以下内容

1.了解在线语音转换工具的工作原理

2.学会齐护双按键模块、齐护在线识别模块、齐护TFT显示屏的接线及程序的编写

五、程序下载

课程程序下载:【在线语音转换工具程序】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/265090.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

transformer--输入(位置编码)

原理参考这篇文章, 这里是原始文章 import torch.nn as nn import torch import math from torch.autograd import Variable# 词嵌入 class Embeddings(nn.Module):# dim:词嵌入的维度,vocab:词表的大小def __init__(self, dim, vocab) -> None:supe…

Dledger部署RocketMQ高可用集群(9节点集群)

文章目录 🔊博主介绍🥤本文内容规划集群准备工作节点0配置(ip地址为192.168.80.101的机器)节点1配置(ip地址为192.168.80.102的机器)节点2配置(ip地址为192.168.80.103的机器)在所有…

【Java多线程】对线程池的理解并模拟实现线程池

目录 1、池 1.1、线程池 2、ThreadPoolExecutor 线程池类 3、Executors 工厂类 4、模拟实现线程池 1、池 “池”这个概念见到非常多,例如常量池、数据库连接池、线程池、进程池、内存池。 所谓“池”的概念就是:(提高效率) 1…

ABBYY FineReader16文档转换、PDF管理与文档比较功能介绍

ABBYY FineReader 16作为一款OCR和PDF一体化程序,其强大的功能使得文档处理变得简单高效。在众多功能中,文档转换、PDF管理和文档比较这三大功能尤为突出,成为了众多企业和个人用户的首选工具。 ABBYY Finereader 16-安装包下载如下&#xff…

Python习题详解

练习&#xff1a; 1&#xff0c;计算100以内奇数的和 #计算100以内所有奇数的和 sum 0 # n 1 # while n < 100: # # sum sum n # sum n # # n n 2 # n 2 # print(sum) n 99 #求偶数时n 100 while n > 0:sum n# n n - 2n - 2 print(sum)2&#xff0c;打印直…

Python 鼠标模拟

鼠标模拟即&#xff1a;通过python 进行模拟鼠标操作 引入类库 示例如下&#xff1a; import win32api import win32con import time 设置鼠标位置 设置鼠标位置为窗口中的回收站。 示例如下&#xff1a; # 设置鼠标的位置 win32api.SetCursorPos([30, 40]) 双击图标 设置…

计算机设计大赛 深度学习实现语义分割算法系统 - 机器视觉

文章目录 1 前言2 概念介绍2.1 什么是图像语义分割 3 条件随机场的深度学习模型3\. 1 多尺度特征融合 4 语义分割开发过程4.1 建立4.2 下载CamVid数据集4.3 加载CamVid图像4.4 加载CamVid像素标签图像 5 PyTorch 实现语义分割5.1 数据集准备5.2 训练基准模型5.3 损失函数5.4 归…

【c++leetcode】1382. Balance a Binary Search Tree

问题入口 DSW (DAY, STOUT & WARREN) ALGORITHM 时间复杂度O(n) class Solution { public:int makeVine(TreeNode* grand, int cnt 0){auto n grand->right;while (n ! nullptr){if(n->left ! nullptr){auto old_n n;n n->left;old_n->left n->righ…

【推荐算法系列五】DeepFM 模型

文章目录 参考资料Sparse FeaturesDense EmbeddingsFM LayerHidden LayerOutput Units 优缺点DeepFM 的优点DeepFM 自身的缺点。 参考资料 DeepFM 中关于 整个发展过程&#xff0c; FM, PNN, wide&deep 的描述很给力。 所以FM在其中的含义就是low-order, deep 就是所谓的 …

如何使用ArcGIS Pro为栅格图添加坐标信息

在某些时候&#xff0c;我们从网上获取的资源是一张普通的栅格图&#xff0c;没有任何的坐标信息&#xff0c;如果想要和带坐标信息的数据一起使用就需要先添加坐标信息&#xff0c;在GIS上&#xff0c;我们把这个过程叫做地理配准&#xff0c;这里为大家介绍一下地理配准的方法…

VSCode-更改系统默认路径

修改vscode中的默认扩展路径&#xff1a;"%USERPROFILE%\.vscode" 打开目录C:\用户\电脑用户名&#xff0c;将.vscode文件剪切至D:\VSCode文件夹下 用管理员身份打开cmd.exe命令界面输入mklink /D "%USERPROFILE%\.vscode" "D:\VSCode\.vscode\"…

二次供水物联网:HiWoo Cloud助力城市水务管理升级

随着城市化的快速推进&#xff0c;二次供水系统作为城市基础设施的重要组成部分&#xff0c;其稳定运行和高效管理显得至关重要。然而&#xff0c;传统的二次供水管理方式在应对复杂多变的城市供水需求时&#xff0c;显得力不从心。为了破解这一难题&#xff0c;HiWoo Cloud平台…

Vue3之属性传值的四种情况

文章目录 Vue3之属性传值的四种情况一、引言二、父组件向子组件传值三、子组件向父组件传值四、祖先组件向后代组件传值五、兄弟组件之间传值 Vue3之属性传值的四种情况 一、引言 在vue3中&#xff0c;组件与组件之间是可以传递属性的&#xff0c;包括三种类型&#xff1a; …

电商风控系统(flink+groovy+flume+kafka+redis+clickhouse+mysql)

一.项目概览 电商的防止薅羊毛的风控系统 需要使用 groovy 进行风控规则引擎的编写 然后其它技术进行各种数据的 存储及处理 薅羊毛大致流程 如果单纯使用 if else在业务代码中进行风控规则的编写 那么 维护起来会比较麻烦 并且跟业务系统强绑定不合适 所以一般独立成一个单…

【Python笔记-设计模式】中介者模式

一、说明 中介者模式是一种行为设计模式&#xff0c;减少对象之间混乱无序的依赖关系。该模式会限制对象之间的直接交互&#xff0c;迫使它们通过一个中介者对象进行合作。 (一) 解决问题 降低系统中对象之间的直接通信&#xff0c;将复杂的交互转化为通过中介者进行的间接交…

[Mac软件]Adobe Substance 3D Stager 2.1.4 3D场景搭建工具

应用介绍 Adobe Substance 3D Stager&#xff0c;您设备齐全的虚拟工作室。在这个直观的舞台工具中构建和组装 3D 场景。设置资产、材质、灯光和相机。导出和共享媒体&#xff0c;从图像到 Web 和 AR 体验。 处理您的最终图像 Substance 3D Stager 可让您在上下文中做出创造性…

绝对路径拼接漏洞 [NISACTF 2022]babyupload

打开题目 最开始以为是文件上传的漏洞 结果发现无论我们上传什么文件都会显示bad filename 去网上看了大佬的wp知道 我们直接去看源代码得到提示 /source 那我们去访问一下这个路径看看 得到一个下载文件 用记事本打开得到 源代码如下 from flask import Flask, request, r…

SSL OV证书和DV、EV证书的区别

在网站搭建的过程中和小程序开发过程中&#xff0c;很难免会有需要用到SSL证书的地方&#xff0c;但是目前数字证书种类繁多&#xff0c;该选择什么类型的证书成为了一个令人纠结的问题。 目前在市场上较为常见的证书分为三种&#xff1a;DV域名验证型证书&#xff1b;OV组织验…

iPhone利用文件管理器批量导出语音备忘录和照片到电脑

步骤1&#xff1a;使用文件服务器在 iPhone 和电脑间共享文件 参考文献&#xff1a;苹果官网操作指南 步骤1.1&#xff1a;iPhone上打开文件app&#xff0c;点击右上角三个点&#xff0c;选择“连接服务器” 步骤1.2&#xff1a;输入电脑的登录账号和密码 步骤1.3&#xff1a…

LVGL 环境搭建-基于WSL

背景说明 小白刚开始接触LVGL&#xff0c;前些日子狠心花198元入手了一块堪称LVGL 入门利器~HMI-Board 开发板&#xff0c;虽然有RT-Thread 集成好的LVGL 环境&#xff0c;只需要几个步骤就能成功把lvgl 的示例运行起来&#xff0c;对于爱折腾的我来说&#xff0c;过于简单也并…