讯飞语音识别和唤醒开发示例

讯飞语音识别和唤醒开发示例

最近需要用到讯飞的语音识别和语音唤醒的功能,就对这方面进行了一下简单研究。

本文帮助大家简单入门,并且提供几个代码示例给大家参考。

讯飞开发者网址:https://www.xfyun.cn/

讯飞的部分功能,如图:
1

本文只介绍一点语音相关的内容。如果需要可以看看。

一.创建自己的讯飞应用

这里需要先注册自己的讯飞账号。并且进行实名验证。

登陆后,看到右上角有个“控制台”的文本,点击进去,就可以创建我们的应用了。

输入应用的基本信息,如图:
2

创建自己的应用后,可以对自己的应用进行编辑,添加自己需要集成的功能,
如图:
3
创建的应用中有个属性APPID是在讯飞SDK初始化的时候需要用到的。下载的Demo中也有使用方法。

讯飞的功能是部分免费的,部分是体验的,有些是收费的。

比如,我这里添加了语言识别和语音唤醒功能,如图:
4

在后期是可以对自己的应用进行编辑,增加其他模块的功能的。

点击下载SDK,我们就可以进行讯飞的集成进行开发了。

二.讯飞集成开发

讯飞SDK下载后得到的文件,如图:
5

assets、res是一些资源文件
lib中是一些jar包和so库
sample是讯飞给我们提供的demo程序,这个很重要,如果是新手最好看看demo的代码参考开发
readme.txt是简单的注意事项
release.txt是一些版本的信息
wordlist.txt是自己设置的唤醒的关键字

我这里的SDK是集成了语音识别和唤醒功能的,但是我发现sample中有两个示例程序。

有一个demo是有唤醒功能代码的,另一个demo是没有唤醒功能代码的。

有唤醒功能代码的demo,资源文件缺少APPID.jet文件,这个文件在下载的SDK的res/ivw中,

需要复制到项目中的assets文件夹中,才能使用唤醒功能。

1.语音识别

主要控制的类

 // 语音听写对象private SpeechRecognizer mIat;

这个类实例化后,进行参数配置,就可以调用start,stop,cancel等方法进行识别控制

这里讯飞语音不是等你说完在进行识别的,而是一边说,它会一边帮你识别,
所以讯飞默认情况是会在你不说话的时候自动结束识别。

讯飞的语音识别也是有两种形式的,一种是有讯飞自定义的对话框显示的形式,另一种是没有对话框显示的形式。

具体的控制逻辑可以参考demo。

2.唤醒

唤醒记得要复制对的APPID.jet到正确的位置,才能进行有效唤醒。

但是我参考讯飞demo写的代码,只有WakeDemo这个类的唤醒有效,另一个类OneShotDemo的类唤醒无效!

三.这里我把几个项目的代码发给大家参考:

下载地址:https://download.csdn.net/download/wenzhi20102321/10573210

里面的文件说明:

1.my文件夹

这个是我从讯飞开发者中下载的完整的SDK代码,里面包括讯飞提供两个demo代码和一些资源文件

2.XunfeiDemo.rar

这个是我自己根据讯飞SDK中的Demo开发的简单例子,

这个例子里面只开发了语音识别和简单唤醒的功能。

唤醒的关键字是:美女你好

3.MySpeech.rar

这个也是别人根据其他讯飞SDK的Demo开发的例子

里面没有开发唤醒功能,但是有其他比较多的功能实现。

4.里面还提供了两个apk文件,可以安装看看效果

这两个apk如果使用adb install 可能安装失败,因为是调试版本
需要使用adb install -t 才能安装成功

共勉:智者的梦再美,也不如愚人实干的脚印。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44314.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Delphi][FMX]集成迅飞离线语音合成-安卓版本

QQ:13498714 有个朋友在迅飞上申请了个app,想在Firemonkey上集成迅飞离线语音合成,说不会处理。 好安排! 迅飞会为创建应用的账号生成一个测试Demo, Demo是Android studio开发的,解压出来 首先看readme.txt: 1.使用…

讯飞输入法Linux下载,讯飞输入法-讯飞语音输入法下载 v3.0.1727官方电脑版--pc6下载...

在Android、iOS获得不错口碑之后,讯飞输入法终于登陆PC平台。今天上午,讯飞输入法PC体验版正式发布,并号称全球首款支持语音、触摸板手写的PC输入法。 根据官方介绍,讯飞输入法PC版本集语音、手写、拼音输入于一体,具有…

讯飞语音 Great!!!

http://www.xfyun.cn/doccenter/awd 开发集成 > Android平台 目录[隐藏] 1 概述2 预备工作3 语音听写4 语音识别5 语音合成6 语义理解7 本地功能集成8 语音评测9 语音唤醒10 声纹识别11 人脸识别12 附录13 常见问题 1 概述 本文档是集成科大讯飞MSC(Mobile Speec…

讯飞语音转写.NET版本

吐槽一下,讯飞官方webapi,没有提供.NET版本案例,只有python,java,只好自己摸索,代码不太简洁,这里复习总结一下,权当作做笔记摘抄一样总结一番,也给第一天尝试其他小伙伴…

蓝桥杯省赛真题——最少刷题数

2022年第13届省赛,蓝桥杯真题。 (本笔记适合初通 Python 的 coder 翻阅) 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单…… 地址&…

派发奖学金

根据输入的分数成绩列表,给排名前10派发奖学金。 (本笔记适合能熟练应用列表数据结构的 coder 翻阅) 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅…

New Bing 全面开放?我看未必

前段时间大家应该都被ChatGPT刷屏了,其实就回答来说New Bing 才是最厉害的,因为它底层使用了ChatGPT 并且可以支持联网查询数据,回答中还能支持看到出处,方便确认其真实性。 New Bing 是微软基于 OpenAI ChatGPT 技术开发的新一代…

微软Bing突然爆炸级更新!无需等待人人可用,答案图文并茂,网友:逼 ChatGPT 放大招?...

杨净 明敏 发自 凹非寺量子位 | 公众号 QbitAI 所有人都能上手微软Bing了! 今天,微软突然官宣全面开放BingChat: 无需任何等待。只需注册一个账户,首页即可体验。 更关键的是,还有一大堆堪称“家底”的新功能来袭&…

90后韩尚佑晋升抖音总裁

上一篇:程序员变高危职位!又一个删库跑路进去了 近日,字节跳动发生组织架构调整。 抖音副总裁韩尚佑成为抖音部门负责人,统筹管理抖音、中国直播、生活服务业务线。抖音旗下各业务板块负责人改向韩尚佑汇报,包括基础产…

能取代90%的人的工作的ChatGpt到底牛在哪?

人工智能研究实验室OpenAI在2022年11月30日发布了自然语言生成模型ChatGPT,上线两个月就已经超过一亿用户,成为了人工智能界当之无愧的超级大网红。ChatGPT凭借着自身强大的拟人化及时应答能力迅速破圈,引起了各行各业的热烈讨论。简单来说Ch…

git clone出现 fatal: unable to access ‘https://github.com/...‘的两种解决方法

利用gitee下载github中开放的源码 方法一: step 1: step 2: step 3: 方法二 step 1: step 2: step 3: step 4方法一&#…

chatgpt赋能python:Python如何变成App:一篇SEO文章

Python如何变成App:一篇SEO文章 Python作为一种高级编程语言,广泛应用于科学、数据分析、Web开发以及机器学习等领域。但是,Python如何用于移动应用程序的开发呢?本文将介绍Python变成App的方法以及与之相关的SEO技术。 什么是P…

chatgpt赋能python:PythonGUI开发的介绍

Python GUI开发的介绍 了解GUI GUI(图形用户界面)是一种计算机与人之间进行交互的方式,它使用视觉元素如窗口、按钮、滑块、图像等替代了命令行交互模式。GUI让用户可以更快速、高效、舒适地完成任务,位于操作系统的图形外壳上&…

好文转载 ChatGPT被淘汰了?Auto-GPT到底有多强

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。 说Auto-GPT淘汰了ChatGPT了,显然是营销文案里面的标题党。毕竟它还是基于ChatGPT的API,某种意义只是基于ChatGPT能力的应用。但最近,Auto…

热闹!热闹!一觉醒来,ChatGPT被淘汰成了过气明星?

AutoGPT:AI领域的新成员 近日,AI领域似乎出现了一种新的趋势:自主人工智能。 最近一个名为AutoGPT的研究开始走进大众视野。特斯拉前AI总监、刚刚回归OpenAI的Andrej Karpathy也为其大力宣传,并在推特赞扬:“AutoGPT是…

只见新人笑,不见旧人哭 ChatGPT淘汰了多少产品?快来了解!

ChatGPT作为目前世界上最先进的人工智能聊天工具,其GPT模型就是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模…

谷歌翻译插件imtranslator安装使用步骤

在阅读网页的时候会遇到一些看不懂的英文,这时候再去打开翻译软件去翻译难免扫兴;所以我需要一款实时划词翻译的软件! 这里介绍一款我在用的谷歌插件:imtranslator 步骤: 1.(科学上网)在谷歌应用商城下载imtranslator插…

推荐一个谷歌浏览器插件:划词翻译

地址:划词翻译插件 最近在看一些英文文档,遇到了一些词汇不认识,在谷歌浏览器上找到了这个翻译插件 谷歌浏览器自己有一个全文翻译的功能,对于一些技术类文档,有些词如果翻译错误了就会闹出笑话来,限于对…

【Google谷歌翻译】Zotero翻译插件中的引擎不可用,解决

配置文件后Zotero的Google翻译引擎可用 (Win10系统) 以记事本方式打开C:\Windows\System32\drivers\etc\hosts 在最后一行加入203.208.39.194 translate.googleapis.com,然后保存Zotero翻译插件中的“谷歌API(中国可用&#xff09…

谷歌浏览器翻译插件安装步骤

首先下载最新版谷歌浏览器,这样能保证和我的操作界面一样,因为我的是最新版本的谷歌浏览器 一、先下载可用的翻译插件 插件下载地址:https://download.csdn.net/download/weixin_44743624/87631622 下载完成后解压,然后打开谷歌…