使用APICloud 科大讯飞SDK快速实现语音识别功能

语音识别功能已经是一个很普及的功能,在特定情境下,能带给人们方便的交互的体验,比如驾驶时使用语音进行唤醒手机,各类智能音响产品,语音控制智能电视等。本文主要介绍在APICloud平台使用科大讯飞的SDK快速实现语音识别功能。

一、效果预览

二、功能实现

在注册好APICloud账号后,进入控制台,添加iflyRecognition模块。iflyRecognition模块封装了科大讯飞的SDK 的语音听写、语音在线合成功能。

使用流程:
1、注册讯飞开放平台账号
2、在讯飞开放平台创建应用,并添加语音听写在线语音合成服务。
3、参考模块文档(docs.apicloud.com/Client-API/Open-SDK/iflyRecognition)相关描述,制作Android自定义模块。

从讯飞下载的合成SDK,如下图:

根据文档提示,制作的自定义模块如下图:

重新压缩后,上传到自定义模块处,添加到项目。

根据模块文档,调用接口:

1、

createUtility

创建科大讯飞引擎

createUtility({params}, callback(ret, err))

params

android_appid:

  • 类型:字符串
  • 描述:从科大讯飞开放平台得到的 appid(android端)

ios_appid:

  • 类型:字符串
  • 描述:从科大讯飞开放平台得到的 appid(iOS端)

示例:

var iflyRecognition = api.require('iflyRecognition');iflyRecognition.createUtility({ios_appid: '6041****',      // 填写讯飞平台上获得的appid         android_appid: '6041****'   // 填写讯飞平台上获得的appid }, function (ret, err) {if (ret.status) {api.alert({msg: '创建成功'});} else {api.alert({msg: "创建失败"});}});

2、

record

识别语音返回文字

record({params}, callback(ret, err))

params

vadbos:

  • 类型:数字
  • 描述:(可选项)前断点时间(静音时间,即用户多长时间不说话做超时处理),范围是0-10000单位ms
  • 默认值:5000

vadeos:

  • 类型:数字
  • 描述:(可选项)后断点时间(静音时间,即用户多长时间不说话做超时处理),单位ms,范围是0-10000
  • 默认值:5000

rate:

  • 类型:数字
  • 描述:(可选项)采样率(支持16000,8000)
  • 默认值:16000

asrptt:

  • 类型:数字
  • 描述:(可选项)返回的语句是否有标点符号,取值范围:0-无,1-有
  • 默认值:1

audioPath:

  • 类型:字符串
  • 描述:(可选项)录制的音频文件保存路径(如fs://123.pcm,一定要加后缀名;一定要加后缀名;只允许一级目录,不允许二级机二级以上的目录,例如不允许fs://test/123/pcm),不支持widget 协议。注意:在 iOS 平台上由于科大讯飞 SDK 限制,只支持 pcm 格式音频保存
  • 备注:若不传则不保存

callback(ret, err)

ret:

  • 类型:JSON 对象
  • 内部字段:
{status:true        //布尔类型;操作成功状态值,true|falsewordStr:           //字符串类型;识别语音后的文字eventType:'',    //字符串类型;交互事件类型://record_end:录音结束事件 (仅支持ios)//recognize_end:识别结束事件//recognize_start: 识别开始事件(仅支持Android)
}

示例:

var iflyRecognition = api.require('iflyRecognition');iflyRecognition.record({vadbos: 5000,vadeos: 2000,rate: 16000,asrptt: 1,audioPath: 'fs://myapp/speech.pcm'}, function (ret, err) {if (ret.status) {if (ret.wordStr) {let wordStr = ret.wordStr;that.data.items.push(wordStr);that.data.isOk = true;//flag = false;}} else {// api.alert({//     msg: err.msg// });}});

完整代码如下:

<template><safe-area><view class="page"><view class="content"  v-if="isOk"><view class="item" v-for="(item, index) in items"><text>{{item}}</text></view></view><view class="btm" onclick="fnrecord()"><text>开始语音识别,请说话。。。</text></view></view></safe-area>
</template>
<script>
export default {name: 'record',apiready() {//like createdvar iflyRecognition = api.require('iflyRecognition');iflyRecognition.createUtility({ios_appid: '6041****',      // 填写自己从讯飞平台上获得的appid         android_appid: '6041****'   // 填写自己从讯飞平台上获得的appid }, function (ret, err) {if (ret.status) {api.alert({msg: '创建成功'});} else {api.alert({msg: "创建失败"});}});},data() {return {isOk: false,items: []}},methods: {fnrecord() {console.log(1111)var that = this;var iflyRecognition = api.require('iflyRecognition');iflyRecognition.record({vadbos: 5000,vadeos: 2000,rate: 16000,asrptt: 1,audioPath: 'fs://myapp/speech.pcm'}, function (ret, err) {if (ret.status) {if (ret.wordStr) {let wordStr = ret.wordStr;that.data.items.push(wordStr);that.data.isOk = true;//flag = false;}} else {// api.alert({//     msg: err.msg// });}});}}
}
</script>
<style>
.page {height: 100%;width: 100%;
}.content {position: relative;top: 30px;width: 80%;height: 60%;border: 1px solid #333;background-color: #fff;
}.btm {position: absolute;bottom: 20px;left: 40px;height: 70px;width: 300px;padding: 20px 20px;border: 1px solid #eee;border-radius: 5px;background-color: rgb(51, 142, 216);
}.item {width: 90%;
}
</style>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/66172.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android 科大讯飞、语音听写集成指南

前提说明&#xff1a;讯飞SDK与appID&#xff08;后台申请&#xff09;是一一对应的、否则就会导致初始化不成功&#xff01; 1、创建appID并下载SDK&#xff08;没有账号的先行注册&#xff09; https://console.xfyun.cn/app/myapp 创建完成后、如图 下载解压包 simple就是…

tp中如何调用科大讯飞的语音转写

1.首先注册科大讯飞&#xff08;https://www.xfyun.cn/&#xff09;&#xff0c;拿到语音转写的APPID以及SecretKey 2.将我的压缩包放到tp的扩展类库目录&#xff08;extend&#xff09;中。解压 3.在控制里面的调用方式 重点注意&#xff1a; 1.一定要是科大讯飞语音转写的A…

android语音识别之科大讯飞语音API的使用

Android系统本身其实提供有语音识别模块&#xff0c;在它的APIDemo里也有关于语音识别的sample&#xff0c;不过经过大多开发者的真机测试&#xff0c;发现很多真机并不能使用哪个sample&#xff0c;在网上查找了一下原因&#xff0c;大部分是因为开发者在刷机的时候&#xff0…

如何调教ChatGPT,让它成为生产力工具

我希望您充当 Graphviz DOT 生成器&#xff0c;创建有意义的图表的专家。该图应该至少有 n 个节点&#xff08;我在我的输入中通过写入 [n] 来指定 n&#xff0c;10 是默认值&#xff09;并且是给定输入的准确和复杂的表示。每个节点都由一个数字索引以减少输出的大小&#xff…

3月18日英超两场足球比赛分析推荐

不知不觉文章分析的场次推荐已经4连红&#xff0c;昨日文章写的纽卡没有问题&#xff0c;扫盘中错的两场实属无奈&#xff0c;比勒费前半场领先2球优势被最后一分钟点球扳平。海牙带球入场结果后半场乏力被打穿&#xff01;球场上就是这么变化莫测&#xff0c;让人悲伤让人疯狂…

足球胜平负数据这样分析竞猜准确率超高,你敢相信吗?

作为足球爱好者和竞猜玩家&#xff0c;使用一款好用的工具软件能够帮助我们更全面地分析比赛数据和情况&#xff0c; 提高我们的赛事预测准确率。因此&#xff0c;选择一款最好用的足球胜平负竞猜分析工具软件是我们必须要做的事情。下面我为大家介绍一款非常好用的数据分析工具…

周鸿祎自传

​ 1.那共通之处就是——人们如何在没有前车之鉴的判例中进行决策&#xff0c;又如何在泰山压顶般的压力之下做出最优的判断。对于创业者来说&#xff0c;每一天都是压力测试。&#xff0d;&#xff0d;&#xff0d;&#xff0d;决策 2.真正的勇敢&#xff0c;并非骁勇善战&am…

马斯克回应多年前嘲笑比亚迪;360 周鸿祎训练数字人代替演讲;微软发布自己的 Linux | 极客头条

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 苏宓 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

史上最全最详细的多语言调用 3.5 Turbo 的 API 教程(持续更新中)

3.5 Turbo 模型是 Chat 所使用的模型&#xff0c;现 OpenAI 已正式开放 Chat 的 API 能力供广大开发者使用&#xff0c;它可以提供超高准确性、可靠性和可扩展性&#xff0c;让机器学习和自然语言处理的开发者以极低的成本获取精准的结果。 那么我们如何通过API 的方式调用 3.…

寻找新奇有趣的AI工具合集,一个网站就够了

随着ChatGpt横空出世&#xff0c;越来越多的AI工具涌现出来&#xff0c;利用这些工具&#xff0c;我们就可以玩转智能办公&#xff0c;尽享高效快捷。那么&#xff0c;我们从哪里可以即时获取到这些产品的信息呢&#xff1f;又如何调兵遣将&#xff0c;化种类繁多的AI工具为各种…

云炬Android开发笔记 17商品详情功能开发

阅读目录 1.商品详情ui框架设计 1.1 自定义圆形控件 1.2 底部栏的布局 1.3 整体布局 2.商品详情UI-MD风格伸缩渐变效果实现 2.1 ui的绑定 2.2 服务器中商品详情页的数据的取出 3.商品详情页的中间信息的完善 4. 商品详情页下部滑动Tab页面的实现 4.2 填充的ImageDele…

chatgpt赋能python:Python怎么断行-让代码更易读

Python怎么断行 - 让代码更易读 大多数Python程序员都知道&#xff0c;代码可读性非常重要。好的代码应该易于阅读和理解&#xff0c;而不是让人困惑和痛苦。 然而&#xff0c;我们经常会发现一些Python代码在一行中拥挤着多个表达式、长变量名混杂其中&#xff0c;让人感到相…

如何利用citespace分析cnki里的文献——(1)导入数据

##&#xff08;一&#xff09;在cnki中导出数据 按照自己的需要进行检索&#xff0c;选择需要导出的文献题录&#xff08;最多一次可选择500个&#xff09;&#xff0c;导出格式选为“Refworks”&#xff0c;点击“导出”&#xff0c;导出题录的txt&#xff0c;注意&#xff1a…

研究方法|用CiteSpace进行科学文献可视化分析

研究方法|用CiteSpace进行科学文献可视化分析 CiteSpace是什么&#xff1f; 简单来说&#xff0c;它一款通过将国内外文献进行可视化分析来帮助你了解一门学科前世今生的软件。 面对成千上万篇的文献&#xff0c;怎样才能快速锁定自己最感兴趣的主题及科学文献&#xff0c;找…

❤️这两个文献神器绝了!一张图谱梳理文献脉络

文章目录 引言神器1&#xff1a;connected papers关联文献图谱过往工作衍生工作 神器2&#xff1a;semantic scholar文献检索被引情况Semantic Reader阅读器 小结 引言 每当我们接触一个新技术领域时&#xff0c;往往需要借助大量的文献调研&#xff0c;来梳理研究现状。 尤其…

论文写作——origin画图

一 origin的安装 详见下面网址&#xff0c;内涵下载路径和破解方法。 http://www.ddooo.com/softdown/51005.htm 1. 下载origin 网址&#xff1a;https://thepcgo.com/origin-pro-8-0-free-download/ 2.下载破解相关压缩包 链接&#xff1a;https://pan.baidu.com/s/1LwA…

Endnote参考文献分享与导入

Endnote参考文献分享与导入/转移 文章发给老师如何将参考文献一同发送 软件版本为X8 一、分享 首先找到Endnote library的位置&#xff0c;将两个文件【一个是后缀为enl的数据库文件和另一个是.data文件夹】一起复制到一个文件夹&#xff0c;压缩通过网盘、U盘等方式发送给接…

名帖376 祝允明 草书《滕王阁序并诗》

《中国书法名帖目录》 祝允明&#xff0c;号枝山&#xff0c;明长洲(今苏州)人。弘治五年(1492)举人&#xff0c;天资卓越&#xff0c;五岁能作径尺大字&#xff1a;九岁能诗&#xff0c;写文章有奇气&#xff0c;且才思敏捷&#xff0c;与唐寅、文徵明、徐祯卿号称“吴中四才…

名帖249 文徵明 行书《滕王阁序》

《中国书法名帖目录》 《滕王阁序》是王勃创作的一篇骈文&#xff0c;素有“千古第一骈文”之名&#xff0c;无论从内容上还是从形式上看&#xff0c;都代表了中国骈文的最高成就。 曾有人问如何写出《滕王阁序》这样的作品&#xff0c;殊不知《滕王阁序》这样的雄构不是写出…

《滕王阁序》

滕王阁序 唐 王勃 南昌故郡&#xff0c;洪都新府&#xff0c;星分翼轸&#xff0c;地接衡庐&#xff0c;襟三江而带五湖&#xff0c;控蛮荆而引瓯越。物华天宝&#xff0c;龙光射斗牛之墟&#xff1b;人杰地灵&#xff0c;徐孺下陈蕃之榻。雄州雾列&#xff0c;俊彩星驰&#x…