微信小程序+讯飞语音实现个人语音助手

由于 上传图片过于麻烦,建议 跳转到
github


typora-copy-images-to: images

1. 介绍

​ 本案例主要 实现一个微信小程序语音助手,可以以提供的功能如下:

语音输入返回结果小程序
北京的天气雨水将短暂停歇,最高气温回升至28℃。语音播放 返回结果
讲个笑话随机返回一个笑话语音念出该笑话
苹果百度百科返回“苹果”的百度百科资料语音念出该资料
我想听电台返回实时电台列表信息自动播放电台

理论上 讯飞技能商店中的所有功能 都可以实现。

1526636801838

1526636816672

1526636827310

1526636900445

2. 主界面

1526637275324

3. 主要技术

  • 微信小程序
  • node
  • 基于node的express 框架
  • 讯飞语音接口
  • 百度语音接口
  • FFmpeg 用于转换语音格式

4. 环境要求

  • 外网的服务器
  • node 环境 本例为 v8.9.0
  • 讯飞语音的账号
  • 微信小程序开发者权限

5. 搭建环境步骤

5.1. 搭建FFmpeg

​ 由于讯飞要求的录音格式和微信小程序的语音格式不兼容,所以需要将微信小程序的语音格式进行转换,使用的工具为 FFmpeg 后期将在 node 中调用进行转换。

​ 需要注意的是,此操作需要在你的外网服务器上进行搭建。

5.1.1. 下载

在官方网站中进行下载即可 下载地址

1526638560185

1526638647535

5.1.2. 配置环境变量

​ 下载好后,解压 配置 系统的环境变量

1526638855004

5.1.3. 测试安装是否成功

​ 配置好后,打开命令行工具 输入 ffmpeg 如出现下图结果,表示安装成功。

1526638922938

5.2. 搭建后台nodejs环境

​ 后台代码需要配置在 外网服务器下,如 阿里云,腾讯云等

在后台代码根目录下 打开命令工具 输入:

  1. npm i 安装依赖

  2. 修改 讯飞 ID 和 密钥 (如何获取? 请查看 下面的 开通讯飞语音接口功能章节

    打开 index.js 修改

    1526639696874

  3. 输入 npm run start 启动项目

  4. 接口地址为 http://ip:3005/smart_order

    1526639896820

5.3. 配置微信小程序环境

5.3.1. 导入项目

​ 使用 微信开发工具 导入 微信前台代码

1526639231234

5.3.2. 成功导入

1526639282967

5.3.3. 修改接口地址

1526693974841

5.3.4. 注意

​ 在测试环境下,记得 勾选上 不校验域名xxxxxxx

1526694730284

5.4. 小结

​ 总结以上项目搭建的步骤

  1. 搭建 FFmepg

    ​ 打开命令行工具 输入 ffmpeg 出现以下结果代码成功

    1526694504641

  2. 启动后台 node

    1. 修改 讯飞ID 和 讯飞密钥
    2. 在后台根目录下 输入 npm run start 启动。 默认端口号为 3005
  3. 运行小程序代码

    1. 修改 后台接口地址
    2. 手机运行小程序进行测试。

6. 开通讯飞语音接口功能

​ 本次案例中,我们输入的是一段录音 如 北京天气 这段录音将会发送到讯飞接口,由它 来解析

  • 将录音识别为 北京天气

  • 再将 北京天气 识别为 北京今天15度,微风xxx

    此过程,nodejs后台已经处理好,只需要填入 自己的讯飞资料即可。下面将介绍如何开通讯飞语音,并且进行相关的设置。

6.1. 配置讯飞语音

  1. 打开 官网 进行注册
  2. 注册成功后 登录,再打开 讯飞 AIUI 开放平台
  3. 进入 我的应用
  4. 创建新应用 xxx
  5. 为新创建的应用 添加技能 (电台,笑话,广播等)
  6. 设置 ip 白名单 新手建议直接关闭 即可。
  7. 复制 该应用下的 AppID 和 ApiKey 复制到 nodejs 后台代码中即可。

6.2. 配置讯飞语音详细步骤

6.2.1. 注册

​ 打开注册页面 填入资料

1526695861392

6.2.2. 登录

​ 直接登录,然后跳转到 讯飞 AIUI 开放平台

1526695985470

6.2.3. 进入 我的应用

​ 进入 我的应用

1526696077007

6.2.4. 创建新应用

​ 因为我们这个案例 单独 创建一个应用, 名字自拟。

1526696226864

6.2.5. 为新应用添加技能

​ 本案例中的 天气、笑话、广播等 都是该应用中的一个技能,因此,需要自己先添加。

​ 点击进入 刚才新创建的应用 然后添加技能

1526696650930

小程序的处理代码,理论上,只要不断添加 case 代码 即可自己添加处理

1526696673710

6.2.6. 设置ip白名单

​ 在讯飞中设置ip白名单,否则会出现 ip非法 的错误

1526696776387

6.2.7. 复制 AppID 和 ApiKey 到后台nodejs中

1526696912169

7. 使用步骤

​ 当环境都搭建成功后,开始测试

1526694984746

8. 帮助

​ 因为本次案例,任何环节的操作失误都容易导致失败,并且在进行接口调试时,由于数据相对麻烦,因此在此给出一些建议。

8.1. 调试

​ 进行调试时

  • 后台 需要经常监控,容易出现一次错误,后台 直接 崩溃
  • 小程序 多 log 打印结果进行调试

8.2. 讯飞语音接口

1526697175528

1526697269908

9. 联系方式

​ 如出现问题,直接在该页面下留言即可。看到会回复。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55030.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为小艺输入法测试版 1.0.19.103 发布

新增微信 / QQ 回车键发送消息功能开关 华为小艺输入法迎来 1.0.19.103 版本众测,本次更新后,新增微信、QQ 回车键发送消息功能开关;新增商城语录、表情、皮肤等投诉举报入口;新增拼音输入过程中上滑数字不打断输入;联…

「流云行走,代码穿梭:Wails 携手 ChatGPT 打造 MOOC 下载器」

AD 需要gpt账号的v : iseswordgpt起名字 gpt翻译代码 因为为下载器里面有js加密代码,之前就是把网站上面的js加密代码扣下来,用goja运行js代码,但是它不能用于协程,要是想用goja,就要每个协程运行一个goja.Runtime。…

从清奇的角度有效地学习C++基础(只要没更完有空就更)

目录 一个学习工具 面向ChatGPT编程 bool类型(布尔类型) 内联函数inline C宏定义 内联函数实现 函数重载 给函数重载加点bug 如何规范重载函数? 参数缺省 函数赋值顺序 默认值赋值顺序 给缺省函数加点bug 引用 命名空间namesp…

亚马逊查询关键词排名的工具_亚马逊关键词的概念和查找工具

亚马逊销售中最重要的是“排名”。 而“关键字”对提高排名很重要。 搜索结果对亚马逊的销售产生重大影响。 要想让你的产品被显示在搜索结果的顶部,那你必须选择有效的关键字。 搜索关键词排名一直上不去,你可能会这么想: “关键字不好吧...…

阿里云盘注册邀请码——每日限量,先到先得!

阿里要推出网盘了,现在处于公测阶段,注册需要输入邀请码,免费1个T的空间,速度吊打某度盘,10M/s。 申请公测 现在需要官方填表申请公测表,一般一周内会发出公测邀请码。 以下提供几个可用的邀请码【推荐前…

阿里云盘万能邀请码,某盘彻底慌了(每天更新~)

哈喽~这里是小宝库,前段时间阿里云盘开始内测,但是邀请码很难申请,现在云盘慢慢加大了测试力度,也放出了一些可以多次注册使用的邀请码,小编搞到了几个,在这里分享给大家,随时可能失效&#xff…

格灵深瞳——人脸识别算法测试FRVT

7月3日,美国国家标准与技术研究院(NIST)公布了全球最权威的人脸识别算法测试(FRVT)的最新结果,首次参与此竞赛的格灵深瞳取得了优异成绩:在最具挑战的“非约束性自然环境人脸照片”测试项目中获…

格灵深瞳开盘破发,市值73亿,创始人曾是谷歌眼镜创始成员

杨净 发自 凹非寺量子位 | 公众号 QbitAI 科创板AI第一股来了! 3月17日,格灵深瞳正式在上海证券交易所科创板挂牌上市。 股票代码688207,发行价为39.49元/股,对应市值约为73.05亿元。 按照此前的招股书显示,此次IPO格灵…

室友还不知道FAST中国天眼是什么,快把这篇文章推给他,浅学一手卫星通信

方位角、仰角和站星距的计算 星座设计:覆盖方式 卫星星座:由多颗卫星按照一定的规律组成的卫星群。 卫星环的覆盖带:由多颗卫星组成的卫星环沿空间轨道运行对地面的覆盖。 星座种类:星状星座(“铱”系统)和…

35岁以10亿美元身价登上《财富》杂志亿万富豪榜的电商传奇谢家华

Zappos的介绍 Zappos可谓是电商的传奇,国内同类电商是乐淘。Zappos是一家在线卖鞋和服装的公司,1999年创立,2009年被亚马逊以12亿元收购, 多次入选财富杂志最佳雇主公司top100。 Zappos的创始人及CEO 提到Zappos就不得不介绍下…

格灵深瞳IPO获同意:毛利率远高于行业均值,营收增速开始下滑

近日,上交所科创板披露的信息显示,北京格灵深瞳信息技术股份有限公司(下称“格灵深瞳”)的首次公开发行股票注册获得获得了证监会的同意批复。这意味着,格灵深瞳拿到了IPO批文,有望在近期实现上市。 据贝多…

格灵深瞳年营收3.5亿:首度实现盈利 现代汽车拟减持

雷递网 雷建平 4月25日 北京格灵深瞳信息技术股份有限公司(公司代码:688207,公司简称:格灵深瞳)日前发布财报,财报显示,格灵深瞳2022年营收为3.54亿元,较上年同期的2.94亿元增长20.4…

格灵深瞳开源全球最大最干净的人脸识别数据集:Glint360K

本文转载自知乎,已获作者授权转载。 链接:https://zhuanlan.zhihu.com/p/265673438 1.数据集的表现 学术界的测评比如IJB-C和megaface,利用该数据集很容易刷到SOTA,大家具体可以看论文,这里展示一下IFRT的结果&#xf…

格灵深瞳招股书摘要-技术部分

以下内容仅供个人学习和借鉴,如侵权立删! 一、经营模式 公司主要从事计算机视觉技术和大数据分析技术的研发和应用。公司的盈利 来源于向客户提供面向应用场景的人工智能产品及解决方案获得销售收入。公司 自主研发的人工智能产品主要包括智源智能前端…

格灵深瞳CTO邓亚峰:AI学习的三种路线

导读:人工智能多年来一直是行业热门,AI人才也受各大公司争相聘请。如何能快速掌握AI技能?高水准的AI人才应该具备哪些专业能力?AI大牛是怎么炼成的?格灵深瞳CTO邓亚峰总结的AI学习路线,十分值得一读。 邓亚…

格灵深瞳赵勇:计算机视觉在安防、交通、机器人、无人车等领域的应用

赵勇关注的领域主要按照它的产业规模和离现实的关系来综合进行考量 三年前,计算机视觉对于绝大部分人来说,都是一个非常陌生的名词。但是三年过去了,今天如果你身在科技互联网圈,如果你偶尔也会参加一些科技行业的大会&#xff0c…

云从科技在科创板IPO注册获批,收入远高于格灵深瞳同期

近日,证监会披露的消息显示,同意云从科技集团股份有限公司(下称“云从科技”)首次公开发行股票并在科创板上市的注册申请。这意味着,云从科技已经从证监会取得IPO批文(即“上市通行证”)&#x…

格灵深瞳 CEO 赵勇深度总结:揭开国内智能安防与人脸识别的真实现状

[转] http://www.leiphone.com/news/201703/FDSaYcZGDi6iLZho.html AI 技术的成熟,使得由人工智能来自动消化海量监控视频数据成为可能。目前,人工智能已经逐步渗透到安防行业,最终将会把以视频网络为核心的安防产业,重塑为以结构…

FRVT赛程全纪录:格灵深瞳全球排名前五

作者 | 张德兵,格灵深瞳首席科学家&算法部负责人 来源 | 转载自知乎张德兵 最近两个月,格灵深瞳首席科学家&算法部负责人张德兵与算法团队参加了全球人脸识别算法测试(FRVT、Face Recognition Vendor Test)。虽然是第一次参加此比赛,…

格灵深瞳开源量化算法EasyQuant

深度学习给人工智能算法带来了跃阶式的突破,引领了近几年的AI繁荣发展。相应的,“AI”和“AI”落地应用在各产业领域遍地开花。而深度网络模型的嵌入式应用和加速,则是人工智能落地的重要方向。 为了实现深度网络模型的加速,量化…