调用华为API实现中文语音识别

目录

  • 1. 作者介绍
  • 2. 华为云中文语音识别
    • 2.1 录音文件识别与获取
    • 2.2 限制要求
    • 2.3 对象存储服务(OBS)简介
  • 3. 实验过程以及结果
    • 3.1获得API
    • 3.2 代码实现
    • 3.3 运行结果
  • 参考(可供参考的链接和引用文献)

1. 作者介绍

张楠,女,西安工程大学电子信息学院,2022级研究生
研究方向:图像处理
电子邮件:1049532468@qq.com

路治东,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组
研究方向:机器视觉与人工智能
电子邮件:2063079527@qq.com

2. 华为云中文语音识别

2.1 录音文件识别与获取

由于录音文件识别通常会需要较长的时间,因此识别是异步的,即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后返回job_id参数,然后用户通过调用录音文件识别状态查询接口来获得转写状态和结果。

2.2 限制要求

1.音频时长不超过1分钟
2.支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。
3.支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、vox8k4bit、v3_8k4bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR。
4.语音时长不超过5小时,文件大小不超过300M。

2.3 对象存储服务(OBS)简介

对象存储服务(OBS)是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。

对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。

目前仅支持访问用户个人OBS下的音频的链接,不支持读取其他用户公共读的链接。

3. 实验过程以及结果

3.1获得API

1、注册华为云账号,进行实名认证,开通服务。
2、AK/SK认证,下载文件credentials.csv
登录控制台。
单击页面右上角的用户名,并选择“我的凭证”。进入“我的凭证”页面:
在这里插入图片描述
单击“访问秘钥”页签下的“新增访问密钥”。弹出“新增访问密钥”对话框:
在这里插入图片描述
输入“登录密码”,如果绑定了手机或者邮箱,还需要获取验证码并进行验证。验证成功后,弹出访问密钥下载对话框。
单击“确定”,并根据提示下载保存访问密钥。
如果已生成过AK/SK,找到原来已下载的AK/SK文件,文件名一般为:credentials.csv。
在这里插入图片描述
3、创建“公共读”桶
打开控制台,找到对象存储服务OBS
在这里插入图片描述
在“桶列表”中,找到创建桶,进行创建
在这里插入图片描述
按要求填写,注意:桶策略 选择“公共读写”:
在这里插入图片描述
4、上传音频
在OBS“桶列表”页,单击创建的OBS桶:
在这里插入图片描述
进入“对象”页面,将音频数据上传至OBS桶中:
在这里插入图片描述
5、获取音频URL
单击已上传的数据名称,进入数据详情页:
在这里插入图片描述
复制链接,获取数据URL:
在这里插入图片描述
6、在API Explorer中调试接口:
在这里插入图片描述
本案例中使用pcm16k16bit的录音文件格式,python实现代码如上图所示。

3.2 代码实现

1、提交录音文件识别

#############下载需要的库
from huaweicloudsdkcore.auth.credentials import BasicCredentials
from huaweicloudsdksis.v1.region.sis_region import SisRegion
from huaweicloudsdkcore.exceptions import exceptions
from huaweicloudsdksis.v1 import *
###############导入AK和SK
if __name__ == "__main__":ak = "<YOUR AK>"sk = "<YOUR SK>"credentials = BasicCredentials(ak, sk) \client = SisClient.new_builder() \.with_credentials(credentials) \.with_region(SisRegion.value_of("cn-north-4")) \.build()try:request = PushTranscriberJobsRequest()configbody = TranscriberConfig(audio_format="auto",_property="chinese_16k_media",add_punc="yes")request.body = PostTranscriberJobs(data_url="YOUR URL",####获取的音频URL
config=configbody)response = client.push_transcriber_jobs(request)print(response)except exceptions.ClientRequestException as e:print(e.status_code)print(e.request_id)print(e.error_code)print(e.error_msg)

生成job_id
在这里插入图片描述
2、获取录音文件识别结果

#############下载需要的库
from huaweicloudsdkcore.auth.credentials import BasicCredentials
from huaweicloudsdksis.v1.region.sis_region import SisRegion
from huaweicloudsdkcore.exceptions import exceptions
from huaweicloudsdksis.v1 import *
###############导入AK和SK
if __name__ == "__main__":ak = "<YOUR AK>"sk = "<YOUR SK>"credentials = BasicCredentials(ak, sk) \client = SisClient.new_builder() \.with_credentials(credentials) \.with_region(SisRegion.value_of("cn-north-4")) \.build()try:request = CollectTranscriberJobRequest()request.job_id = "YOUR JOB_ID"  ####上一步获取的job_idresponse = client.collect_transcriber_job(request)print(response)except exceptions.ClientRequestException as e:print(e.status_code)print(e.request_id)print(e.error_code)print(e.error_msg)

3.3 运行结果

在这里插入图片描述

参考(可供参考的链接和引用文献)

1.华为云提供的示例音频
2.报错参考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25618.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python处理Word文件的优秀方案

Python处理Word文件的优秀方案 如今&#xff0c;Word文档在生活中变得越来越普遍&#xff0c;不仅在学校或办公室中使用&#xff0c;而且也在日常生活中&#xff0c;像编辑简历、写作业、撰写文档和工作报告等方面也十分常见。因此&#xff0c;学习如何使用Python处理Word文件…

期待文心一言体验号

期待百度文心一言的体验号&#xff0c;用好chatGPT首先要问自己想要什么&#xff0c;该怎么问才能高效拿到想要的目标结果。遇弱则弱&#xff0c;遇强则强&#xff0c;遇到正能量就能传递正能量&#xff01; 谁有文心一言体验地址麻烦提供一下&#xff0c;交流一下: 下方是回复…

ChatGPT时代:数据标注会成为一种人机交互“语言”么?

标注猿的第70篇原创 一个用数据视角看AI世界的标注猿 大家好&#xff0c;我是AI数据标注猿刘吉&#xff0c;一个用数据视角看AI世界的标注猿。 从去年的10月份到现在有半年的时间没有更新了&#xff0c;去年没有更新是疫情的原因&#xff0c;今年没有更新主要有两个原因一…

Plus 版 Chatgpt,和任何的 PDF 聊天! #Chatpdf

Chatgpt 的出现&#xff0c;颠覆了整个内容生产行业的同时&#xff0c;也极大地提高了很多文字工作者的效率。 于是一时之间&#xff0c;各大公司都在争先推出自己的聊天机器人&#xff0c;希望在这个新兴而庞大的市场分一杯羹。‍‍‍‍‍‍‍‍ 于是 Chatpdf 出现了&#xff…

大厂程序员手把手教你如何写简历(附简历模板)

代码随想录刷题网站上线咯&#xff1a;programmercarl.com&#xff0c;200道力扣题目刷题顺序&#xff0c;详细题解&#xff0c;支持C、Java、Python、Go、JS等多语言版本&#xff0c;一个你只要发现&#xff0c;就会收藏的硬核算法学习网站。 文章目录 简历基调谨慎使用精通两…

ChatGPT做的简历戳中HR心巴,小伙刚毕业就拿下梦想offer!

西风 发自 凹非寺量子位 | 公众号 QbitAI 鹅妹子嘤&#xff0c;最近一位毕业生用ChatGPT生成的求职信&#xff0c;分分钟躲过简历筛选算法。 然后&#xff0c;自己梦寐以求的工作就真的到手了&#xff01; 这位用ChatGPT帮忙找工作的小伙表示&#xff1a; 三月份以来写所有东西…

软件测试个人求职简历该怎么写,模板在这里

目录 1、个人资料 2、专业技能 3、工作经验 4、项目经验 5、教育背景 1、个人资料 姓 名&#xff1a;xxx 性 别&#xff1a;x 手机号码&#xff1a;138888888xx 邮 箱&#xff1a; xxx 学 历&#xff1a;本科 专 业&#xff1a;电子商务 英 语&#xff1a;四级 当前工作…

程序员简历应该怎么写?

说到程序员简历&#xff0c;这两个月&#xff0c;我看过不下10,000份简历。。。 答主不是HR&#xff0c;也不是技术负责人&#xff0c;但是在网站的运营工作中&#xff0c;每天最开心的事情就是研究候选人的简历了~~ 这些人中&#xff0c;有BAT的资深大牛程序员&#xff0c;也有…

建议这样使用ChatGPT,让你成为更好的开发者

这样使用ChatGPT&#xff0c;让你成为更好的开发者 作为开发人员&#xff0c;您的责任之一是不断学习和提高您的技能。ChatGPT 是一个强大的工具&#xff0c;可以通过多种方式帮助您成为更好的开发人员。如果你不知道什么是 ChatGPT&#xff0c;它是 OpenAI 开发的一种大型语言…

大会线上同步直播, 来不到现场也可以线上看直播,以及参会秘籍

紧急提醒&#xff1a;还有1天&#xff01; 2020.NET开发者大会就要开幕啦&#xff01; 你都做好参会准备没有&#xff1f; 特殊时期&#xff0c;为方便小伙伴们顺利参会&#xff0c;小编特意整理了这篇大会参会攻略&#xff0c;大到各种日程安排、小到签到、出行、防疫等&#…

10、记录使用科大讯飞的语音唤醒硬件生成PCM文件,通过ffmpeg库去生成MP3音频文件

基本思想&#xff1a;不太会ffmpeg解析pcm的音频文件&#xff0c;所以记录一下结合具体的场景和具体的应用 具体生成的pcm使用的官方代码&#xff0c;不详细叙述&#xff0c;官方的唤醒模块将会产生一个pcm文件&#xff0c;可使用下列命令或者代码将pcm转成mp3文件&#xff0c…

深兰科技亮相2023数博会:硅基知识大模型推动个人数字化产业

近日&#xff0c;2023中国国际大数据产业博览会 “数字经济与实体经济深度融合”论坛在贵阳举行。腾讯云、京东集团、网易、深兰科技等8家企业负责人进行了行业演讲。 作为2023数博会的专业论坛之一&#xff0c;本次论坛以“数融百业 创变赋新”为主题&#xff0c;从数实融合视…

吴怀宇 | 对比欧盟,中国的《人工智能法案》应有什么底座?

来源&#xff1a;OpenDAI 作者&#xff1a;吴怀宇 中国科学院博士、北京大学博士后 2023年6月14日&#xff0c;欧洲议会全体会议表决通过了《人工智能法案》授权草案&#xff0c;标志着该法案将进入欧盟立法严格监管人工智能技术应用的最终谈判阶段。欧洲议会此前曾发出声明&a…

希尔伯特旅馆里,住着AI的某种真相

“无穷”和“无穷1”&#xff0c;哪个更大&#xff1f; 已经吸收了不知道多少数据的AI模型&#xff0c;和比他多学习一条数据的模型&#xff0c;哪个更智能&#xff1f; 想聊聊这个问题&#xff0c;出于一个偶然的机会。很早之前我在测试ChatGPT的时候&#xff0c;突然想问他个…

AI大时代——一次全新的生产力革命

✏笔者按&#xff1a; 我这个人是比较笨的&#xff0c;我是在3月9日左右才恍然意识到一个崭新的AI大时代已经到来了。 全文7339字&#xff0c;阅读需要约10分钟 >>前言 我是在大三时候阅读《游戏编程中的人工智能技术》这本书的时候接触到的人工智能和神经网络的相关…

“AI教父”Geoffrey Hinton:智能进化的下一个阶段

来源 | The Robot Brains Podcast OneFlow编译 翻译 | 杨婷、贾川 ChatGPT等大模型带来的震撼技术革新&#xff0c;让Geoffrey Hinton突然改变了自己的一个想法。 这位75岁的“人工智能教父”意识到&#xff0c;数字智能优于生物智能的进程无法避免&#xff0c;超级智能很快就会…

为什么说 AI 将拯救整个世界?

【CSDN 编者按】AI 会让我们失业吗&#xff1f;AI 会“杀”死人类吗&#xff1f;当一门重要的新技术横空出世的时候&#xff0c;人们总是会担心它给人们带来的种种威胁&#xff0c;基于此&#xff0c;本文作者认为&#xff0c;虽然 AI 风险很高&#xff0c;但也存在非常有影响力…

从破解虫脑到攻克人脑:一条“永生之路”的新赛道?

从破解虫脑到攻克人脑&#xff1a;一条“永生之路”的新赛道&#xff1f; 首张果蝇大脑连接组&#xff1a;耗费十余年&#xff0c;重建三千神经元&#xff0c;超50万突触&#xff01; 论文地址 果蝇幼虫大脑的连接组。 所有脑神经元的形态学都经过了突触分辨率的电子显微镜成像…

大模型技术发展概述 -(三)

文本内容参考论文《A Survey of Large Language Models》 论文标题&#xff1a;A Survey of Large Language Models 论文链接&#xff1a;https://arxiv.org/pdf/2303.18223v10.pdf 大模型技术发展概述 -&#xff08;三&#xff09; 5. 适应性调整LLM5.1 指令&#xff08;Instr…

C++爱心代码

C爱心代码 效果图 代码 #include<stdio.h> #include<Windows.h> int main() {float x, y, a;for (y 1.5; y > -1.5; y - 0.1){for (x -1.5; x < 1.5; x 0.05){a x * x y * y - 1;putchar(a * a * a - x * x * y * y * y < 0.0 ? * : );}system(&…