科大讯飞中文+日语语音听写(流式版)

文章目录

      • 1.实现效果
        • 1.1日语效果
        • 2.2中文效果
      • 2.具体实现
        • 1.捕捉麦克风语音输入并保存为.wav文件
        • 2.进行VAD(Voice Activity Detection)检测
        • 3.下载官网python版语音听写demo
        • 4.字幕显示
        • 5.将Python程序打包为exe
      • 3.其它

需求:记录会议的内容,将会议的语音(中文和日文)转为文字字幕并显示在电脑屏幕上。

1.实现效果

在这里插入图片描述

1.1日语效果

在这里插入图片描述
在这里插入图片描述

2.2中文效果

在这里插入图片描述
在这里插入图片描述

2.具体实现

讯飞语音中文实现很简单,登录讯飞开发者平台,创建应用,下载对应的demo就行了,照着文档弄,很简单。

所以我的重点都是日语语音听写(流式版)的实现。

需要提前说明的是讯飞小语种只有语音听写(流式版)支持,且需要提前开通。
在这里插入图片描述

1.捕捉麦克风语音输入并保存为.wav文件

通过pyaudio捕捉麦克风的语音输入

pip install pyaudio
pa = pyaudio.PyAudio()
stream = pa.open(format=FORMAT,channels=CHANNELS,rate=RATE,input=True,start=False,# input_device_index=2,frames_per_buffer=CHUNK_SIZE)

保存为.wav文件

def record_to_file(path, data, sample_width):"Records from the microphone and outputs the resulting data to 'path'"# sample_width, data = record()data = pack('<' + ('h' * len(data)), *data)wf = wave.open(path, 'wb')wf.setnchannels(1)wf.setsampwidth(sample_width)wf.setframerate(RATE)wf.writeframes(data)wf.close()
record_to_file("recording.wav", raw_data, 2)

2.进行VAD(Voice Activity Detection)检测

讯飞的小语种识别真的巨坑,它的文档中有个参数vad_eos
在这里插入图片描述
这个参数的作用:
在默认vad_eos=2000的情况下,比如我说”你好”后停顿1s,再说”早上好”,它认为音频没结束,返回最终结果“你好,早上好”,但是我说”你好”后停顿3s,再说”早上好”,在”你好”后面的2s里音频没有内容,它认为音频已经结束,返回最终结果”你好”。

但是这个参数在中文条件下才有效,小语种条件下根本不生效。(它的文档里也没写,我问讯飞的技术支持才知道的)
在这里插入图片描述

造成的现象:
中文识别没有任何的问题,小语种识别一直在录音,讯飞不会返回任何结果,直到60s后超时返回报错超时.

所以要在客户端主动的实现VAD(Voice Activity Detection)效果.

之前我的代码都是java写的,但是在github上发现java并没有什么好的vad检测的库,最后全部代码换成了python,找到了一个python的vad检测的库。

参考代码:https://github.com/wangshub/python-vad

注意:

但是这个vad库检测的时候也有个坑,安装pip install webrtcvad的时候报错Microsoft Visual C++ 14.0 is required,解决方法是安装Microsoft Visual C++ 14.0及配置好环境

具体参考博客:Windows系统pip install webrtcvad

3.下载官网python版语音听写demo

官网的语音听写demo很简单,替换掉你自己的服务接口认证信息就能跑起来。
在这里插入图片描述

注意3点:

  1. 方言语种开通日语
  2. 小语种url和中英文不同
    在这里插入图片描述
    3.传参时language是ja_jp
    在这里插入图片描述

4.字幕显示

将上面的步骤整合后就能识别到日语了。但还要在window桌面上显示出来还要用到pyqt5.

字幕UI参考: https://github.com/wingood-xu/suspendLyric

PyQt5中文教程:PyQt5中文教程

5.将Python程序打包为exe

一切都弄好后,还要将程序打包为exe.(不可能别人还要装python运行你的程序吧),我这里使用的是pyinstaller打包为exe.

pip install pyinstaller
pyinstaller -F -w  你的执行文件.py

tip:

  1. -w 代表不显示控制台,如果程序运行报错,建议去掉-w,会有一个一闪而过的控制台带有报错的信息,把握时间,截到这个报错信息,粘贴到word内具体分析错误。
  2. 打包的时候不要在全局python环境内打包,不然会把你没用到的包也打包进去,导致包很大。应该在venv环境下打包
  3. pyinstaller打包python时含有多进程代码会出现bug:在pycharm下运行只有两个进程,打包后运行可能有了3个进程。
    解决方法:http://redino.net/blog/2016/04/multiprocessing-frozen-python/
    if __name__ == '__main__':后面添加此行代码:multiprocessing.freeze_support()

3.其它

生成requirements.txt:

pip freeze > requirements.txt

requirements.txt的安装:

pip install -r requirements.txt

使用pipreqs生成requirements.txt:
python 保存项目用到的包名生成requirements.txt
这种方式生成的requirements.txt里面只含你用到的package.

python日志处理:python 日志 logging模块(详细解析)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/70512.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科大讯飞AI学习机T10测评:一台平板,就能实现减负增效?

随着“双减”政策的落地,学生更多的学习时间回归到学校和家庭场景。作为校外最重要的学习场景,现阶段的家庭教育却存在着诸多痛点。 大多数家长普通话和英文发音不标准、汉字生词不认识,不敢教也不会教;低年级孩子自学不得法,慢慢丧失学习信心和兴趣。中高年级学生解题没…

个性化精准学专攻薄弱项!讯飞AI学习机T10助力孩子学习减负增效

暑假往往都是校外培训和补习机构大展身手的时机&#xff0c;家长们不想错过“弯道超车”的机会&#xff0c;早上带着孩子学数学&#xff0c;下午补英语&#xff0c;偶尔还要上上绘画、舞蹈等兴趣班&#xff0c;一天安排的满满当当。但教培市场鱼目混杂&#xff0c;补习机构质量…

用 AI 培养孩子学习兴趣,讯飞新一代智能学习机正式发布!

7 月 22 日晚&#xff0c;以“智慧学习&#xff0c;因 A.I.而能”为主题的科大讯飞智能学习机新品发布会在合肥正式召开&#xff0c;科大讯飞轮值总裁胡郁、科大讯飞副总裁章继东等出席此次发布会&#xff0c;与媒体、用户一起共同探讨中国智慧教育事业的发展与未来&#xff1b…

微软在张家口招人啦!

大家好&#xff01;我是韩老师。 之前大家经常会看到微软在上海、苏州和北京招人。这是因为微软在中国大陆的软件研发团队主要分布在这三个城市。 而这一次&#xff0c;微软在张家口招数据中心技术人员了&#xff01; 有兴趣的童鞋&#xff0c;请砸简历到 junhan(AT)microsoft(…

世界上首个域名注册成功 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 3 月 15 日&#xff0c;在 2016 年的今天&#xff0c;谷歌宣布关闭 Picasa。Picasa 原为一款独立收费的图像管理、处理软件&#xff0c;其界面美观华丽&#xf…

上海亚商投顾:沪指窄幅震荡 “中字头”概念股又暴涨

上海亚商投顾前言&#xff1a;无惧大盘大跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 市场情绪 沪指今日窄幅震荡&#xff0c;深成指、创业板指盘中跌超1%&#xff0c;午后探底回升一度翻红。光伏、储能等赛道午…

发现一个效果超好的视频换脸平台

最近&#xff0c;视频换脸非常火热&#xff0c;各种换脸APP层出不穷&#xff0c;但是很多平台的换脸效果并不理想&#xff0c;出现模糊、换脸效果不好、或是效果视频与本人差距过大的问题 还有一个很大的问题&#xff0c;制作一个换脸视频往往需要等待1个小时左右&#xff0c;…

真人出镜,微信视频号第一期视频来了!

微信最近悄悄上线了「视频号」功能&#xff0c;入口在朋友圈的下方&#xff0c;由此可以看出「视频号」此功能的权重。 有些朋友应该有入口了&#xff0c;可以看到一些视频&#xff0c;但不能发视频。 可能还有部分的人没有出现这个入口&#xff0c;别着急&#xff0c;现在还处…

短视频的人设如何定位?考虑好三点,打造吸引粉丝的人设

短视频的人设如何定位&#xff1f;考虑好三点&#xff0c;打造吸引粉丝的人设 很多小伙伴们在做短视频的时候&#xff0c;都会想要为自己的短视频打造一个不错的人设&#xff0c;尤其是有真人出镜的短视频&#xff0c;如果人设讨喜&#xff0c;那么很快就可以走红。那么&#…

基于easyTrader部署自动化交易(一)

本文介绍&#xff1a;旨在帮助已经有交易策略的朋友能自己完成实盘的自动交易。 写这篇文章之前先要感谢开源项目easyTrader的作者食灯鬼。我在部署项目的过程中也踩了不少坑&#xff0c;记录于此希望能帮遇到这些问题的朋友或者不清楚部署过程的朋友节约时间。 1.项目中需要…

最近频繁出现的AIGC、AIGC技术、AIGC概念股是什么

AIGC&#xff0c;全名“AI generated content”&#xff0c;又称生成式AI&#xff0c;意为人工智能生成内容。例如AI文本续写&#xff0c;文字转图像的AI图、AI主持人等&#xff0c;都属于AIGC的应用。互联网内容的演变过程&#xff1a;PGC——UGC——AIGC 什么是AIGC AIGC是人…

跨国药企在中国 | BioNTech、阿斯利康、富士医疗、卫材等公司新动态

一周热点 &#xff1a;复星医药将与BioNTech组建合资公司。绿叶制药与阿斯利康推进心血管及肿瘤领域深度合作。卫材旗下卫克泰纳入医保目录。Abcam与数问生物扩大合作。Immedica Pharma AB维健医药、再鼎医药和Cullinan Oncology达成合作。 | 投资、合作 BioNTech 复星医药将与…

2020年全球及中国体外诊断行业现状及竞争格局分析,新冠带来全球体外诊断市场的扩容「图」

一、体外诊断综述 体外诊断&#xff0c;即IVD&#xff08;In Vitro Diagnosis&#xff09;&#xff0c;是指在人体之外&#xff0c;通过对人体血液、体液、组织等样本进行检测而获取临床诊断信息&#xff0c;进而判断疾病或机体功能的诊断服务。根据临床医学检验项目所用技术原…

全球医疗器械研发投入前十,这家中国公司领跑榜单

2023年&#xff0c;《医疗设计》杂志公布了最新一期百强榜&#xff0c;评选出了2022全球医疗器械行业最高研发支出和项目的十家公司。这些公司的每年研发支出超过收入的15%。尽管经济面临逆风&#xff0c;医疗器械行业的销售额却创下了新的历史高点&#xff0c;研发支出也加速增…

研究04丨波动率与CTA盈利关键

大家好&#xff0c;今天我们来聊一聊CTA盈利与波动率两者的关系。众所周知&#xff0c;CTA其实是靠beta吃饭的家伙&#xff0c;不光是宽幅震荡&#xff0c;插针&#xff0c;暴涨暴跌AV来回反转&#xff0c;还是暴涨暴跌的行情。这其实都是波动率的体现。从“有行情”这三个字简…

2015-2023年全球医疗器械公司100强(附细分领域排行)

目录 2023全球医疗器械企业100强榜单&#xff0c;12家中国企业上榜 2022年度全球医疗器械公司100强排行榜 2021年全球医疗器械百强排行榜 2020年全球医疗器械企业100强公布&#xff08;年份待定&#xff09; 2020全球医疗器械100强 2019年度全球医疗器械企业100强排行 2…

2021全球医疗健康及各医疗细分领域融资情况分析:中国医疗健康进入高发期,逐渐成为投资热点[图]

一、全球医疗健康融资情况 健康管理不同于传统医疗&#xff0c;以疾病预防干预代替疾病治疗&#xff0c;防病于先。通过定期的全身筛查&#xff0c;提前进行疾病的预防。并采取积极地干预康复手段&#xff0c;保持身体始终处于一个健康状态。从而降低患病的几率。 2021年全球医…

CDMO医药行业龙头企业有哪些?如何系统的分析查看?

CDMO医药行业龙头有哪些&#xff1f;如何系统的分析查看&#xff1f;这是许多医药企业与医药投资者关心的问题。本文将从多个角度去探寻该行业的信息&#xff0c;老规矩先上目录。 1.对CDMO医药行业的龙头企业、行业市场介绍、优势、人才、研发、细分领域、技术、政策、市场、…

2023 年值得关注的 7 大人工智能 (AI) 技术趋势

&#x1f482; 个人网站:【海拥】【摸鱼游戏】【神级源码资源网】&#x1f91f; 前端学习课程&#xff1a;&#x1f449;【28个案例趣学前端】【400个JS面试题】&#x1f485; 想寻找共同学习交流、摸鱼划水的小伙伴&#xff0c;请点击【摸鱼学习交流群】 人工智能 (AI) 已经接…

端午节使用Threejs实现数字人3D粽子

个人主页&#xff1a; 左本Web3D&#xff0c;更多案例预览请点击》 在线案例 个人简介&#xff1a;专注Web3D使用ThreeJS实现3D效果技巧和学习案例 &#x1f495; &#x1f495;积跬步以至千里&#xff0c;致敬每个爱学习的你。喜欢的话请三连&#xff0c;有问题请私信或者加微…