从Hugging Face下载数据测试whisper、fast_whisper耗时

时长比较短的音频:https://huggingface.co/datasets/PolyAI/minds14/viewer/en-US

时长比较长的音频:https://huggingface.co/datasets/librispeech_asr?row=8

此次测试过程暂时只使用比较短的音频

使用fast_whisper测试

下载安装,参考官方网站即可

 报错提示:

Could not load library libcudnn_ops_infer.so.8. Error: libcudnn_ops_infer.so.8: cannot open shared object file: No such file or directory
Please make sure libcudnn_ops_infer.so.8 is in your library path!

解决办法:

找到有libcudnn_ops_infer.so.8 的路径,在我的电脑中,改文件所在的路径为

在终端导入  export LD_LIBRARY_PATH=/opt/audio/venv/lib/python3.10/site-packages/nvidia/cudnn/lib:$LD_LIBRARY_PATH

test_fast_whisper.py


import subprocess
import os
import time
import unittest
import openpyxl
from pydub import AudioSegment
from datasets import load_datasetfrom faster_whisper import WhisperModelclass TestFastWhisper(unittest.TestCase):def setUp(self):passdef test_fastwhisper(self):# 替换为您的脚本路径# 设置HTTP代理os.environ["http_proxy"] = "http://10.10.10.178:7890"os.environ["HTTP_PROXY"] = "http://10.10.10.178:7890"# 不知道此处为什么不能生效,必须要在终端中手动导入os.environ["LD_LIBRARY_PATH"] = "/opt/audio/venv/lib/python3.10/site-packages/nvidia/cudnn/lib:$LD_LIBRARY_PATH"# 设置HTTPS代理os.environ["https_proxy"] = "http://10.10.10.178:7890"os.environ["HTTPS_PROXY"] = "http://10.10.10.178:7890"print("load whisper")# 使用fast_whisper model_size = "large-v2"# Run on GPU with FP16fast_whisper_model = WhisperModel(model_size, device="cuda", compute_type="float16")minds_14 = load_dataset("PolyAI/minds14", "en-US", split="train")  # for en-USworkbook = openpyxl.Workbook()# 创建一个工作表worksheet = workbook.active# 设置表头worksheet["A1"] = "Audio Path"worksheet["B1"] = "Audio Duration (seconds)"worksheet["C1"] = "Audio Size (MB)"worksheet["D1"] = "Correct Text"worksheet["E1"] = "Transcribed Text"worksheet["F1"] = "Cost Time (seconds)"for index, each in enumerate(minds_14, start=2):audioPath = each["path"]print(audioPath)# audioArray = each["audio"]audioDuration = len(AudioSegment.from_file(audioPath))/1000audioSize = os.path.getsize(audioPath)/ (1024 * 1024)CorrectText = each["transcription"]tran_start_time = time.time()segments, info = fast_whisper_model.transcribe(audioPath, beam_size=5)segments = list(segments)  # The transcription will actually run here.print("Detected language '%s' with probability %f" % (info.language, info.language_probability))text = ""for segment in segments:text += segment.textcost_time =  time.time() - tran_start_timeprint("Audio Path:", audioPath)print("Audio Duration (seconds):", audioDuration)print("Audio Size (MB):", audioSize)print("Correct Text:", CorrectText)print("Transcription Time (seconds):", cost_time)print("Transcribed Text:", text)worksheet[f"A{index}"] = audioPathworksheet[f"B{index}"] = audioDurationworksheet[f"C{index}"] = audioSizeworksheet[f"D{index}"] = CorrectTextworksheet[f"E{index}"] = textworksheet[f"F{index}"] = cost_time# breakworkbook.save("fast_whisper_output_data.xlsx")print("数据已保存到 fast_whisper_output_data.xlsx 文件")if __name__ == '__main__':unittest.main()

使用whisper测试

下载安装,参考官方网站即可,代码与上面代码类似

测试结果可视化

不太熟悉用numbers,凑合着看一下就行

很明显,fast_whisper速度要更快一些

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/184169.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG

【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG 文章目录 导入库初始化PWM开启PWMPWM硬件BUG硬件BUG复现原因附录:列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结 py打包 导入库 from misc import PWM_V2或者 from misc import PWM但我觉得…

面试算法54:所有大于或等于节点的值之和

题目 给定一棵二叉搜索树,请将它的每个节点的值替换成树中大于或等于该节点值的所有节点值之和。假设二叉搜索树中节点的值唯一。例如,输入如图8.10(a)所示的二叉搜索树,由于有两个节点的值大于或等于6(即…

思谋科技进博首秀:工业多模态大模型IndustryGPT V1.0正式发布

大模型技术正在引领新一轮工业革命,但将其应用于工业制造,仍面临许多挑战,专业知识的缺乏是关键难点。11月5日,香港中文大学终身教授、思谋科技创始人兼董事长贾佳亚受邀参加第六届中国国际进口博览会暨虹桥国际经济论坛开幕式。虹…

家居品牌怎么做小红书投放,寻找家居达人的方式有哪些?

在当今社交媒体的时代,找到优秀的家居博主并不困难。但是,在找家居行业博主的时候,了解家居行业特性就很重要,今天来为大家分享一下家居品牌怎么做小红书投放,寻找家居达人的方式有哪些? 一、家居行业特性 …

【Python3】【力扣题】232. 用栈实现队列

【力扣题】题目描述: 栈:线性集合。后进先出。 队列:线性集合。先进先出。 【Python3】代码: 解题思路:两个栈,一个入队的栈,一个出队的栈。出栈时,若出队的栈为空,才将…

Java 设计模式——解释器模式

目录 1.概述2.结构3.案例实现3.1.抽象表达式类3.2.终结表达式3.3.非终结表达式3.4.环境类3.5.测试 4.优缺点5.使用场景 1.概述 (1)如下图,设计一个软件用来进行加减计算。我们第一想法可能就是使用工具类,提供对应的加法和减法的…

linux粘滞位的介绍及使用

文章目录 1.粘滞位的引入2.粘滞位的使用 1.粘滞位的引入 首先看一个场景 已知 对目录无w权限时 无法进行目录中的文件的创建/删除操作但是普通用户通过sudo命令 以root身份创建一个文件 rw- r-- r-- 普通用户此时是other 没有w权限 但却可以删除 [root和普通用户在一个目录下时…

mysql之子表查询、视图、连接查询

1、子查询返回的结果只能是某列,不能是多列。where条件in什么,子查询的列就是什么 (1)多表联查(不要超过3张表)重点 ①in包含 ②not in取反(加上where条件过滤,否则没意义&#xff…

基于C#的GRPC

GRPC gRPC(gRPC Remote Procedure Call)是由Google开发的高性能、跨语言的远程过程调用框架。它基于HTTP/2协议进行通信,支持多种编程语言,包括C, C#, Java, Python等,使不同语言的应用程序可以通过远程调用相互通信。…

C#创建Windows Service(Windows 服务)基础教程

Windows Service这一块并不复杂,但是注意事项太多了,网上资料也很凌乱,偶尔自己写也会丢三落四的。所以本文也就产生了,本文不会写复杂的东西,完全以基础应用的需求来写,所以不会对Windows Service写很深入…

软件工程第十周

测试过程 单元测试 注意出错处理!单元测试的数据处理部分请见Junit 单元测试之错误和异常处理-CSDN博客 单元测试准则 白盒:对系统结构非常清楚!就像大题注重过程。 单元测试的测试环境 一定要保证整个环境是完整的,尽管可能没…

论文阅读——变化检测

Viewpoint Integration and Registration with Vision Language Foundation Model for Image Change Understanding 只有fused adapter image encoder, viewpoint registration flow, semantic emphasizing module, 和 fully connected layer 训练,其他参数冻结。 F…

数据结构(c语言版) 队列

链队列 要求&#xff1a;实现链队列的创建、初始化、入队、出队 &#xff08;先进先出&#xff09; 代码 // // Created by My.cy on 2023/10/19. // //链队列 创建、初始化、入队、出队 先进先出#include <stdio.h> #include <malloc.h>//定义结构体 struct…

【Android】android studio 怎么下载NDK

序言 新版的android studio在【Project Structure】里面的NDK路径是灰色的&#xff0c;无法点击&#xff0c;导致找不到ndk路径&#xff0c;也无法添加ndk。 下载方法 去这里找&#xff0c;一定要点这个按钮才能出现ndk。 下载之后&#xff0c;要在这个文件里面添加ndk路径

【JS】判断字符串是否为 url 的方法

文章目录 用法解析 用法解析 当你传递一个字符串给 URL 构造函数时: 如果字符串是一个有效的 URL&#xff0c;它将返回一个新的 URL 对象。否则&#xff0c;它将返回一个错误。 const url new URL("https://www.baidu.com/"); console.log(url);函数封装&#xf…

visual studio Python 配置QGIS(qgis)教程

visual studio Python 配置QGIS&#xff08;qgis&#xff09;教程 这个教程全网独一份啊&#xff0c;博主是自己摸索出来的。 visual studio Python 配置QGIS&#xff08;qgis&#xff09;环境一共分为两部&#xff1a; 第一步安装QGIS&#xff1a; 下载链接如下 https://www…

基于FPGA的模板匹配红外目标跟踪算法设计

为什么要写这篇文章 我写这篇文章的原因是一天在B站看到了一个大神发的视频是关于跟踪一个无人机的&#xff0c;看到作者跟网友的回复说是用的图像匹配算法&#xff0c;我就在网上搜索相关资料&#xff0c;最终找到一篇文献。文献中对该算法的评价很高&#xff0c;满足制导系统…

在湖北考一个安全员c3住建厅安全员c证持证上岗

在湖北考一个安全员c3住建厅安全员c证持证上岗 建筑施工行业专职安全员&#xff0c;从事建筑行业安全或者是安全管理方面的工作&#xff0c;都需要有安全员C证&#xff0c;湖北省安全员C3是属于安全员C证中的一种。 安全员C3证涵盖范围广&#xff0c;大部分报考人员都是选择C…

面试题:线上MySQL的自增id用尽怎么办?

文章目录 前言表定义自增值idInnoDB系统自增row_idXidInnodb trx_id InnoDB数据可见性的核心思想为什么要加248&#xff1f;为何只读事务不分配trx_id&#xff1f;thread_id 总结 前言 MySQL的自增id都定义了初始值&#xff0c;然后不断加步长。虽然自然数没有上限&#xff0c…

竞赛 深度学习疲劳检测 驾驶行为检测 - python opencv cnn

文章目录 0 前言1 课题背景2 相关技术2.1 Dlib人脸识别库2.2 疲劳检测算法2.3 YOLOV5算法 3 效果展示3.1 眨眼3.2 打哈欠3.3 使用手机检测3.4 抽烟检测3.5 喝水检测 4 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习加…