《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

简介:

OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型

当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字应用。较为出色的分别是Buzz和WhisperDesktop

功能:

  • 支持将多种语言的视频或者音频文件,转换成字幕文件、带时间轴的文本、纯文本。
  • 支持多语言音翻译成英文
  • 英文可以使用网页翻译功能翻译成中文

用途:

  • 字幕文件导入剪辑软件可以一键上字幕,生产力MAX
  • 配合PotPlayer能够生成双语字幕,学习英语简直离不开它俩
  • 对于纯外语不带字幕靠听力的视频资料,简直不要太友好
  • 视野开阔的必备工具,经常了解世界顶尖科技的童鞋们应该知道,大佬们的视频基本都是口述讲解,有了它,随时随地快速学习。

优劣势:

  • 准确率极高!超出你使用过的绝大多数在线转写!OpenAI训练的模型就不用多说了吧!基本不需要二次修改!
  • 速度超快!Whisper使用GPU进行转写(仅支持N卡),5分钟的视频还是使用最大的模型,亲测只需要30秒!(没有对比就没有伤害,只有剪过视频的同学才知道其他软件的痛)
  • 永久免费!一些在线转字幕网站收费真的很贵,时间真的很长!
  • 对于GPU性能弱的同学,Buzz使用CPU转写,虽然准但是速度真的很慢,使用最大模型5分钟的视频能需要10分钟。
  • 仅支持本地使用,网页视频我从来不会用这个,网页视频可以使用插件生成双语字幕,也很轻松,这里不做过多介绍。

下面贴出他们的官网:GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.和GitHub - Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model​​​​​​

使用说明:

仅演示Whisper,Buzz和Whisper仅仅是界面不同,从官网下载后打开软件程序,首先选择模型,模型和程序都在上面的官网中。

点击ok等待结束,然后第一栏选择原音视频的语音,translate若勾选则输出英文,不勾选直接输出原音视频语言。

地址栏第一行选择音视频地址,第二行选择输出地址,若勾选place that file选项则代表输出到原文件夹中。output format选项中选择输出类型:纯文本,带时间轴的文本,字幕srt文件等。

结束语:

汪~到这里教程完全结束了!本人不推荐buzz,由于它使用cpu处理文件,导致它处理速度和其他软件速度不相上下。如果您的电脑为轻薄本,建议使用在线服务,例如讯飞每天有免费额度官网如下:讯飞听见-免费在线录音转文字-语音转文字-录音整理-语音翻译软件

但是您仍然可以使用buzz因为它真的很准确,远超其他软件并且免费。

博主有话说:

算是给看到最后的人的福利吧建议看完


还记得三四年前大概是我大一的时候,剪视频只能用一写普通的模型转换文字,准确率很差,每次几乎每句话都要重新修改,加字幕甚至需要一个小时以上,累得要死。

一两年前,出现了类似讯飞这种语音行业顶尖的企业,准确率大幅提升,我开始用手机语音转文字,再把文字放入剪映中,加字幕不到半小时,但还是很麻烦。

现在,AI训练无数参数生成的模型,准确率高的不用我再检查,一键生成工具能够调用模型,生成处理完成仅用几分钟。


人工智能真的是发展的飞快,世间也是沧海桑田,合理运用工具的人只会效率更高,我深有感触,在最近的这些日子里,我学会了用chatgpt的API总结视频网站,一瞬间爬取字幕,并总结视频。这让我学习教学视频时知道哪些是我想要的,能够快速获取知识点。我学会了一键用chatgpt总结网页,并列举主要内容,这使我在学习不同领域的知识时能够快速获取要点,还有好多。。


有些跑题了,就说到这里,但是这些能够真真切切的提升我的学习效率。有那么一句话真的说的很对,AI不一定会淘汰你,淘汰你的是使用AI工具的人。至此,对大家进行警醒,跟随时代进步,我们才会进步。否则我们就会像上一代长辈不会使用手机一样,被时代淘汰。


人生,是不断的学习的过程,共勉。


以后在我博客中,不会再提及类似的感悟,算是给现在关注我的几十个粉丝们的小福利吧!最后,文章内容全部手打,本文用时6个小时。喜欢的朋友快来关注我吧!汪!(后续的文章可能会越来越精简了)

附图

附图:调用chatgpt的api总结一篇教学文章,文章是随机找的。

 附图:对某个网页视频进行总结。

 还没想好后续写什么,关注我,由浅入深学东西,欢迎私信!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15787.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用GitChat赚钱的6种方法

先说下GitChat这个平台,其主页是:https://gitbook.cn/ 。 GitChat是针对技术人的知识付费平台,创始人是谢工,中途被CSDN收购,现在属于CSDN,不过依然是以独立品牌在运作。目前已完成和CSDN的衔接&#xff0c…

ChatGPT帮你梳理最全Java多线程编程知识

目录 引言 引入多线程编程的重要性和应用场景 介绍多线程的优势和挑战 什么是多线程? 线程与进程的区别 线程的创建与生命周期管理 线程的创建方式 …

ChatGPT、Midjourney不香了吗,New Bing 已向全球个人开放

文章目录 1. 前言2. 教程3. 开始 Bing AI 以上图片均由Bing AI生成。(后文给出第一幅图的关键字) 本文没有任何广告,放心食用,并且手把手教你怎么配置new bing,有需要的耐心看完哦,不懂的可私信我~ 1. 前…

胎教级培训手册:两步让ChatGPT成为小红书标题大师

文 / 高扬(微信公众号:量子论) 上篇介绍了如何编写小红书爆款笔记的内容部分,今天重点介绍给小红书内容起标题。 最近做小红书,我发现一个规律,要想做爆款,除了内容优秀,除了首图亮眼…

关于ChatGPT,我们请小红书技术人和NLP专家聊聊原理和潜力

在微软、百度、阿里、腾讯、小米纷纷宣布入局之后,ChatGPT 再次被送上科技头条。 图源:Financial Times 互联网公司们的争相表态,让大家似乎看到了 ChatGPT 落地应用的曙光。相比去年底,关于 ChatGPT 的讨论,也从技术…

打破创作界限,1天创作1000篇精品小红书带货笔记!chatgpt超级写手机器人创作流程介绍。

【Chatgpt超级写手机器人教程】 1天创作1000篇精品小红书带货笔记!✨ 难听的真话:做运营不用RPA好比猴子不用工具。RPA就是非技术人最佳自动化利器,学三个月Python不如学一周RPA 我是RPA帮创始人阿愚呱呱,特会玩赚RPA的运营人。[R…

胎教级培训手册:四步让ChatGPT成为小红书爆款大师

文 / 高扬(微信公众号:量子论) 最近公众号更新有些慢,因为我在配合陈楚(chenchu727)做小红书。 ChatGPT用在小红书上具有天然优势,然后再接合AI绘画,更是绝配。 AI绘画,陈…

DNS配置与爬虫原理——Dialogue with ChatGPT

本文记录一次与ChatGPT的有趣对话 PS:劳资自下而上,只差应用层了~~ 不对,还不知道ARP欺骗怎么辨别和防止 PS2:问过校园网mac了,应该没有ARP欺骗 学这个有什么用,好玩吗? 写一个爬取对方QQ好友的小程序 很抱…

RK3566-视频话机智慧校园主板方案

RK3566 是一款专为消费类行业应用打造的通用型 SoC。CPU 采用 4 核 A55 架构处理器,集成 G52 图形处理器,且内置独立 NPU,算力为 0.8Tops,运行安卓 11 或 Linux 系统。 基本参数 SOC RK3566,4*A55处理器&#xff0c…

校园网搭建3.0分享梳理,测试还没完成

几个有意思的网络拓扑图先瞧瞧 🐼:网吧网速是流畅到每一秒钟的 步入正题 在某学院校园网目前的实际情况在充分调研的基础上,结合目前技术的发展方向和用户的实际需求,制订了学院校园校园网建设的整体设计方案。通过校园网的设计与…

学术会议盘点!2023年发表SCI的绝佳机会

◆ChatGPT热潮带来的行业革新大行其道,相关区块链、信息安全、视觉、机器学习....产业必将带来诸多变革。 本文为大家梳理了近期可投的4则EI检索的国际会议,均可推荐发表SCI,还有超多IEEE Fellow主讲,不仅涵盖计算机各个学科方向&…

征文 | 吸引铁粉?成为CSDN明星!

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! 征文 | 吸引铁粉?成为CSDN明星! 导读 当今数字时代,社交媒体和在线社区成为了人们交流和分享的主要平台之一,CSDN就是其…

有奖征文丨AIGC + Cocos 社区征稿全面开启

AIGC游戏开发,已经发展到何种恐怖地步? 晓衡做了一个视频,介绍了社区大佬,也是晓衡的朋友、老师(之一)——孙二喵,最近的AIGC研究,真的是让人有种瑟瑟发抖的感觉! 视频中…

Git Bash 上传本地文件到Gitee(AI助力解决问题)

#[端午特别征文]探索技术极致,未来因你出“粽”# 前言 消失了将近一个月,预祝大家端午节快乐! 这篇文章主要介绍下在上传本地项目到gitee时出现的问题,以及借助AI解决问题。 Gitee是一个基于 Git 的代码托管和开发协作平台&…

2023年上半年部分团队的总结

把各个环节连起来 从我加入 CSDN 后不久,我就开始公开地总结我们的工作,我分管的团队留下了不少的总结和思考: 这是 2022 年下半年的汇报 这是 2022 年上半年的汇报 这是 2021 年年底的汇报 经过这些思考改进迭代的团队,是不是…

Chatgpt在程序员领域的革新:分析好处与挑战

#【端午特别征文】 探索技术极致,未来因你出“粽”# 前言: 总所周知,当前非常流行的Chatgpt对我们的生活冲击力巨大,那么,今天跟着小编一起来深入了解下这项技术给我们生活带来了哪些便利和困扰。 目录 前言 1、Chatg…

chatgpt赋能python:Python如何优化做题效率?

Python如何优化做题效率? 介绍 Python语言是当前互联网最热门的编程语言之一,全球甚至有将近百分之九十的公司都在使用它。它的简洁、易读以及强大的数据分析能力都得到了广泛的认可。但是,很少有人意识到Python也是一个很好的做题语言。在…

chatgpt赋能python:Python自动做题:实现高效自动化解决方案

Python自动做题:实现高效自动化解决方案 随着互联网的飞速发展,各种在线考试、测试平台层出不穷,然而,对于广大学生或考生们来说,做题并不是一件轻松的事情。不仅需要花费大量的时间和精力,还要耗费大量的…

产品再次跳票 法拉第未来的融资价值却渐渐浮现?

从“生态化反”到“极智科技顶奢”,贾跃亭讲故事的出众能力,总是能为旗下企业和产品赚足市场眼球。 但仅有宏大的前景描绘,似乎难以触动理性的资本市场,其创立的新能源车企法拉第未来(NASDAQ:FFIE&#xf…

2023年的互联网行业,有哪些机遇和挑战?

当手机发布会的周期越来越短,产品却大同小异,当消费电子的形态不再千奇百怪,人们开始节衣缩食...... 很多人可能会有疑问,人类科技停滞不前了吗? 答案是当然没有,也幸好没有。 只是在世界经济发展荣光不再…