免费将中文视频转换为英文视频并添加中英双语字幕

免费将中文视频转换为英文视频并添加中英双语字幕

背景

女朋友需要找关于《不要随意喂养动物园的动物》的英语视频,因为限定是英语类的视频,所以在国内的视频平台基本无法找到。虽然我是个程序员,但在女友的眼里,只要关于电脑的我都会,无奈只能硬着头皮上……

我第一个想法是到外网的油管上用英文去找相关的视频,但找了好几天都没有找到相关的视频,又或者找到了也不符合她的想法。因此把目光转回国内的视频平台,并最终物色到一个符合她想法的中文视频。而我要做的就是把这个中文视频转化为英文视频并添加中英双语字幕。

思路

  1. 首先把中文视频中的音频提取出来并识别出中文并手动调整中文中的错别字等
  2. 把中文翻译成英文(使用百度翻译或有道云翻译)
  3. 把翻译出来的英文合成为英文音频
  4. 制作中英双语字幕,并把视频中的原中文音频替换为英文音频
  5. 导出英文视频

技术

  • Python3

  • 百度智能云中的语音识别中的音频文件转写功能(通过音频提取出中文)

  • 有道智云平台的语音合成中的语音合成功能(通过单词句子合成为英语音频,百度接口的语音合成只能合成中文音频)

  • 迅捷视频软件(添加字幕软件,有水印版免费)

  • 格式工厂(视频压缩、转换等功能)

  • *Adobe Premiere(提取视频中的音频,非必需,可以使用格式工厂来处理,且是收费的)

实现

  1. 第一步,将视频中的音频提取。可以用格式工厂把视频转为音频(如果你有Pr的话也可以用Pr来提取音频)

  2. 第二步,识别出音频中的中文。这里使用到了百度智能云中的音频文件转写功能。所以首先需要先注册个账号并完成个人认证,百度智能云链接如下:https://cloud.baidu.com/
    注意:使用该功能可以通过领取免费资源来获得免费时长,领取的资源有时效和总时长限制,通过https://console.bce.baidu.com/ai/#/ai/speech/overview/index此链接获取:
    image-20220222211337762

    注册并登录后打开音频文件转写链接:https://cloud.baidu.com/doc/SPEECH/s/Bk5difx04

    image-20220222203714743

    通过概述的三个接入步骤可以知道主要为:

    创建具有音频转写功能的应用→通过该应用的AppID、API Key、Secret Key来获取token→通过token和音频链接创建音频转写任务→查询转写任务的识别结果。
    代码如下:

    1. 获取token
    import requests
    import jsonAPI_key = "你创建应用的API Key"
    secret_key = "你创建应用的Secret Key"
    access_token_url = f"https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={API_key}&client_secret={secret_key}"
    response = requests.get(access_token_url)
    print(response.json())
    access_token = response.json()["access_token"]		# access_token即为我们需要的token
    
    1. 创建音频转写任务(音频可使用百度云对象存储进行音频存储)

      post_url = "https://aip.baidubce.com/rpc/2.0/aasr/v1/create"
      file_url = "你的音频文件的url"
      body = {"speech_url": file_url,		# 音频url"format": "mp3",			# 音频格式"pid": 1537,				# 中文"rate": 16000,				# 采样率	[16000] 固定值
      }
      token = {"access_token": access_token}		# 上一步获得的token# 生成转写任务
      rep = requests.post(post_url, params=token, data=json.dumps(body))
      print(rep.json())
      task_id = rep.json()["task_id"]		# 获得我们需要的task_id
      
    2. 查询转写任务结果

      query_url = "https://aip.baidubce.com/rpc/2.0/aasr/v1/query"
      query_body = {"task_ids": [task_id]
      }
      # 查询转写任务是否完成
      rep = requests.post(query_url, params=token, data=json.dumps(query_body))
      print(json.dumps(rep.json()))
      word = rep.json()["tasks_info"]["task_result"]["result"]		# 成功了的话此变量即为我们需要的所有文字
      
  3. 第三步,使用百度翻译或有道云翻译翻译出英文

  4. 第四步,根据英文合成英文语音。这里用到有道智云AI开放平台。类似百度智能云平台,这里也需要注册,链接如下:https://ai.youdao.com。首次注册会赠送一些资源的时长,包括语音合成的。
    注册并登录后,找到语音合成功能的页面:https://ai.youdao.com/product-tts.s
    类似百度平台一样,创建应用并勾选语音合成
    image-20220222211855692
    找到技术文档:产品文档-语音合成TTS服务
    把Python3的示例拷下来并修改对应的内容:

    image-20220222212109999

    执行语音合成:

    import sys
    import uuid
    import requests
    import hashlib
    import timeYOUDAO_URL = 'https://openapi.youdao.com/ttsapi'
    APP_KEY = '你的的应用ID'
    APP_SECRET = '你的应用密钥'def encrypt(signStr):hash_algorithm = hashlib.md5()hash_algorithm.update(signStr.encode('utf-8'))return hash_algorithm.hexdigest()def truncate(q):if q is None:return Nonesize = len(q)return q if size <= 20 else q[0:10] + str(size) + q[size - 10:size]def do_request(data):headers = {'Content-Type': 'application/x-www-form-urlencoded'}return requests.post(YOUDAO_URL, data=data, headers=headers)def connect():q = "你要合成的英文."name = "保存的文件名"		# 文件名data = {}data['langType'] = 'en'		# 要合成的语言类型salt = str(uuid.uuid1())signStr = APP_KEY + q + salt + APP_SECRETsign = encrypt(signStr)data['appKey'] = APP_KEYdata['q'] = qdata['salt'] = saltdata['sign'] = signdata['speed'] = 1response = do_request(data)contentType = response.headers['Content-Type']if contentType == "audio/mp3":print("成功")millis = int(round(time.time() * 1000))filePath = name + str(millis) + ".mp3"fo = open(filePath, 'wb')fo.write(response.content)fo.close()else:print("类型错误", response.content)if __name__ == '__main__':connect()

    执行完成后将生成mp3文件

  5. 第五步,打开迅捷视频软件,官网:https://www.xunjieshipin.com/video-clip
    添加字幕操作可百度,这里就不展开了,参考:https://jingyan.baidu.com/article/e75057f2a3918faac91a89cf.html

  6. 最后导出视频即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36436.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Youtube——如何将视频中的英文字幕转换成中文字幕

Youtube——如何将视频中的英文字幕转换成中文字幕 1、正常的英文字幕2、点击右下角的设置-Subtitles/CC(2)3、点击Auto-translate4、选择Chinese(Simplified)&#xff0c;此时可以看到已经翻译成中文了 1、正常的英文字幕 2、点击右下角的设置-Subtitles/CC(2) 3、点击Auto-tr…

20230720今天youtube上的中文字幕自动翻译成为英文的功能失效!

20230720今天youtube上的中文字幕自动翻译成为英文的功能失效&#xff01; 2023/7/20 12:42 &#xff1f;做YouTube挣钱吗&#xff1f; 115网盘 满了。最新 张家界 旅游的视频 放到 youtube就是 60岁/老了的时候的回忆&#xff01; 放到 大陆不保险&#xff01; 如需使用自动翻…

数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)

文章目录 前言一、箱型图是什么&#xff1f;1-1、箱型图介绍1-2、箱型图的作用1-3、实战 二、Q-Q图是什么&#xff1f;2-1、Q-Q图&#xff08;分位数-分位数图&#xff1a;quantile-quantile plot&#xff09;介绍2-2、实战2-3、为什么要使数据呈现正态分布以及出现了正态分布&…

教你体验目前最火AI - 在craft AI assistant使用AI助手

chatGPT大火之后&#xff0c;很多人都想体验一把&#xff0c;今天为大家推荐一种免费方式&#xff0c;体验一下chatGPT同款内核的AI助手。 craft AI assistant Craft 推出的 AI 助手产品 Craft AI Assistant&#xff0c;并且现在就可以使用。根据 Craft 官方介绍&#xff0c;…

Express实战个人订阅号实现网站登录

今天我们来实现一个使用个人订阅号实现网站的功能&#xff0c;后端使用的是 express 。其它框架原理基本一致&#xff0c;只是定义路由或返回响应数据部分代码跟 express 有所出入。先来一波效果图&#xff1a; 1. 前言 20 年 3 月在掘金写过一篇文章&#xff0c;介绍了使用 e…

推荐四个phpstorm酷炫实用插件 让你写代码的时候不在孤单!

程序员写代码很孤独&#xff0c;每天只能和电脑屏幕交流&#xff0c;想要一个程序员鼓励师妹子&#xff0c;老板又不给配&#xff0c;如何让自己写代码的时候不再孤单呢&#xff1f;今天给大家分享的这四个插件&#xff0c;既实用又好玩&#xff0c;还能提高开发效率&#xff0…

风控业务中的信用与欺诈的定义区别

风险控制是指风险管理者采取各种措施和方法&#xff0c;消灭或减少风险事件发生的各种可能性&#xff0c;或者减少风险事件发生时造成的损失。 小额现金贷的风控为弱风控&#xff0c;主要包括欺诈风险和信用风险2方面&#xff1a; 欺诈风险的识别&#xff0c;核心手段是信息核…

风控数据分析-反欺诈

python信用评分卡&#xff08;附代码&#xff0c;博主录制&#xff09; https://study.163.com/course/introduction.htm?courseId1005214003&utm_campaigncommission&utm_sourcecp-400000000398149&utm_mediumshare 目前贷款的风控因为每一个样本的收集都需要放款…

Facebook第三方登录对接

一、背景调研 1、什么是第三方登录&#xff1f; 第三方登录是基于用户在第三方平台上已有的账号和密码来快速完成己方应用的登录或者注册的功能。而这里的第三方平台&#xff0c;一般是已经拥有大量用户的平台&#xff0c;国外的比如Facebook&#xff0c;Twitter等&#xff0…

原来支付宝、财付通每天都是这样对账、风控的!

为了可以更好地解释支付结算系统对账过程&#xff0c;我们先把业务从头到尾串起来描述一下场景&#xff0c;帮助大家理解&#xff1a;一个可能得不能再可能的场景&#xff0c;请大家深刻理解里面每个角色做了什么&#xff0c;获取了哪些信息&#xff1a; 某日阳光灿烂&#xff…

虚拟机网络发生错误,需要运行NetworkManager

虚拟机网络发生错误&#xff0c;需要运行NetworkManager 你只需要在root用户中输入systemctl start NetworkManager.service这一条简单的指令就行

VCSA7.0访问提示no healthy upstream故障解决方案

打开vCenter网页显示no healthy upstream报错&#xff0c;报错如图 解决办法&#xff1a; 1、使用SSH访问VSCA主机。 2、输入如下命令&#xff0c;检查证书有效期&#xff0c;发现__MACHINE_CERT证书到期。 for i in $(/usr/lib/vmware-vmafd/bin/vecs-cli store list); do …

PG数据库提示: FATAL: sorry, too many clients already

目录 场景&#xff1a; idea启动提示如下错误 翻译&#xff1a; 连接数相关查询&#xff1a; 原因分析&#xff1a; 解决方法&#xff1a; 场景&#xff1a; idea启动提示如下错误 org.postgresql.util.PSQLException: FATAL: sorry, too many clients alreadyat org.pos…

vCenter Server出现no healthy upstream的解决方法

一天&#xff0c;访问vCenter&#xff0c;浏览器报&#xff1a;no healthy upstream&#xff0c;其他什么也没有 该 网上找了一些故障原因&#xff0c;诸如&#xff1a;vCenter Server部分服务没有运行&#xff0c;或者运行出现错误&#xff1b;vCenter Server设置的DNS服务器出…

GPT-4 太香了!

4月30日&#xff0c;OpenAI官方悄悄发布了联网版GPT-3.5。虽然名字变了&#xff0c;但使用体验却是换汤不换药&#xff0c;还是那套。 然而&#xff0c;万万没想到的是&#xff0c;刚过去没几天&#xff0c;昨天5月4日&#xff0c;鱼哥发现自己的Plus账号竟然多了一些能力&…

该为 GPT-4 降温了

文 / 韩彬&#xff08;微信公众号&#xff1a;量子论&#xff09; 昨天&#xff0c;微信里讨论GPT-4发布会内容的信息此起彼伏&#xff0c;我的心头又温暖又难过&#xff0c;感觉像是回到了乔布斯还在世的时候&#xff0c;大家激动讨论苹果发布会的那些日子。 同时&#xff0c;…

太炸了!GPT-4 Plus又推出新功能了!

最近Open AI 在GPT-4 Plus又更新了新功能。 支持Web Browsing with GPT-4 & Code Interpreter 新功能是按照plugin的方式集成的。如果有plus账号的朋友&#xff0c;可以去官方https://openai.com/blog/chatgpt-plugins&#xff0c;申请&#xff0c;也可以第一时间体验上面的…

Android开发之智能聊天机器人

Android开发之智能聊天机器人 一&#xff1a;效果图二:注册图灵机器人,获取api1.进入图灵机器人官网注册,已有账号的可直接登录2.点击创建机器人3.创建好机器人之后会得到一个ApiKey(如图所示)4.下面就要拼接Api地址了(拼接方法如图所示) 三.下面就是具体实现的代码了1.首先是布…

■ Android集成百度语音识别

实现这个功能的目的,是我看见我公司硬件工程师给客户回答问题的时候用公司研发的APP,每次都是手动输入打字,看着他带着老花镜的样子,于心不忍,毕竟咱就是干这个的. 实现效果 集成 百度语音实时识别 https://ai.baidu.com/sdk#asr AndroidManifest.xml 文件 <uses-permis…

百度云助力微信小程序图文识别,让你的应用更加高效智能

前言 如今人们对于信息的获取需求越来越高&#xff0c;而图像识别技术的发展为我们带来了更加便捷高效的信息获取方式。微信小程序作为一种新型的应用形态&#xff0c;越来越受到用户的青睐。而本文将为大家介绍微信小程序基于百度云的图文识别技术。让我们一起来看看微信小程序…