批量提取某音视频文案(二)

牙叔教程 简单易懂

之前写过一篇 批量提取某音视频文案 ,

在之前的教程中, 我用的是微软的语音转文字功能, 今天我们换个方法,

使用 逗哥配音 的 文案提取 功能

准备工作 下载视频和音频

我在github找到的是这个仓库
https://github.com/Johnserf-Seed/TikTokDownload

注意一定要阅读 readme.md ,

并且 一定运行 ./server.bat 启动本地接口解析,

每次我老是忘记运行 bat, 所以总是报错, 运行以后就不会报错了

这是我批量下载的视频和音频

红色的是视频

蓝色的是音频

音频转文字步骤

把音频上传, 然后点击提取文案即可,

10分钟的音频, 消耗时间 25 秒

文案就提取出来了

提取文案以后, 我们改吧改吧就要把它变成视频,

改文案的两种工具

  • ChatGPT
  • Claude

改文案技巧

把文案喂给 AI , 让 AI 模仿写作专家来写文案, 让 AI 当 古龙, 金庸, 司马迁, 鲁迅,

把指定作家的作品告诉给 AI , 让他拥有这个作者的人格和技能

AI 写出文案以后, 我们自己仍然要修改一遍,

因为他写的人称, 描述, 动作, 可能不一定符合你的想法

文案有了以后, 就要转成音频了

文案转音频

我们使用 逗哥配音 的 角色 云浩宇, 全网最火,

语速就参考一下同行的语速, 一般都比较快, 很有有文案需要较慢的语速

如果不知道声音的参数如何设置, 可以看 逗哥配音 的帮助文档, 里面还有 AU 调试声音的教程

提取字幕

音频有了以后, 逗哥配音 还可以导出字幕

剪映导入字幕

文案转成音频, 并且提取字幕以后, 我们就要出图了

生成图片技巧

图片中肯定会有人物出现, 如何固定人物?

我们要指定人物的样子, 尤其是头发和五官

生成图片, 我们使用的是

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传

这是人物咒语

1名男子,21岁,短发,黑发,刘海,黑眼睛,眉毛上翘,白皮肤,无表情,栗色嘴巴
1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth

让他吃饭

餐厅, 坐着, 吃饭, 红烧肉,

1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth
Restaurant, sitting, eating, roast pork. 

可以看到, 人物相似度是差不多的, 是满足小说推文, 制作视频需求的


图片排序

图片生成完以后, 我们要整理图片, 按顺序编号1,2,3,

这样在导入剪映的时候, 图片就是编排好, 后期就不用一个一个找图片了

就按照文案, 按照字幕, 提前给图片排序

剪映图片默认时长是 5 秒


剪映必须会的快捷键

使用剪映做小说推文必用的快捷键

分割图片 Ctrl + B

上一分割点 ↑

下一分割点 ↓

上一帧 ←

下一帧 →

轨道放大缩小 Ctrl + 滚轮

轨道左右移动 Alt + 滚轮


打关键帧

不懂关键帧的可以看这篇教程

剪映 自动打关键帧 AutoHotkey

关键帧如果打错位置的话, 可以用鼠标拖动关键帧, 直接拖到图片尾部

除了图片要打关键帧, 有时候, 蒙版有时候也要打关键帧, 方法都是一样的.

如果要做 双开门 , 就需要用到 动画 , 向上滑动和向下滑动

动画时长 0.2 秒

为什么是 0.2 秒呢? 我们看看 ChatGPT 如何解释

将图片的闪现时长设置在0.1-0.3秒,可以使观众在短时间内注意到图片内容。这个建议来自于人眼对视觉刺激的反应时间。

当一个视觉刺激呈现在我们面前时,大脑需要一定的时间来处理这个信息。根据研究,人类对视觉刺激的反应时间大约为0.1-0.4秒不等。所以,将图片的闪现时长设定在0.1-0.3秒之间,能够让观众在短时间内注意到图片,同时又让图片保持了突出的效果。

然而,请注意,在显示速度非常快的情况下,过多快速闪现的画面可能会导致观众感到不适。因此,在设计视频时,请确保在更突出的闪现效果与观众舒适度之间找到平衡。


关键帧打完以后, 就要给视频前几十秒加特效了

特效

特效有以下几种

  • 媒体
  • 音频
  • 贴纸
  • 特效
  • 转场
  • 滤镜
  • 模板

男频用音频和特效

女频可能还会用模板


特效加完以后, 就要开始配乐了

配乐

伤感文案不能配搞笑音乐, 大佬用啥你用啥

声音渐入渐出

字幕

大佬用啥你用啥


封面

视频一般都取第一帧做封面, 所以我们要在视频开头留下封面的空间

按三下 →, 这三帧就放封面图片

封面之后才开始放其他图片


图片高清

Stable Diffusion 生成的图片一般是 512X512

我们可以用512做, 然后再把图片变成高清图片

图片高清软件, 可以看这个教程 图片无损放大-AI为图片开光

这个软件还支持批量处理图片, 并且图片处理之后会覆盖源文件, 名字也是一样的,

当然了, 你也可以设置把处理后的图片放到另外的文件夹

我懒得弄高清, 直接用的剪映的 超清画质

这个超清画质和那些批量高清软件一样,

也是一张一张处理图片


该星球提供 ChatGPT 和 Stable Diffusion

支持N多大模型, 就不用你自己一个一个去上传大几G的模型数据了


还支持微调模型, 以及各种VAE

星球提供的ChatGPT可以参考这个教程, 可以直接听歌和看电影

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传

微信公众号 牙叔教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22710.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于职场中的面试,要是遇到这些问题时,应该怎么回

(点击即可收听) 关于职场中的面试,要是遇到这些问题时,应该怎么回 平常多学一点,面试入职时就少踩一点坑,无论是去面试还是换工作,怎么样去回答面试官,遇到此类的问题,能够应付自如 1. 你觉得这份工作你能胜任? 首先,无论你在面试过程当中表现怎么样,一定要非常坚定,一定可以 …

ChatGPT偷家:Stack Overflow正被程序员抛弃,访问量一个月骤降3200W

金磊 Pine 发自 凹非寺量子位 | 公众号 QbitAI Stack Overflow,正在被程序员们抛弃。 你没听错。 这个全球知名的开发者问答网站,仅在一个月时间内,访问量骤降3200万! 甚至现在的搜索量仅是它巅峰时期的三分之一…… 为何会突然如…

ChatGPT与讯飞星火大模型:AI语言模型的巅峰之作

尊敬的家人朋友们,大家好! 今年,我们不得不提的一个热门话题就是ChatGPT,这是一款基于语言模型的人机对话系统。它在工作和生活中给我们带来了极大的便利。作为一名从事IT行业的人,我深切体会到了它在技术和文本处理方…

ChatGPT的前世今生,简单明了

...... 版权声明 转自水木人工智能学堂,版权属于原作者,仅用于学术分享 文章精选: 图灵是如何设计出图灵机的,背后的故事和对我们的启发是什么,估计99%的人不知ChatGPT之后,教育向何处去?图灵奖…

快看ChatGPT的前世今生

文 / 高扬(微信公众号:量子论) 从ChatGPT正式发布,这五个月以来,大家已经体会到了它的强大。 感谢大家的认可,我也做了多场一对一指导,通过一个小时的纯干货手把手指导和实践,大家已…

Spring WebFlux 响应式请求ChatGPT

效果 什么是Spring WebFlux? Spring WebFlux是一种用于构建响应式Web应用程序的模块。它是Spring 5及更高版本引入的新特性,旨在支持响应式编程范式。 响应式编程是一种编程范式,强调通过异步数据流来构建应用程序。与传统的基于线程的同步…

WPS Office AI实战:Word写作如有“神”助

打开电脑,基本上你就会与文档打交道,是时候升级处理文档的方式了,WPS AI 的出现,给了文档处理提供了新的范式。 生成文档,根据提示词生成新内容文档分析,快速了解文档核心要点,节省阅读时间根据…

目前gpt 网页资源

AI 智能搜索 chatgpthttps://chat.openai.com/chat/39272709-4a20-4fd7-84dc-bd43dcf7bda1?__cf_chl_tkD8.pZ9U_phG_yR6.mxb2iEqcegvIzGgTcKQDiiZpMNk-1679747266-0-gaNycGzNGns官方newbinghttps://edgeservices.bing.com/edgediscover/query?clientscopeswindowheader%2Ccoa…

gpt模型资源

gpt模型资源 gpt模型资源: https://chatgpt-cn.comhttps://chatgpt.cnhttps://www.chatgpt.cn 请注意,这些国内镜像网站可能会有所不同,但它们都提供了Chatgpt的类似功能,可以帮助你与GPT交互。这些镜像网站通常是由个人或组织创建…

GPT-4 可以免费使用了,额度有限!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! GPT-4 开放至今,已有 1 个多月时间了,但是除了少数人有 OpenAI 的 GPT-4 权限之外,大部分人还是只能通过开通 ChatGPT Plus 来尝鲜 GPT-4。 众所周知&am…

【分享】又找到几个免费使用gpt4的方法!

哈喽,大家好,我是木易巷~ GPT-4是OpenAI推出的最新人工智能语言模型,拥有惊人的1750亿个参数,是目前最大、最强大的语言模型之一,能够根据给定的文本或关键词生成高质量的文本,可以处理多模态数据&#xf…

如何在 ChatGPT 中构建虚拟机?也许你缺乏的是想象力……

最近在准备AIGC相关的课程,得益于[ AIGC元宇宙知识库 ]里的3.5k条内容积累,让我可以很方便地进行系统性梳理,主要涉及大语言模型和图像、音乐、视频等的应用以及商业机会,比如: 视频: 更为稳定的方法&#…

我用ChatGPT提高了工作效率

最近debug程序真是越来越离不开ChatGPT了。将问题直接抛给ChatGPT大大提高了我查找问题的速度。很多时候我已经无需另外使用搜索引擎来查找资料了。 这个是我将一段Linux上运行的程序移植到Windows上运行时出现的问题。编译发现没有u_char这个类型。开始我以为是Linux和Windows…

未能成功加载扩展程序

将Switchy1.crx改为Switchy1.rar解压缩Switchy1.rar得到Switchy1将Switchy1加载至goole

硬核!国内首款增加多类适应症的人工智能辅助诊断软件完成临床试验

9月14日,医疗AI领军企业鹰瞳科技(02251.HK)宣布其核心产品Airdoc-AIFUNDUS (2.0)的临床试验已于近期完成。这是国内首款增加多类适应症的人工智能辅助诊断医疗器械软件(简称“SaMD”),获批后将进一步增加鹰…

新注册英文域名咋选SEO最好?(附ChatGPT检查Prompt)2023最全指南

前排预警,本文非常干,建议关注 收藏⭐慢慢多次翻阅(文末有工具和 Prompt 链接!) 不得不说,现在有越来越多跨境卖家开始进驻独立站,但是我注意到一些问题。我建议你仔细看下这篇博客&#xff0c…

chatgpt赋能python:Python运行程序没反应怎么办?

Python运行程序没反应怎么办? Python作为一种高级编程语言,已经成为了很多开发者的首选语言。然而,在使用Python编写程序时,有时候会出现运行程序却没有任何反应的情况。这是什么原因导致的呢?本文将为大家介绍Python…

大模型“暴力计算”时代,华为昇腾如何突围算力之困? | WAIC2023

文|姚 悦 编|王一粟 “这两年内,大模型带来了750倍算力需求的增长,而硬件的算力供给(增长)仅有3倍。”华为昇腾计算业务总裁张迪煊在2023世界人工智能大会上,揭开了被大模型“暴力计算”引发巨…

生成式AI成硅谷风投新宠儿,1年78起融资共投入93亿,多家公司估值飙升至数十亿...

明敏 发自 凹非寺量子位 | 公众号 QbitAI 生成式AI,真的火透了。 就连正处于科技寒冬中的硅谷风投们,都纷纷把资金砸向这一前沿领域。 PitchBook统计数据,2022年投资圈向生成式AI公司共投入13.7亿美元(折合人民币约93.69亿元&…

每年假期 23 天起的英伟达,单日市值暴涨 2000 亿美元!

大家好!我是韩老师。 英伟达在业界的福利,还是挺不错的: NVIDIA 宣布给员工额外再送 8 天带薪假期!每年假期 23 天起!NVIDIA Yes!6周带薪陪产假,再额外多发3周的工资! 借着 AI 大火&…