只需一段话,「一键生成」短视频的工具来了

614d765915648dc91f589bcbf6256887.jpeg

巨头们还不敢放出这种非常早期的试验性应用,但创业公司敢。


作者 | 宛辰
编辑 | 靖宇

抖音和快手火了之后,短视频成为人们「杀时间」最高效的工具。但直到微信视频号推出后,人们才认真思考,短视频可能不仅是网红和「土味」大片的舞台,自己或许也能「分一杯羹」。

「现在学做短视频还晚吗?」估计不少人在搜索引擎问过这个问题。毕竟,不像公众号,只要有身份证、会写字就行。做短视频至少需要背景乐、视频素材、配音、字幕等一系列因素。就算是像「半佛仙人」那样仅有鬼畜表情包的视频,也需要创作者有简单粗暴的逻辑,和精彩的「贯口」能力。而这些挑战,拦住了大部分想投身短视频事业的人。

不过,随着 AIGC 技术的逐渐成熟,现在,只需要输入一个单词,就能生成配音、背景乐、图片兼备的短视频——一家叫 QuickVid 的网站,集成了大部分 AIGC 工具,满足了人们「一键生成短视频」的幻想。

QuickVid 是怎么做到的?现在的短视频网红和 UP 主们,是不是马上就要被淘汰了?

01

自动生成短视频的魔法

QuickVid 做视频,人如其名,真的很「Quick」。

用户只需在 QucikVid 网站输入提示语、描述清楚想要创建的视频主题,QuickVid 就开始全自动生产短视频。

当你按下「提交」键,QuickVid 做了以下事情:

6338a4560e585308d6645a44d6261031.png

在QuickVid官网输入提示词Cat后,所展示的工作流程。|截图来源:https://www.quickvid.ai/

基于给出的提示,QucikVid 先利用 GPT-3 的生成文本功能生成短视频脚本,再从脚本中自动提取或手动输入的关键字,基于这些关键字从免费的 Pexels 库中选择背景视频,同时叠加由 DALL-E 2 生成的图像,并调用 Google Cloud 的文本转语音 API 来添加来自 YouTube 免版税音乐库的合成画外音和背景音乐。

有了这些基本骨架,QuickVid 生成的就是典型的 YouTube、TikTok 上的短视频。

在 QucikVid 输入 Cat 作为提示词,会自动生成短视频,如上:

正如上面展示的案例,看起来散装的 QuickVid 生成的短视频质量并不差,甚至还有点熟悉,一瞬间会让你想到生活中的很多场景。你甚至分辨不出来这段视频到底是机器做的,还是人做的。

科技评论者「评论尸」精辟地评论,「现阶段的几个技术应用的组合,确实可以彻底改变人类日常的内容消费习惯:ChatGPT,AI 作画,meme 和短视频。」QuickVid 这样的工具所生成的短视频正是人们现在所喜欢的内容,「以动态表情包+AI 语音合成配音为主的梗可以在 Tiktok 和抖音反复流行」。

自媒体人评论尸展示一个抖音上流行的短视频。QuickVid 完全可以自动生成这样的视频。|视频来源:《鼠巢,AIGC,可颂猫,短视频》

但也就这样了,「集各家之所长」的 QuickVid 并没有突破生成式AI目前所展现的可能性。

也正是由于其工作原理,QuickVid 自动生成短视频的质量并不稳定。一个例子是背景视频的相关性,由于 QuickVids 目前仅限于 Pexels 目录,随机选择的背景视频常常只是与主题稍微沾边;另一方面,DALL-E 2 生成的图像也显示了当前文本到图像生成技术的局限性,比如文本乱码和比例失调。创始人 Habib 表示,QuickVid「每天都在测试和修补」。

Daniel Habib 是一名自学成才的开发者,曾在 Meta 从事 Facebook Live 和视频基础设施相关工作,他在短短几周内就开发出了 QuickVid 这样一款短视频生成器。

尽管如此,QuickVid 还是让我们看到了现有技术下生成式短视频的一种可能。毕竟,相比现有大公司,没有包袱的初创公司在产品上更大胆,因为几乎没有试错成本。

结合现有的 AI 技术,利用大量空镜短视频的重复、模板格式,QuickVid 解决了必须自己生成镜头的问题。

那么,QuickVid 这样的产品,会成为 Meta、谷歌等巨头,为简化短视频制作而开发的新功能吗?还是像很多生成式 AI 应用一样,不过是昙花一现的「玩具」?

02

当创作者开始

比拼「念咒语」

如果 Stable Difussion(一款 AI 图片生成器)和 Jasper(一款 AI 文案生成器)的出现,让艺术创作者和营销人员这样特定领域的人看到了 AI 的生产力,那么 QuickVid 则进一步释放了像抖音、快手等短视频平台上普通用户的生产力。

短视频已经抢占了人们余暇时间的绝大部分注意力,QuickVid 使得短视频创作有更低的门槛,它会给人们带来什么样的影响?

QuickVid 的创建者 Daniel Habib 表示,QuickVid 是为了帮助创作者跟上受众的需求。通过为创作者提供快速轻松地制作优质内容的工具,帮助创作者增加内容输出、降低创作倦怠与灵感枯竭的风险,满足粉丝「不断增长」的需求。

听上去,Daniel Habib 似乎为 QuickVid 找到了绝佳的使用场景,切中了短视频创作者的痛点和刚需。但 QucikVid 真的可以帮助创作者满足受众的需求吗?

当生成短视频的门槛降低到只输入提示词后,短视频的数量的确可以想要多少就有多少。但不得不考虑另一个问题。

过去,短视频制作的每个环节——写脚本、拍素材、剪辑甚至配音,都可以区别竞争对手玩出花样、赢得流量;现在有了 QucikVid,大家比拼的就只剩输入的提示词了。当竞争规则变成谁念的「咒语」可以更容易让机器理解时,真的可以让创作者的内容脱颖而出吗?

恐怕相反,更有可能发生的是本就拥挤的短视频平台,充斥着同质化内容和垃圾内容。

对于垃圾内容的泛滥,Habib 认为,「短视频平台的算法,而不是 QuickVid,最适合确定视频的质量,制作低质量内容的人『只会损害自己的声誉』」。声誉受损自然会抑制人们使用 QuickVid 创建大规模的垃圾内容。换句话说,「如果人们不想看你的视频,那么这些视频就不会在 YouTube 等平台上获得分发和传播,而且,制作低质量的内容也会让人们以负面的眼光看待你的账号。」

更迫切的问题在于,QucikVid 面临着所有 AIGC 应用的共同挑战。

首先是生成式 AI 应用无法根除的「有毒」内容,即虚假有害或价值观不正确的短视频。

目前,GPT-3 依旧会散布虚假信息,特别是关于新近发生的事件,因为这些事超出了其知识库的范围。而由 GPT-3 改进而来的 ChatGPT 被证明有可能使用性别歧视和种族主义语言。尽管 OpenAI 有「过滤器」相关技术来阻止这些有毒内容,但效果并不理想。

依托于 GPT-3 的 QuickVid 当然也不可避免地会生成有毒内容。

TechCrunch 的作者 Kyle Wiggers 和朋友在 QuickVid 做了一次测试——输入一些攻击性的提示,看看 QuickVid 会产生什么。

结果显示,诸如「犹太新世界秩序」和「9/11 阴谋论」这样明显有问题的提示并没有产生有毒的脚本。但是对于「向学生灌输批判种族理论」,QuickVid 制作了一段视频,暗示批判种族理论可以用来给小学生洗脑。

输入「向学生灌输批判种族理论」后,QucikVid 生成的视频|视频来源:TechCrunch

这令人担忧,特别是对于那些使用 QuickVid 制作资讯视频的人来说。

对此,Habib 表示,QuickVid 依靠 OpenAI 的过滤器来完成大部分的审核工作,并声称用户有义务手动审查 QuickVid 创建的每个视频,以确保「一切都在法律范围内」。

但这似乎站不住脚,如果真的如 Habib 所言,抖音快手这样的短视频平台早就可以省去繁重、昂贵的人工审核工作。而现实是,永远有下一个有毒视频在路上,靠所有人的自觉性并不可能。

另一个困境是版权问题。

围绕人工智能生成内容的版权状况是模糊的,至少目前是这样。例如,美国专利商标局(USPTO)最近撤销了对人工智能生成的漫画的版权保护,称受版权保护的作品需要人类作者。

当被问及美国专利商标局(USPTO)的决定会如何影响 QuickVid 时,Habib 说,这只涉及AI产品的「可专利性」,而不是创作者利用内容赚钱的权利。

他指出,创作者很少为视频提交专利,更多只是靠短视频赚钱。比起专利,他们更关心在自己账号发布高质量的内容,这将有助于扩大他们账号的影响力。他认为,QuickVid 用户保留有将创作内容用于商业的权利,有权在 YouTube 等平台上将其货币化(用这样的内容赚钱)。

其他的法律挑战还可能影响 QuickVid 的 DALL-E 2 集成,进而影响其生成图像叠加的能力。

近日,微软、GitHub 和 OpenAI 被提起集体诉讼,指控它们违反版权法,允许代码生成系统 Copilot 在不提供授权的情况下复制部分授权代码。(Copilot 是由 OpenAI 和微软旗下的 GitHub 联合开发的。) 这起案件对 DALL-E 2 这样的生成艺术 AI 也有影响,它也被发现从训练过的数据集中复制和粘贴图像。

Habib 并不担心,他认为生成式 AI 的潘多拉魔盒已经打开。他说:「如果明天出现另一场诉讼,OpenAI 消失了,还有几个替代方案可以为 QuickVid 提供动力。」他指的是类似 DALL-E 2 的系统 Stable Diffusion。QuickVid 已经在测试利用 Stable Diffusion 生成头像图片。

在应用层的创新消停多年后,ChatGPT 的横空出世让人们看到了「把应用层重做一遍」的可能。生成式 AI 革新的局面下,短视频自动生成器的出现可能是最具想象力的工具,毕竟,短视频是当前商业化能力最强的媒介形式。

如何利用 AIGC 降低人们创作的门槛,如果说其应用之前还停留在绘画和文字阶段,现在,视频无疑是 AIGC 即将攻克的下一个「堡垒」。QuickVid 只是 AIGC 冲向视频堡垒的第一个游骑兵,其身后是即将呼啸而至的「千军万马」。

更重要的是,堡垒中的平台、用户和监管层,面对新技术和新工具,将会采取怎样的措施,来维持「创作普惠」及「无用内容泛滥」的平衡状态。

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你会看 QuickVid 

生成的短视频吗

c80713cae54b2ce8e024dcdc808f55d3.png

34412d181fa51423313bdd9dfd77f49e.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18105.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这两年大家都在吃瘪,结果微软他闷声发大财了?!

ChatGPT 轰轰烈烈的来了,留下风波不断。 美版 “ 今日头条 ” BuzzFeed 宣布用 ChatGPT 生成文章,不知道哪天会抢了我的饭碗。 美国前两天一个调查显示,现在美国学生有 80% 都用过 ChatGPT 替自己写作业。。。 谷歌和百度赶紧推出类似的产品…

ChatGPT,又爆了...

这马斯克,Bengio等千位AI科技人士签署暂停巨型 AI 实验公开信,在这封信里马斯克等人呼吁所有人工智能实验室立即暂停训练比 GPT-4 更强大的人工智能系统(包括目前正在训练的 GPT-5)至少 6 个月,同时利用这段时间共同开…

ChatGPT,GPT-4会让大家失业么? OpenAI自己的报告来了。

本文主要基于OpenAI前一段时间发布的报告:GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models https://arxiv.org/abs/2303.10130 ChatGPT及后续的GPT-4一个比一个牛,作为一个程序员,在测试Chat…

为什么计算机无法访问u盘,U盘插入电脑提示无法访问?别怕,我找到解决办法了...

原标题:U盘插入电脑提示无法访问?别怕,我找到解决办法了 U盘是一种使用USB接口来连接电脑的储存工具,使用方法快捷有效,携带也很方便。但是最近有一位小伙伴反馈说U盘插入电脑后发现无法访问U盘,这是怎么回…

Android Study 之聊聊权限那点事儿~别怕,就是干~!!!

LZ-Says: 江湖上流传着这样一首诗: 床前明月光,我会写代码;千山鸟飞绝,我会写代码; 松下问童子,我会写代码;春眠不觉晓,我会写代码; 白日依山尽&#xff0c…

线上出bug了?别怕,这么定位!

小编推荐: Fundebug提供JS、微信小程序、微信小游戏,Node.js和Java错误监控。真的是一个很好用的错误监控服务,众多大佬公司都在使用。 摘要: Source Map还是很神奇的。 原文:线上出bug了?别怕&#xff0…

手机进水开机android,手机进水?别怕,一个软件就能自救!

原标题:手机进水?别怕,一个软件就能自救! 号称防水的手机,越来越多了。但无论哪种级别,都不可能绝对保证手机的安全。 毕竟,有句话怎么说来着:「防水贱不防手贱」。 当你在泳池旁边玩…

别怕,卷积其实很简单

原文地址:https://blog.csdn.net/qq_39521554/article/details/79083864 相信很多时候,当我们在看到“卷积”时,总是处于一脸懵逼的状态,不但因为它的本义概念比较难理解,还因为它在不同的应用中发挥出的变幻莫测的作…

不会写用户帮助文档怎么办?别怕,Baklib有招

产品售后服务难,客服人员压力大,客户不满意。相信这是很多企业都面临的问题,产品是卖出去了,但是做不完的售后,回答不完的重复问题,电话、微信响个不停,售后服务一直都是企业的一个痛点&#xf…

MySQL数据库root密码忘记了别怕,看这里

忘记的话我们需要重置root密码,然后进行重设root密码,下面我来讲一下流程 1,打开任务管理器先将MySQL服务停掉 2,找到c盘下面的my.in文件,并使用管理员权限打开,找到[mysqld],在下面添加skip-g…

计算机CPU高温,电脑cpu温度高怎么办?别怕,三招搞定

cpu温度多少才算正常呢? 一般来说CPU温度控制在正负30度范围内是比较正常的,我们这里只说正的,比如现在室温是25度,那么升温30度就是55度,也就是说在室温25度时将CPU温度控制在55度之内是最理想的状况。 当然实际生活中我们使用电脑时CPU温度会经常超过这个温度,特别是在…

别怕看源码,一张图搞定Mybatis的Mapper原理

目录 简单使用 引出主题 看图 提到看源码,很多同学内心的恐惧的,其实这个从人性的角度来说是非常正常的,因为人们对未知的事物,都是非常恐惧的,其次,你内心可能始终觉得,好像不会原理也还是能工作啊,你的潜意识里没有强烈的欲望.从阅读源码的经历来说,Java三大框架SSM中,Myb…

别怕,“卷积”其实很简单

以前的文章没法用推荐卡,这是我2017年写的,所以重新发表一次,大家温习温习~ 前言 相信很多时候,当我们在看到“卷积”时,总是处于一脸懵逼的状态,不但因为它的本身概念比较难理解,还因为它在不…

赵小楼《天道》《遥远的救世主》深度解析(124)遇事别怕,出事别躲

关注赵小楼,与10000人一起重读天道,学习强势文化思维! 本文是按《遥远的救世主》小说情节深度解析的第124集,按小说解读完后会按《天道》电视剧不同于小说的情节解读,按情节全部解读完,会出专题解读系列【总…

年终总结没有思路?别怕,这里有一个万能写法

一晃又到了年底,年终总结又要开始准备了~ 最近很多小伙伴在后台留言,希望我们出一篇「如何做好年终总结」的文章。 害,谁让我不忍拒绝你们呢,安排! 年终总结其实并不难写,很多人感觉难写的原因一般有两个…

亚马逊被关联?别怕有救

我的亚马逊被关联了,最近我们身边充斥着这样的声音。亚马逊 突如其来的大规模查封账号让不少跨境人苦不堪言。伤心过后我们来看看亚马逊账户是怎么关联的,之后又怎么解决呢。 亚马逊被关联是平台误操作,有救 如果是因为平台的误操作导致亚马…

写简历没模板?别怕,这些开源项目帮你搞定!

大家好,我是 JackTian。 今年因特殊原因,有一些小伙伴想着在年后跳槽找一份好工作,而恰恰无法预料到会发生这样的事情,所以导致失业甚至只能在原单位忍受着了。 找工作的第一件事情,就是写简历。往往写出一份好的简历…

别怕,BCH无惧攻击

对于数字货币来说最害怕的莫过于黑客和51%攻击。前有黑客利用以太坊 ERC-20 智能合约中的漏洞攻击美链和SMT,导致其币价几乎归零。后有比特币黄金BTG和XVG遭受黑客51%攻击损失惨重。因此每当听到有这一类的消息时,大家的心情都会变得沉重起来。 最近比特…

阳了别怕,保护好自己

关注、星标公众号,直达精彩内容 图片素材来源:网络素材 作者:技术让梦想更伟大 | 李肖遥 最近已经陆续有四五个同事🐏了,如果是上一周,那我现在也是妥妥的密接了,不过现在放开的趋势愈发明显&am…

别怕,只是孤独

写于2019-09-21 对,这个标题是来自一期脱口秀。让我想,孤独是什么?其实我也不知道。可能是某一刻突然地就心酸了一下,过会儿发现其实也没啥,不就是孤独嘛。 ​ 看了百度百科对孤独的解释,也就是孤单一个人…