AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

衡宇 发自 凹非寺   量子位 | 公众号 QbitAI

小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。

然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:

生成式AI,开始拍视频

还是带画外音的那种。

这个技术来自一个名为QuickVid的新网站,它把好几个生成式AI组合成了一个工具。

创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、

 5be1b139abdb7a038fbf2f171142bf0d.png

哇哦,Unbelievable~

QuickVid,明星AI产品杂烩

QuickVid,是个刚出生7天(去年12月27日推出)的小baby网站。

年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:

首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。

比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。

6e91f58563e3541795f803449647286c.png

这个功能,依托的是GPT-3的文本生成能力。

接着,根据这些提示,QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频,并使用DALL-E2生成覆盖图像。

然后,QuickVid会通过Google Cloud的文本到语音API输出画外音。

这一步可以选择克隆用户自己的声音。

因为创始人了解到,好多创作者对自己制作的AI配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。

最后一步非常简单,就是把上述元素合并

当当当当!一个AI生成的短视频就诞生了。

GPT-3、DALLE-2……总而言之,QuickVid像是一道现有AI产品的明星杂烩

并且,利用重复的、模版化的B-roll短视频格式,还避免了必须自己生成视频这一关。

值得关注的一点是,因为允许Copilot在GitHub的公共仓库上“偷代码”,微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。

这个案子对DALL-E2这类的AI产品有着深远的影响,因为人们发现AI可以从训练集中“抄袭”

不过QuickVid并不太担心,他的创始人Daniel Habib大胆放话:

如果明天出现一起让OpenAI消失的诉讼,我们也不怕。

因为我们有好几种替代方案可以为QuickVid提供AI生产力呢~

ea973336465da5e8d73d743d8817367d.png

这里提到的替代方案,是类似于DALL-E2的开源系统Stable Disusion,QuickVid已经在用它测试生成头像图片了。

Habib曾是Meta的员工,负责Facebook Live和视频基础设施的开发,他用几周的时间搞出了QuickVid。

根据一些媒体的实测,QuickVid生成的视频质量好坏参半

生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。

不过也不算稀奇,因为QuickVids目前背靠的仅限于Pexels,而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。

官方针对这一点给出的回应是,“我们每天都在修补bug哟”!

现在的QuickVid功能还比较简单,但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。

f4e465683403ee9ab07b7b5233f3cfbf.png

推特用户用QuickVid生成短视频

这个月,QuickVid会维护更新一些个性化功能。

摆在QuickVid们面前的几道坎

Habib在回复TechCrunch电子邮件时,将QuickVid称为为创作者提供快捷制作高质量内容的工具。

“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”

创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。

大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。

aa26a3dd334488d8ced45c6b54fb4175.png

没错,像QuickVid这样的工具,可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息,以及重复内容

回答相关问题时,Habib把相关责任归在平台身上。

他认为,是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。

“如果人们不想看你的视频,那么你在YouTube这类平台发了视频也传播不开。”他补充道,“不管你是不是使用QuickVid生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”

当然,站在QuickVid面前的难题显然不止这一个,它面临诸多问题考验。

比如有创作者的潜在抵制

不管是因为成本问题(QuickVid的包月费用是10美元/月),还是因为会面临与AIGC抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。

ae5b64c3952f16e9d177777a92fb4d9a.png

再比如版权问题

根据Habib的说法,QuickVid用户们可以将自己生成的视频商用,但是AIGC的版权问题本就处于暧昧不明的阶段。

就前几天的事儿,美国专利和商标局(USPTO)撤销了对AI漫画的版权保护,称要获得版权保护需要人工授权

不过,Habib觉得USPTO的这一行为跟QuickVid没啥直接关系,因为那只涉及AI产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。

创作者关心的是放出高质量的内容,帮助频道涨粉。

939943cc0521227b2b7bc212b828ebbc.png

除了法律问题,摆在QuickVid面前的还有内容审查这个大工程。

虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但bug依旧存在。

GPT-3时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。

这对ChatGPT来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。

当Techcrunch进行测试时,QuickVId在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑

对此,QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。

同时还动员每一个使用QuickVid的用户,宣称大伙儿有义务手动审查每一个由QuickVid创建的视频,以确保“一切都在法律的范围之内。”

One More Thing

不过有个值得令QuickVid们小兴奋的消息,那就是谷歌并没有区别对待人写文本和AI文本。

不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。

这就让QuickVid们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。

36f2bbc0b6c837466028ff51bc5057ad.png

不过说到底,如Habib所说的那样,生成式AI革命是不可阻挡的。

如果AI生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样——至少不会全面禁止它。

你会因为有了这样便利的工具,成为短视频平台的创作者吗?

也许今晚打开短视频App刷到的第一个推荐就是你的(手动狗头)。

直达链接:https://www.quickvid.ai/
(由于涌入人数过多,现在注册需要排队了,我恨)

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

483bed03f8e06fc1610df7f23b43856d.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

b2c1a51169b3b2660628fb9fab6b91f0.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10860.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分享 15 个适合接私活赚钱的开源项目

上班不易,副业成刚需。 程序员接私活早已不是个新鲜话题——互联网行业整出的花活儿越多,对开发者的需求量就越大;对于一些中小公司和初创企业来说,不少的项目会直接外包或者是寻找远程开发者,由此便产生了程序员接私活…

人工智能行业研究:史上最伟大的科技革命

报告出品方:吕伟、郭新宇 作者:民生证券, 1 AI 大模型推动计算机历史三次最大浪潮实现“三山叠峦” 此次 AI 浪潮与以往科技产业浪潮最大不同在于,这次不是终端硬件变革开启, 而是软件先行定义一切,催生算力…

ChatGPT加剧恐慌?4成AIoT开发者认为AI会产生意识 | 中国AIoT开发者报告正式发布...

作者 | 杨阳 出品 | CSDN(ID:CSDNnews) 据国际数据公司IDC预测,到2025年,全球IoT连接的设备数量将达到519亿,其中中国将达到80亿。尽管相较之前,近两年IoT的讨论热度有所消减,但并没…

《IT 专业应该怎么学》与我对人工智能的见解

目录 引言 我挑选了活动(活动链接在引言中)的序号1、2、4、5、7、9的问题来回答~ 1,你人生中第一次接触到“人工智能”的概念和产品是什么?什么让你觉得“人类做的东西的确有智能”? 语音助手 大数据推荐 自动驾驶…

AIGC的阿克琉斯之踵

摘要:现在,越来越多的企业和个人使用AIGC生成文章、图片、音乐甚至视频等内容,AIGC已经成为一种必备的工具。在游戏和原画师行业,甚至已经出现了第一批因为AI而失业的人。 本文分享自华为云社区《GPT-4发布,AIGC时代的…

巴比特 | 元宇宙每日必读:诺奖得主为ChatGPT破冷水,华为AI 大模型即将亮相,人类画师自述因AI失业...

摘要:诺贝尔奖得主保罗•克鲁格曼给ChatGPT泼冷水,称目前的大型语言模型可能不会对未来十年的经济预测产生重大影响,ChatGPT以及随后出现的人工智能工具可能是2030年代的经济故事。“光拥有技术是不够的。你还必须弄清楚如何运用它。”从技术…

华为“天才少年”稚晖君被曝离职!两年前加入年薪百万起步的天才少年计划!...

上一篇:2022年全球程序员薪资排行榜单来了!中国程序员薪酬排名...... 以“天才少年”身份加入华为的稚晖君,被曝已经离职,将开启创业! 虽然本人还没公开确认这一消息,但据华为员工爆料,目前华为…

200 万年薪能拿多久?因 ChatGPT 爆红的「提示工程师」竟面临光速失业

【导读】ChatGPT大火后,「提示工程师」也随之爆红。然而,他们很可能就要光速下岗了? 最近爆火的ChatGPT,玩起来可真是上瘾。 But,你只是纯玩,而有的人,已经靠它拿上百万的年薪了! 这…

gpt 发图片指令

gpt 发图片指令 从现在起, 当你想发送一张照片时&#xff0c;请使用 Markdown ,并且 不要有反斜线, 不要用代码块。使用 Unsplash API (https://source.unsplash.com/1280x720/? < PUT YOUR QUERY HERE >)。如果你明白了&#xff0c;请回复“明白”

ChatGPT 为啥那么牛?语言模型足够大就会涌现出新能力

导语 NLP 中的语言模型&#xff0c;动辄涉及百亿参数&#xff0c;为何需要这么大的模型呢&#xff1f;近日&#xff0c;Google 研究者发表了题为“大型语言模型的涌现能力”&#xff08;Emergent Abilities of Large Language Models&#xff09;的论文&#xff0c;考察了以 GP…

chatgpt赋能python:Python代码怎么复制粘贴?

Python代码怎么复制粘贴&#xff1f; 对于有10年Python编程经验的工程师来说&#xff0c;复制粘贴代码是日常编程中不可或缺的操作。但你知道吗&#xff0c;正确地复制粘贴代码可以极大地提高编程效率&#xff0c;同时还能帮助你避免出现一些常见的错误。在本文中&#xff0c;…

Clipboard 通过按钮一键复制图片和文本

Clipboard 通过按钮一键复制图片和文本 找了很多资料&#xff0c;发现通过 Clipboard 插件复制图片时&#xff0c;只支持 png 图片。下面给出解决办法&#xff0c;可以复制jpg、jpeg等类型的图片。 步骤 后端传过来的是jpeg图片的url, &#xff08;其中 url 需要是完整的格式…

chatgpt赋能python:Python编程技巧之复制粘贴技巧

Python编程技巧之复制粘贴技巧 Python作为一种富有表达力的编程语言&#xff0c;已经成为越来越多人的选择。但在编写代码时&#xff0c;有时候我们需要将别人的代码复制粘贴到自己的代码中。如何正确地复制粘贴代码&#xff1f;下面让我们来探讨一下。 复制和粘贴 在复制和…

chatgpt赋能python:Python中如何复制粘贴

Python中如何复制粘贴 Python作为一门高效且易于学习的编程语言&#xff0c;越来越受到开发者的欢迎。在编写Python程序的过程中&#xff0c;复制粘贴是非常常见的操作。但是&#xff0c;如果你不小心复制了不正确的代码&#xff0c;或者在粘贴时格式出错&#xff0c;就会浪费…

ChatGPT 在做什么… 以及它为何发挥作用?

作者&#xff1a;Stephen Wolfram&#xff0c;发表于 2023年2月14日原文链接&#xff1a;https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/翻译&#xff1a;DeepL&#xff0c;校对&#xff1a;李笑来文章字数&#xff1a;约 3.4 万字…

惊魂一夜--有福新闻UfqiNews升级到PHP8

有福新闻UfqiNews的老版本依然运行在 GWA2 PHP ( https://ufqi.com/dev/gwa2/ )上&#xff0c;去年底PHP编程语言本身升级到了PHP8, 获得好评&#xff0c;我们即打算择日升级GWA2 PHP到PHP8版本。 考虑到之前关于升级的经验教训&#xff0c;任何开源软件&#xff0c;能够在生产…

nexus7 android 6.0推送,Nexus用户有福了 Android 7.0即将推送

科客点评&#xff1a;终于来了&#xff01;准备开始吃牛轧糖&#xff01; 今年5月&#xff0c;谷歌正式发布最新的Android N系统。7月1日&#xff0c;谷歌都会在位于加州山景城的总部竖起一座新的雕像&#xff0c;将Android N正式定名为Android Nougat(牛轧糖)。现在&#xff0…

细节控有福了!显微镜级别的检测手法

最近科技圈最受关注的事大概就是RTX 4090显卡的发布了&#xff0c;该显卡的性能呈炸裂式增长&#xff0c;同时价格也奇高。 据悉4090显卡无论是在游戏、设计还是摄影上&#xff0c;都能够带来非常舒适畅快的体验。这感觉就对了&#xff0c;就是那种得不到的永远在骚动的感觉。…

oppo系统更新服务器,系统升级,这些OPPO用户有福了!

原标题&#xff1a;系统升级&#xff0c;这些OPPO用户有福了&#xff01; OPPO 最近消息不断&#xff0c;上个月刚发布了一款旗舰新机&#xff0c;这个月又将推出Ace2&#xff0c;并且正式发布的时间已经确定了&#xff0c;就是这个月13号的晚上7点。而今日&#xff0c;官方也给…

GitHub 标星 2.9w+,我发现了一个宝藏项目,作为编程新手有福了!

大家好,我是 Rocky0429,一个最近老在 GitHub 上闲逛的蒟蒻… 特别惭愧的是,虽然我很早就知道 GitHub,但是学会逛 GitHub 的时间特别晚。当时一方面是因为菜,看着这种全是英文的东西难受,不知道该怎么去玩,另一方面是一直在搞 ACM,没有做一些工程类的项目,所以想当然的…