衡宇 发自 凹非寺 量子位 | 公众号 QbitAI
小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。
然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:
生成式AI,开始拍视频!
还是带画外音的那种。
这个技术来自一个名为QuickVid的新网站,它把好几个生成式AI组合成了一个工具。
创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、
哇哦,Unbelievable~
QuickVid,明星AI产品杂烩
QuickVid,是个刚出生7天(去年12月27日推出)的小baby网站。
年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:
首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。
比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。
这个功能,依托的是GPT-3的文本生成能力。
接着,根据这些提示,QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频,并使用DALL-E2生成覆盖图像。
然后,QuickVid会通过Google Cloud的文本到语音API输出画外音。
这一步可以选择克隆用户自己的声音。
因为创始人了解到,好多创作者对自己制作的AI配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。
最后一步非常简单,就是把上述元素合并。
当当当当!一个AI生成的短视频就诞生了。
GPT-3、DALLE-2……总而言之,QuickVid像是一道现有AI产品的明星杂烩。
并且,利用重复的、模版化的B-roll短视频格式,还避免了必须自己生成视频这一关。
值得关注的一点是,因为允许Copilot在GitHub的公共仓库上“偷代码”,微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。
这个案子对DALL-E2这类的AI产品有着深远的影响,因为人们发现AI可以从训练集中“抄袭”。
不过QuickVid并不太担心,他的创始人Daniel Habib大胆放话:
如果明天出现一起让OpenAI消失的诉讼,我们也不怕。
因为我们有好几种替代方案可以为QuickVid提供AI生产力呢~
这里提到的替代方案,是类似于DALL-E2的开源系统Stable Disusion,QuickVid已经在用它测试生成头像图片了。
Habib曾是Meta的员工,负责Facebook Live和视频基础设施的开发,他用几周的时间搞出了QuickVid。
根据一些媒体的实测,QuickVid生成的视频质量好坏参半。
生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。
不过也不算稀奇,因为QuickVids目前背靠的仅限于Pexels,而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。
官方针对这一点给出的回应是,“我们每天都在修补bug哟”!
现在的QuickVid功能还比较简单,但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。
△推特用户用QuickVid生成短视频
这个月,QuickVid会维护更新一些个性化功能。
摆在QuickVid们面前的几道坎
Habib在回复TechCrunch电子邮件时,将QuickVid称为为创作者提供快捷制作高质量内容的工具。
“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”
创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。
大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。
没错,像QuickVid这样的工具,可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息,以及重复内容。
回答相关问题时,Habib把相关责任归在平台身上。
他认为,是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。
“如果人们不想看你的视频,那么你在YouTube这类平台发了视频也传播不开。”他补充道,“不管你是不是使用QuickVid生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”
当然,站在QuickVid面前的难题显然不止这一个,它面临诸多问题考验。
比如有创作者的潜在抵制。
不管是因为成本问题(QuickVid的包月费用是10美元/月),还是因为会面临与AIGC抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。
再比如版权问题。
根据Habib的说法,QuickVid用户们可以将自己生成的视频商用,但是AIGC的版权问题本就处于暧昧不明的阶段。
就前几天的事儿,美国专利和商标局(USPTO)撤销了对AI漫画的版权保护,称要获得版权保护需要人工授权。
不过,Habib觉得USPTO的这一行为跟QuickVid没啥直接关系,因为那只涉及AI产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。
创作者关心的是放出高质量的内容,帮助频道涨粉。
除了法律问题,摆在QuickVid面前的还有内容审查这个大工程。
虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但bug依旧存在。
GPT-3时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。
这对ChatGPT来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。
当Techcrunch进行测试时,QuickVId在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑。
对此,QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。
同时还动员每一个使用QuickVid的用户,宣称大伙儿有义务手动审查每一个由QuickVid创建的视频,以确保“一切都在法律的范围之内。”
One More Thing
不过有个值得令QuickVid们小兴奋的消息,那就是谷歌并没有区别对待人写文本和AI文本。
不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。
这就让QuickVid们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。
不过说到底,如Habib所说的那样,生成式AI革命是不可阻挡的。
如果AI生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样——至少不会全面禁止它。
你会因为有了这样便利的工具,成为短视频平台的创作者吗?
也许今晚打开短视频App刷到的第一个推荐就是你的(手动狗头)。
直达链接:https://www.quickvid.ai/
(由于涌入人数过多,现在注册需要排队了,我恨)
— 完 —
猜您喜欢:
深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读
戳我,查看GAN的系列专辑~!
一顿午饭外卖,成为CV视觉的前沿弄潮儿!
最新最全100篇汇总!生成扩散模型Diffusion Models
ECCV2022 | 生成对抗网络GAN部分论文汇总
CVPR 2022 | 25+方向、最新50篇GAN论文
ICCV 2021 | 35个主题GAN论文汇总
超110篇!CVPR 2021最全GAN论文梳理
超100篇!CVPR 2020最全GAN论文梳理
拆解组新的GAN:解耦表征MixNMatch
StarGAN第2版:多域多样性图像生成
附下载 | 《可解释的机器学习》中文版
附下载 |《TensorFlow 2.0 深度学习算法实战》
附下载 |《计算机视觉中的数学方法》分享
《基于深度学习的表面缺陷检测方法综述》
《零样本图像分类综述: 十年进展》
《基于深度神经网络的少样本学习综述》
《礼记·学记》有云:独学而无友,则孤陋而寡闻
欢迎加入 GAN/扩散模型 —交流微信群 !
扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖
请备注格式:研究方向+地区+学校/公司+姓名
点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!