OpenAI还在烧钱,但开发者已经利用GPT和Stable Diffusion挣钱了

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

Text-to-Video文生视频,继作文、绘画之后AI杀入的又一领域,有越来越多产品涌现。根据读者爆料,一款主打AI生成视频的产品,已经在小圈子内被频频提及,还是国产的。

量子位迫不及待浅扒了一段关于曹操的介绍,喂给它,得到这样一段视频:

在不经任何替换和干预的情况下,生成的视频画面符合人物、时代背景和部分文案提及的场景,效果还算不错。

最最重要的是,用它制作一段视频,几乎不存在“剪辑”这个步骤,比以往图文转视频的产品门槛更低,耗费的时间也更短。

但要评判这款产品到底是骡子是马,还得多次体验,再往深处挖一挖。

什么样的产品?

这产品名叫一帧秒创,本次体验的主角是它最基础常规的“文案一键生成视频”。

开头关于曹操的简介视频,是用该功能这样生成的——

点击该选项后,会跳出一个文本框供输入标题和正文,底端可以选择最终的画面呈现形式是横屏还是竖屏。

这一步骤实测下来,标题部分对后续内容生成影响不大,现阶段可以不用输入,后续AI会自动提取补充。相对而言,第二个需要输入文案内容的部分非常重要。

量子位做了如图文案输入:

f9c11c4fc6058403ad84d8c5437b28fe.png

点击右下角“下一步”,可以更改AI对文案进行的分类,也可以修改文案的分割。分割成n个小段的文案,承担分镜头脚本文案的功能,以便后续AI从素材库里匹配对应的视频片段。

在这方面,AI的分割效果没有出太大纰漏。

但从下图可以看到,此处AI把曹操title中的“书法家”单独作为一个分镜头文案,量子位对其进行了合并。

a8f96b41f7cd8891e35139d8d21cb141.png

接下来就会进入最后的调试界面,分出两大板块,即左半部分的调整界面和右半部分的预览界面

通过左侧的工具栏,在最顶端的场景部分,AI为文案匹配了12个视频片段。

12个视频片段中,原本AI为片段8生成的视频中出现了现代社会的外国人。也就是说,在画面内容和文案内容的匹配度上,AI能力还有所欠缺。

最终量子位通过小蓝框中的替换素材功能,在素材库中选择了更符合文案的视频画面。

37118fcf29925fabc9d1a30ae7b3adda.png

12个镜头整体拉片式通看一遍,直观感受是视频质量算不上精致。虽然并非完全不相关,但还是与人类剪刀手的视频编辑水平有明显差距

敲定视频片段后,在音乐板块挑选国风类型的BGM,又选择了“磁性浑厚”的解说男声,Logo和字幕都是默认选项。

一切确定,点击生成视频选项,就能在预览板块看到这一套搭配下来的视频效果,最终生成文章开头的视频。

历史分类的AI视频效果不错,那是否在每个分类下都有同等水平的效果呢?

又陆续还尝试了科普类(量子位文章,扔进去)、美食类(宫保鸡丁菜谱)等多种类别的文案,甚至还把谷歌Phenaki效果惊艳的小企鹅冲浪视频的6句文案丢给了它。

659c033471698f96e8a3487227222371.png

结果显示,科普类和美食类,生成视频的表现都还算文案和画面贴合。

但,小企鹅冲浪文案的生成效果就有些拉胯

看遍视频画面的每一秒钟,从未出现过一只企鹅,连影子都没有……

Excuse me???

虽然部分画面也和文案有所关联,比如出现人在沙滩上走的第一视角视频片段。但和曹操视频的效果相比,可以说大相径庭,实在有点出乎意料。

无独有偶,国外有个Quickvid同样主打AI生成视频的功能,同样在小圈子里走红。而目前开放Beta测试的Youtube Shorts功能,和上述国内产品功能类似。

为了测试,把相同的小企鹅冲浪文案喂给了Quickvid。结果是,Quickvid生成的视频里,仍然不见企鹅的踪影,一帧也没有!

(谷歌Phenaki听后狂喜)

当然,Quickvid之所以走红,并不是因为生成的视频质量惊人。除了成为文本生成视频赛道的“早鸟”外,与背后的开发者密切相关。

开发者小哥名叫Daniel Habib,此前在Facebook的虚拟现实部门Oculus工作。

Quickvid走红是从今年2月开始的,当时它正式从内测转为Beta测试,仅2月23日一天,就有2万2千多人成为用户。本月ChatGPT开放API后,Daniel把它接入了Quickvid,成为了第一批ChatGPT生态内开发者。

14589d6815939f79c498e549f7c5d33f.png

量子位的视频编辑对两款产品也进行了试玩,用户评价是这样的:暂不认为这东西能威胁自己的就业。

但对于AI生成视频展现出的趋势,多少有点心有凄凄焉

因为你不得不承认,用这玩意儿做视频,完全不需要懂得剪辑知识。而且做一条同等质量的视频,相比人工剪辑,用AI生成,时间和资源投入显著降低

不完美的视频创作AI工具

不仅仅是Quick接入了别人家的API,事实上,今天体验的一帧秒创也接入了GPT-2的API,还用上了开源Stable Diffusion模型。

这不是猜测,是我们直接找到背后开发者“对质”后得知的结果。

一帧秒创背后的公司叫做新壹科技

这个名字或许比较陌生,但这个“新的一”是“一下科技”的“一”。

一下科技,曾经多次站在视频风口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,这是移动互联网时代视频领域响当当的玩家。背后的团队,也是源自搜狐视频-酷6网-新浪视频一脉的视频内容老兵们。

d3a53e8fcdec2656c095778047486bd6.png

其创始人兼董事长韩坤,在创立一下科技之前,以联合创始人的身份把酷6网打造成中国第一家在美国纳斯达克上市的视频网站。

新壹科技是韩坤手下孵化出的最新公司,现有团队在2020年年中开始筹备,领队人雷涛,现任新壹科技CEO,也是一下科技的创始团队成员。

团队正式组建的2020年12月,距ChatGPT出生还有一年,连DALLE-2和Stable Diffusion代表的AI绘画也还没有名声大噪,但春江水暖鸭先知,一下内部这支团队感知到了AI对于视频内容创作的方向性改变。

因为视频内容的传统和基因,新公司诞生之初,新壹并没有把自己定位为一个人工智能公司。

他们希望从首先解决创作者需求切入,让AI介入视频生产全流程,尽可能降低视频内容创作门槛。

通过AI能力,让用户以低成本制作视频,还能用秒拍平台上的视频为AI匹配提供一个庞大的素材库,形成规模壁垒。

把秒拍作为现成的数据库,这对新壹算是一个地利,不仅因为秒拍有10亿级规模的视频素材和数据,更因为秒拍能为一帧秒创进行版权授予,让AI生成的视频有版权保障

后者简直解决了AIGC方面一直争论不休的大问题。

所以首款产品一帧秒创,有了明确的应用场景,也有了面向视频内容创作者、视频自媒体营销的方向。

这是一个集合多种AIGC能力的工具,但是,无论是文生图还是AI帮写,最终的目的都归于一处——把它们作为素材应用到视频生产流程,让视频生产更加高效。

d196094fd30c6115a43dc18b687ec9fe.png

为了高效和低门槛,一帧秒创尽量做到去剪辑化,创作视频的过程从开放式变成了填空式

虽然距离产出极致和精彩的视频还有距离,但最直观的是,哪怕完全不懂剪辑知识的人,也能上手制作视频——甚至是批量制作。

acad6db79c568fcfdc795d31ae412583.png

社交平台的剪辑小白用户评价

目前,一帧秒创方面也知道,自己生成的视频还不能和人工剪辑的视频媲美,但是足以应对一些应用场景,如科普类视频生成效果是最好的,批量生产内容可以应用到抖音本地生活推广。以及除了面向C端的高阶功能订阅模式,一帧秒创还有来自B端的商业合作,比如跟360搜索的合作,已经获得了不错的反馈。

对于一帧秒创当前的初创状态,新壹也透露正在通过一些具体的解决方案改进。

比如创作者集中的内容类别,投入更多的素材分析和标注成本;又比如推出私有化素材库,提高匹配率和视频片段替换率。

雷涛表明了一帧秒创的思路,称作为产品公司,新壹科技虽然没办法让技术和硬件等基础条件实现跨越式的发展,然而,能够在每一阶段适时提供符合当时阶段水平的应用,“这已经足够去忙了”。

他多次以智能手机时代开启后,移动互联网的产品开发机遇举例,也多次用新能源、智能车变革进程中的理想造车模式类比,话里话外,追求的不是一步到位,而是与技术基础设施和整个行业生态一起成长进步,而最关键的是,必须躬身入局,不能站着观望。

这其中自然有视频老兵对新周期的敏锐洞察,但也多少有些不甘心

如果你对2015年以来的互联网江湖还有记忆,应该多少能感知这种不甘心的合情合理。在如今字节独大或抖音快手的双雄格局之前,秒拍和一下科技,才是短视频领域最火爆的明星公司。然而商场如战场,如今的结局和市场份额,已经再清楚不过了。

或许“赢回来”的最好方法就是赢在未来、赢在下一个时代。

下一个时代就是AIGC。连比尔·盖茨都说,背后不亚于互联网的发明。

3188c79c0560b038494fc6d7db30a776.jpeg

面向这个全新的创新创业赛道,已经分出了两拨创业者,走出不同条路线。

一条是技术路线,训练大模型,把底层技术牢牢掌握在自身的手里,做底层,做平台。但门槛极高,创业公司在底层大模型方面取得突破的难度和成本都会很高。

另一条就是面向需求和场景,走产品、应用、工具平台的路线,集成开源和开放的现有技术,先入场再发展壮大,这也是更多中小创业者和开发者最可见的机遇。

这两种路线也不稀奇。

一如当初苹果做出了iOS系统,有人对标iOS,要研发新手机系统,建立新生态;也有许许多多的开发者基于iOS做各种创造,在游戏、开发、创作、工具类别下疯狂推出各种适配iOS系统的App。

所以技术和应用两条道路,都能有玩家走到最后,完成商业化闭环,选择不同而已,没有优劣之分。

从来没有事实能笃定表明,其中某一种能一统天下。

据透露,走产品应用路线的一帧秒创,已经快速积累了近200万用户,每日的视频生成量在10万级——这算不算AIGC时代的船票还不好说,但至少让外界看到变数发生的可能。

— 联系作者 —

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5342.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

头部企业走入无人区,国产数智化厂商挑大梁

本文转自数智前线 文|石兆 编|游勇 央国企数智化与信创化双重需求叠加,国产厂商挑大梁,助力企业升级数智化底座,实现价值化国产替代。 4月,在北京用友产业园的数智剧院里,近千位来自30个行业…

基于Mathematica的机器人仿真环境(机械臂篇)

目的   本文手把手教你在 Mathematica 科学计算软件中搭建机器人的仿真环境,具体包括以下内容:    1 导入机械臂的三维模型    2 正\逆运动学仿真    3 碰撞检测    4 轨迹规划    5 正\逆动力学仿真    6 运动控制   文中的所有代码和模型文件都在此处…

ChatGPT向癌症开了一枪

出品 | 虎嗅医疗组作者 | 陈广晶编辑 | 陈伊凡头图 |《绝命毒师》剧照 经典靶点的奠基人到中国创业,会带来哪些改变? 前不久,一家名为赛得康的生物技术公司获得种子轮投资的消息,在医药行业媒体来了一轮“轰炸”。除了创业者之一宾…

MindNLP-基于Mindspore2.0的GPT2预训练模型迁移教程

前言 动机 大家好,我是Super_WZB,最近MindSpore快要上线2.0版本了,由于之前主要是参与MindSpore的开发工作,一直想找机会多用一用。而自春节开始也是参与到了一项基于MindSpore的迁移工作,积攒了一些经验&#xff0c…

做副业的我很迷茫,但ChatGPT却治好了我——AI从业者被AI模型治愈的故事

迷茫,无非就是不知道自己要做什么,没有目标,没有方向。 当有一个明确的目标时,往往干劲十足。但做副业过程中,最大的问题往往就是 不知道自己该干什么。 干什么?怎么干?干到什么程度&#xff1f…

国内外人工智能AI工具网站大全(一键收藏,应有尽有)

本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移…

替代notepad++,notepad--介绍及插件cmake编译

Notepad 是一个文本编辑器小软件,用来替代windows自带的记事本。然而Notepad软件的作者太霸道,如果你不赞同他的观点,Notepad将会在你的源码里面插入随机字符。推荐一款国产的开源跨平台软件NDD(notepad--),功能一点儿不弱,体积小…

【LLM大模型】模型和指令微调方法

note Hugging Face 的 PEFT是一个库(LoRA 是其支持的技术之一,除此之外还有Prefix Tuning、P-Tuning、Prompt Tuning),可以让你使用各种基于 Transformer 结构的语言模型进行高效微调。AIpaca羊驼:让 OpenAI 的 text-…

开源ChatGPT要来了;软件2.0智能革命;GLM、Diffusion模型大加速

1. 2023年AI十大展望:GPT-4领衔大模型变革,谷歌拉响警报,训练数据告急 新年伊始,大模型的话题热度不减。ChatGPT展现的惊人能力将大模型研究和应用热度推向高潮,人们激烈讨论着这个高级“物种”的推出意味着什么。 本文…

被ChatGPT带热的最新技术岗:无需编码,年薪超200万

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年1月份热门报告合集 ChatGPT调研报告 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结:150个ChatGPT提示此模板 Ch…

AI提效工具|借助chatgpt快速读论文,快速总结、归纳、索引相似文章

目前新论文层出不穷,“快速阅读论文”成为研究者们一个必备能力。本文简单记录了近期出现的两个借助chatgpt来帮助我们快速读论文的“神器”,帮助大家快速上手应用,迅速提升论文阅读速度。 此外,本人也会定期更新记录一些类似的“…

获取全球各大证券交易所的全部股票交易信息

幻想过这样的两种能力,一是回到过去,二是预见未来。时间逆转回到过去,这更多的是在文艺作品中能够出现的情节。而预见未来,我们正在努力,希望可以更准确地预见更长时间内更多的细节。例如在瞬息万变的股票交易市场中&a…

如何使用chatGPT辅助开发复杂D3图表

如何使用chatGPT辅助开发一个复杂的D3图表 首先简单介绍一下实现的表单。 在线地址:https://2guliang.top/temperature/timeChat 引言 什么是 D3 D3 (Data-Driven Documents) 是一个基于数据驱动的 JavaScript 库,用于创建可交互的数据可视化图表。…

如何在代码开发中便捷使用 ChatGPT 协助开发

在五一节前后,抽空测试了下网上推荐的开发环境和开发插件,在这里推荐给前后端代码开发的同胞们。 方法一:IDEA 安装 插件 bito 习惯使用 IDEA 开发代码的同胞,可以尝试直接在 IDEA 中安装插件 bito,注意操作过程中需要…

ChatGPT 嵌入开发

为了提高问答「准确率」,有两个优化方向 1、增加训练集数据 2、增加提问上下文语料,答案就在其中 OpenAI 是不允许用户来训练数据的,他的 model 是固定且通用的。所以增加训练集数据并不可行。 使用chatgpt 嵌入,让chatgpt根据语料内容回答。 实际应用,产品客服、产品…

ChatGPT Plugin 开发流程图

有关如何设置、开发和部署 ChatGPT 检索插件的详细信息请参照 https://github.com/openai/chatgpt-retrieval-plugin

如何用ChatGPT使开发效率提高50%以上?

简介 ChatGPT是一个大型语言模型,由OpenAI开发。它被训练用于进行对话式交互,能够理解和生成自然语言文本。ChatGPT可以用于多种任务和场景,包括但不限于:智能助手、创意生成、语言学习、编程辅助等。ChatGPT的优势在于它的广泛知…

ChatGPT 插件系统,正式上线!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 ChatGPT 诞生以来,技术圈内有不少开发者基于它的功能实现了不少优秀的产品,现如今在 GitHub 上新增的 ChatGPT 项目更是多不胜数。 为了能够更加灵活的扩展 Chat…

【最新整理】一起看看86 个 ChatGPT 插件

今天我们来看看这86个插件都是做什么的? Shimmer:跟踪膳食并获得更健康生活方式的见解 World News:总结新闻头条 Bohita:用您能描述的任何图像制作服装 Portfolio Pilot:您的 AI 投资指南:投资组合评估…

ChatGPT写的C++学习路线是怎样的

ChatGPT写的C学习路线是怎样的 图片版 文字版 请为我写一条C全栈学习路线,有以下要求: 1、搜索了以下所有要求的相关资料后再做回答,注意逻辑 2、20000字以上,如果没有说完,自己继续 3、求职路线适用于刚进入职场一年…