AI的狂欢已不再仅仅属于ChatGPT,下一个风口将剑指AI视频生成。
制作出高质量的专业视频内容耗时且昂贵,但人工智能的技术进步促使企业掌握了更多筹码和选择。
一家总部位于英国伦敦的AI视频创作平台Sunthesia正在AI视频生成的路上摸索。
Synthesia历经七年发展至今,是在AI视频创作领域难能可贵掀起波澜的公司。所以,凭借这点,Synthesia就值得获得更多的报道声音,对于像Synthesia的初创AI企业来说,外界给予的鲜花和掌声亦是企业发展的动力。
说到这,Synthesia的出圈,还要归功于梅西在绿幕背景下录制了一段5分钟的视频,将素材导入Synthesia的AI模型中。由此,一个生活在虚拟世界的“真”梅西就诞生了。
正如联合创始人之一Victor Riparbelli所表示:”生成式人工智能强大的力量为广泛的行业提供新的能力。synthesia希望利用AI技术将实体视频制作转变为完全数字化的过程,创作者只需要一个Synthesia账户就能将他们的想法变为现实。“
Hi,LVS最近重新对公号原创内容栏目做了思考,未来我们希望通过此栏目发现多媒体生态当下的新变化,痛点以及如何推动行业持续繁荣发展,将会产出更多原创深度报道文章。
如果你对多媒体圈子好奇,或战斗在行业发展前线,愿意分享自己的洞察和思考,尤其是有选题线索来爆料、寻求报道,欢迎联络笔者。WeChat:XinWell0709
文 | Xin Wang
Email | aris.wang@livevideostack.com
一、对标Runway?做2C or 2B?
Synthesia的发展轨迹如同美国一位投资人埃拉德·吉尔(Elad Gil)的观点——在部分科技浪潮中,所有的价值都可以由初创企业捕获。
Synthesia 于 2017 年成立,由Victor Riparbelli(首席执行官)和Steffen Tjerrild(首席运营官/首席财务官)以及计算机视觉教授 Matthias Niessner 和 Lourdes Agapito 共同创立。值得一提的是,这支主创团队成员们均来自UCL、斯坦福大学和剑桥大学等名牌大学。
刚成立时,Synthesia的定位只是合成视频制作,直到现在,Synthesia将自己新定位为“快速利用文本创建视频的AI视频创作平台。
主创团队希望“以代码代替摄像头”,在这样的理念下,Synthesia使用十分便利,正如其slogan”为让做视频像写邮件”一样简单,运作模式只需三个步骤:挑选模板-挑选主持人-输入文本,就可以生成一个质量还不错的视频。
Synthesia为用户提供了丰富的自定义选项,它拥有25个以上不同的场景的模板,还提供多种语言、多个外貌不同的主持人供用户充分的选择。一位名为Kyle的海外网友在某社交平台上向LiveVideoStack表示:“Synthesia吸引自己的地方在于,能在该平台输入自己的特征,并生成自己的形象去生成各类视频。”由此看来,“形象自定义”或许是Synthesia最吸引人的招牌功能。
当然,如果想要复杂一点的视频,提供更多的素材即可,不需要编辑和制作视频的任何技能。
后来在2020年时,Synthesi推出SaaS 产品(软件即服务产品)STUDIO 的公测版。Synthesia STUDIO,通过运用AI技术,在真人演员和合成角色库中创建和定制化身从而生成视频,主要运用于企业传播、数字视频营销和广告本地化。
从客户定位来看,Synthesia主打B端企业级市场。据Riparbelli介绍,Synthesia目前在平台上拥有200多名员工和50000多。企业客户,客户群体包括三分之一的财富100强企业,比如广告巨头WPP以及咨询审计公司EY。
反映到市场反馈上——尽管Synthesia极少透露利润数字,但据CNBC的最新报道,该平台已制作了超过1200万个视频,用户数量在今年同比增长400%。
视频已经成为基础设施。上海交通大学图像所副所长宋利教授也表示:“国内C端的确发展更快,而国外在B端创新更好,再加上版权意识更强烈,专业用户生产内容占据用户们的眼球更多一些,Synthesia毕竟作为一家发展了6年的企业,能支撑这些年带来的商业回报,客户群体瞄向B端也是正确的。”
横向对比来看,这似乎和同样做AI视频生成的Runway客户群体不同,Runway在C端发力,这难道不构成竞争关系?
“就像 StableDiffusion和Midjourney这两个组合,Midjourney是闭源的,StableDiffusion是开源的,这两点不同。但背后还有很多机制是相通的,从工程上来说,这两家的训练数据也各有侧重,Runway对于普通创作者来说更友好些。”宋利说。
而从技术角度而言,比起一般的视频或音频平台,运用AI生成视频平台Synthesia在成本和效率上会更有优势。该公司的目标是将摄制组、工作室、演员等视频制作过程,缩减为一个 API 应用程序接口调用。
二、海外顶级风投豪掷AI视频生成
历经六年,行动虽慢,但Synthesia走的每一步都稳扎稳打,稳进的融资节奏使其走到了风口之上。
回顾Synthesia的融资历程——2019年4月,公司完成300万美元种子轮融资,由LDV Capital和企业家个人Mark Cuban领投;
2021年4月,完成了1250万美元的A轮融资,由总部位于纽约的早期风投机构FirstMark Capital领投,这家风投机构的知名投资案例包括Airbnb和Shopify等公司;
就在同年12月,公司再次完成5000万美元的B轮融资,由凯鹏华盈(KPCB)的Josh Coyne领投,GV(前身为Google Ventures)参投,该笔资金用于人脸合成技术及项目的开发。
至少在2021年看来,AI还未像现在这样火爆,这也是为何称Synthesia一年便融资两轮的厉害之处。
Synthesia融资的新进展在今年6月14日,Synthesia宣布完成9000万美元的C轮融资,本轮融资由Accel领投,NVentures、Kleiner Perkins、GV、Firstmark capital、Alex Wang、Olivier Pomel、Amjad Masad参投。融资完成后,公司总估值达到10亿美元,该笔融资资金将帮助公司进一步简化视频创作流程。
此外,据首席执行官Riparbelli的亲自表示,Accel的Philippe Botteri还将成为Synthesia董事会一员。
Synthesia这次C轮融资的最大看点在于,跟投方除了之前的投资人KP和GV以及一大批公司CEO之外,还包括了英伟达旗下基金NVentures,这个融资金额也比之前传闻的5000万美元高了不少。
有意思的是,针对这次C轮融资的消息,英伟达和Synthesia两家公司表现极其活跃。
关于英伟达作为Synthesia此次C轮投资方,Riparbelli在公告中有所介绍,并写道:“We’re already happy customers and, as we make additional progress towards training large AI models, NVIDIA’s expertise will be incredibly valuable to our AI research efforts.” (我们已经成为英伟达的忠实客户,随着我们在训练大型人工智能模型方面取得更多进展,英伟达的专业知识对我们的人工智能研究工作将具有难以置信的价值。)
领投方 Accel 在其官方博客里,将 Synthesia 定位为 AI-generated video for the enterprise。Accel 表示:“Synthesia 的平台可以将视频制作时间缩短 95%,使其成为一种具有成本效益的解决方案,同时还可以提高视频的参与度。”
融资减少和估值回调的一级市场,仿佛并没有对生成性人工智能造成波及,甚至毫发无伤——据风投Atomico的一份报告显示,人工智能是吸引更多投资的领域之一。去年,生成性人工智能占到了人工智能和机器学习公司总投资的35%,这是有史以来最高比例,比2022年的5%大幅跃升。
而就在Synthesia刚刚融资完9000万美元C轮后,6月底,AI视频公司Runway同样宣布进行了新一轮融资,从Google、英伟达、salesforce等投资方手里筹集了亿级别左右的美元,具体金额未透露,Runway称此次融资是去年12月5000万美元C轮融资的延伸。
在谈及竞争对手时,Riparbell则说,他们真正的竞争对手是PDF。到目前为止,对于大多数人来说,视频是比五页PDF更好的交流媒介,称这是他们平台的核心价值。
三、AI视频生成领域的未来
目前,Synthesia除了加速AI的研究外,还将进一步构建协作视频编辑平台,AI这块包括正在研究下一代头像(Avatar)技术,比方说有更多的表情、更自然的动作、更好的声音和更简单的可定制选项。
Riparbelli认为将来每个人都能拥有自己的avatar,通过输入文本创建视频甚至zoom会议,让多人包含情感地互动,甚至实时进行。
对于Synthesia所处的虚拟人赛道,TechCrunch 的总编辑Jordan Crook也表示Synthesia需要增加AI avatar的真实感和情感表达,还必须确保用户的安全和自己平台的可信度。
所以,Synthesia和runway的野心都不止开发工具集这么简单,Riparbelli曾表达过制作一部完全合成的好莱坞电影的想法;Runway更是于近期成立了Runway studios,旗下的艺术创作工具RunwayML参与制作的《瞬息全宇宙》不久前获得了奥斯卡最佳女主角奖,甚至还推出了AI电影节。
不可否认,从2022年以来,具有生成式AI能力的2C产品数量快速增加,海外以 SaaS 产品为主流,国内在C端产品方面还未形成较为成熟的产品和商业模式。海外的典型案例如 Midjourney、Novel AI、 Adobe Firefly、Runway 等,目前在文本生成、图像生成领域的产品较为成熟,而在视频、 音频、3D 等领域还需要技术的进一步发展。
宋利表示:“目前AI视频生成的技术发展总体上还处在早期阶段,虽然各家在技术上会有各自的创新和进展,但基本的技术原理还是基于生成式扩散模型。“
一位业界从业者也表示,在刚刚过去的2023WAIC上海人工智能大会上,目前国内看到更多的仍是做AI图片生成的企业,AI视频的几乎没看到。
也有人在问,这是否又会颠覆内容创作者们的工作?
外界总是传来AIGC将会对人类造成威胁的声音,其实恰恰相反,在AIGC时代,人的重要性愈发显现。
这对于创作者来说,当AI文本生成技术能力到达一定阶段时,反而会激发出内容创作者的竞争心态,制作更精品化的内容。优质创作者们的春天才刚刚到来。
当然,AI视频生成领域的想象力远不止于此,我们希望Synthesia会从默默无闻的独角兽发展成占据更多市场份额的AI视频企业,但更希望Synthesia会是AI生成视频领域企业当中的冰山一角。毕竟,个体、和企业的发展,永远赖以行业的生态持续繁荣为前提。
参考资料:https://techcrunch.com/2023/06/14/synthesia-secures-90m-for-ai-that-generates-custom-avatars/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAF9RjUJXsynBJ65XClDwx1Yigmf8UycOU6ZnWOtLiH7_7Tlllc9jk0xdpIXXmtntOXXA0LN-B-6kkUAwjng_JZDWFG-dJq4vmcmYTeKzqUpVGMY6g-fDvRwS-R3QRuM3Zy5E8qxU91aFU-kh57zH200cha3oCW_l8wchRVQskZoq
https://www.cnbc.com/2023/06/13/ai-firm-synthesia-hits-1-billion-valuation-in-nvidia-backed-series-c.html
▲扫描图中二维码或点击“阅读原文” ▲
查看更多LiveVideoStackCon 2023上海站精彩话题