获英伟达和Accel9000万美金投资,AI视频Synthesia要对标Runway?

AI的狂欢已不再仅仅属于ChatGPT,下一个风口将剑指AI视频生成。

制作出高质量的专业视频内容耗时且昂贵,但人工智能的技术进步促使企业掌握了更多筹码和选择。

一家总部位于英国伦敦的AI视频创作平台Sunthesia正在AI视频生成的路上摸索。

Synthesia历经七年发展至今,是在AI视频创作领域难能可贵掀起波澜的公司。所以,凭借这点,Synthesia就值得获得更多的报道声音,对于像Synthesia的初创AI企业来说,外界给予的鲜花和掌声亦是企业发展的动力。

说到这,Synthesia的出圈,还要归功于梅西在绿幕背景下录制了一段5分钟的视频,将素材导入Synthesia的AI模型中。由此,一个生活在虚拟世界的“真”梅西就诞生了。

正如联合创始人之一Victor Riparbelli所表示:”生成式人工智能强大的力量为广泛的行业提供新的能力。synthesia希望利用AI技术将实体视频制作转变为完全数字化的过程,创作者只需要一个Synthesia账户就能将他们的想法变为现实。“

Hi,LVS最近重新对公号原创内容栏目做了思考,未来我们希望通过此栏目发现多媒体生态当下的新变化,痛点以及如何推动行业持续繁荣发展,将会产出更多原创深度报道文章。

如果你对多媒体圈子好奇,或战斗在行业发展前线,愿意分享自己的洞察和思考,尤其是有选题线索来爆料、寻求报道,欢迎联络笔者。WeChat:XinWell0709

文 | Xin Wang
Email | aris.wang@livevideostack.com

一、对标Runway?做2C or 2B?

Synthesia的发展轨迹如同美国一位投资人埃拉德·吉尔(Elad Gil)的观点——在部分科技浪潮中,所有的价值都可以由初创企业捕获

Synthesia 于 2017 年成立,由Victor Riparbelli(首席执行官)和Steffen Tjerrild(首席运营官/首席财务官)以及计算机视觉教授 Matthias Niessner 和 Lourdes Agapito 共同创立。值得一提的是,这支主创团队成员们均来自UCL、斯坦福大学和剑桥大学等名牌大学。

742a67570864c8177364903362523a5c.png

刚成立时,Synthesia的定位只是合成视频制作,直到现在,Synthesia将自己新定位为“快速利用文本创建视频的AI视频创作平台。

主创团队希望“以代码代替摄像头”,在这样的理念下,Synthesia使用十分便利,正如其slogan”为让做视频像写邮件”一样简单,运作模式只需三个步骤:挑选模板-挑选主持人-输入文本,就可以生成一个质量还不错的视频。

bade5b191b30d5856d12180c44116dda.png

Synthesia为用户提供了丰富的自定义选项,它拥有25个以上不同的场景的模板,还提供多种语言、多个外貌不同的主持人供用户充分的选择。一位名为Kyle的海外网友在某社交平台上向LiveVideoStack表示:“Synthesia吸引自己的地方在于,能在该平台输入自己的特征,并生成自己的形象去生成各类视频。”由此看来,“形象自定义”或许是Synthesia最吸引人的招牌功能

当然,如果想要复杂一点的视频,提供更多的素材即可,不需要编辑和制作视频的任何技能。

1ff81877acd57ae587e5fe29701c2a0d.png

后来在2020年时,Synthesi推出SaaS 产品(软件即服务产品)STUDIO 的公测版。Synthesia STUDIO,通过运用AI技术,在真人演员和合成角色库中创建和定制化身从而生成视频,主要运用于企业传播、数字视频营销和广告本地化。

从客户定位来看,Synthesia主打B端企业级市场。据Riparbelli介绍,Synthesia目前在平台上拥有200多名员工和50000多。企业客户,客户群体包括三分之一的财富100强企业,比如广告巨头WPP以及咨询审计公司EY。

反映到市场反馈上——尽管Synthesia极少透露利润数字,但据CNBC的最新报道,该平台已制作了超过1200万个视频,用户数量在今年同比增长400%。

视频已经成为基础设施。上海交通大学图像所副所长宋利教授也表示:“国内C端的确发展更快,而国外在B端创新更好,再加上版权意识更强烈,专业用户生产内容占据用户们的眼球更多一些,Synthesia毕竟作为一家发展了6年的企业,能支撑这些年带来的商业回报,客户群体瞄向B端也是正确的。

横向对比来看,这似乎和同样做AI视频生成的Runway客户群体不同,Runway在C端发力,这难道不构成竞争关系?

“就像 StableDiffusion和Midjourney这两个组合,Midjourney是闭源的,StableDiffusion是开源的,这两点不同。但背后还有很多机制是相通的,从工程上来说,这两家的训练数据也各有侧重,Runway对于普通创作者来说更友好些。”宋利说。

 而从技术角度而言,比起一般的视频或音频平台,运用AI生成视频平台Synthesia在成本和效率上会更有优势。该公司的目标是将摄制组、工作室、演员等视频制作过程,缩减为一个 API 应用程序接口调用。

二、海外顶级风投豪掷AI视频生成

历经六年,行动虽慢,但Synthesia走的每一步都稳扎稳打,稳进的融资节奏使其走到了风口之上。

回顾Synthesia的融资历程——2019年4月,公司完成300万美元种子轮融资,由LDV Capital和企业家个人Mark Cuban领投;

2021年4月,完成了1250万美元的A轮融资,由总部位于纽约的早期风投机构FirstMark Capital领投,这家风投机构的知名投资案例包括Airbnb和Shopify等公司;

就在同年12月,公司再次完成5000万美元的B轮融资,由凯鹏华盈(KPCB)的Josh Coyne领投,GV(前身为Google Ventures)参投,该笔资金用于人脸合成技术及项目的开发。

至少在2021年看来,AI还未像现在这样火爆,这也是为何称Synthesia一年便融资两轮的厉害之处。

Synthesia融资的新进展在今年6月14日,Synthesia宣布完成9000万美元的C轮融资,本轮融资由Accel领投,NVentures、Kleiner Perkins、GV、Firstmark capital、Alex Wang、Olivier Pomel、Amjad Masad参投。融资完成后,公司总估值达到10亿美元,该笔融资资金将帮助公司进一步简化视频创作流程。

此外,据首席执行官Riparbelli的亲自表示,Accel的Philippe Botteri还将成为Synthesia董事会一员。

Synthesia这次C轮融资的最大看点在于,跟投方除了之前的投资人KP和GV以及一大批公司CEO之外,还包括了英伟达旗下基金NVentures,这个融资金额也比之前传闻的5000万美元高了不少

1de9f265c370fb3839d9835d6801a284.png

有意思的是,针对这次C轮融资的消息,英伟达和Synthesia两家公司表现极其活跃。

关于英伟达作为Synthesia此次C轮投资方,Riparbelli在公告中有所介绍,并写道:“We’re already happy customers and, as we make additional progress towards training large AI models, NVIDIA’s expertise will be incredibly valuable to our AI research efforts.” (我们已经成为英伟达的忠实客户,随着我们在训练大型人工智能模型方面取得更多进展,英伟达的专业知识对我们的人工智能研究工作将具有难以置信的价值。)

领投方 Accel 在其官方博客里,将 Synthesia 定位为 AI-generated video for the enterprise。Accel 表示:“Synthesia 的平台可以将视频制作时间缩短 95%,使其成为一种具有成本效益的解决方案,同时还可以提高视频的参与度。”

d2a7d994a3a11a203f87384ca8e1fab4.png

融资减少和估值回调的一级市场,仿佛并没有对生成性人工智能造成波及,甚至毫发无伤——据风投Atomico的一份报告显示,人工智能是吸引更多投资的领域之一。去年,生成性人工智能占到了人工智能和机器学习公司总投资的35%,这是有史以来最高比例,比2022年的5%大幅跃升

而就在Synthesia刚刚融资完9000万美元C轮后,6月底,AI视频公司Runway同样宣布进行了新一轮融资,从Google、英伟达、salesforce等投资方手里筹集了亿级别左右的美元,具体金额未透露,Runway称此次融资是去年12月5000万美元C轮融资的延伸

在谈及竞争对手时,Riparbell则说,他们真正的竞争对手是PDF。到目前为止,对于大多数人来说,视频是比五页PDF更好的交流媒介,称这是他们平台的核心价值。

ac6cb9ac8eb096f58ac9f734219a8360.png

三、AI视频生成领域的未来

目前,Synthesia除了加速AI的研究外,还将进一步构建协作视频编辑平台,AI这块包括正在研究下一代头像(Avatar)技术,比方说有更多的表情、更自然的动作、更好的声音和更简单的可定制选项。

Riparbelli认为将来每个人都能拥有自己的avatar,通过输入文本创建视频甚至zoom会议,让多人包含情感地互动,甚至实时进行。

对于Synthesia所处的虚拟人赛道,TechCrunch 的总编辑Jordan Crook也表示Synthesia需要增加AI avatar的真实感和情感表达,还必须确保用户的安全和自己平台的可信度。

所以,Synthesia和runway的野心都不止开发工具集这么简单,Riparbelli曾表达过制作一部完全合成的好莱坞电影的想法;Runway更是于近期成立了Runway studios,旗下的艺术创作工具RunwayML参与制作的《瞬息全宇宙》不久前获得了奥斯卡最佳女主角奖,甚至还推出了AI电影节。

3af4ce8f9a6590cc9d1ca5d43c43bc00.png

不可否认,从2022年以来,具有生成式AI能力的2C产品数量快速增加,海外以 SaaS 产品为主流,国内在C端产品方面还未形成较为成熟的产品和商业模式。海外的典型案例如 Midjourney、Novel AI、 Adobe Firefly、Runway 等,目前在文本生成、图像生成领域的产品较为成熟,而在视频、 音频、3D 等领域还需要技术的进一步发展

宋利表示:“目前AI视频生成的技术发展总体上还处在早期阶段,虽然各家在技术上会有各自的创新和进展,但基本的技术原理还是基于生成式扩散模型。“

一位业界从业者也表示,在刚刚过去的2023WAIC上海人工智能大会上,目前国内看到更多的仍是做AI图片生成的企业,AI视频的几乎没看到。

也有人在问,这是否又会颠覆内容创作者们的工作?

外界总是传来AIGC将会对人类造成威胁的声音,其实恰恰相反,在AIGC时代,人的重要性愈发显现。

这对于创作者来说,当AI文本生成技术能力到达一定阶段时,反而会激发出内容创作者的竞争心态,制作更精品化的内容。优质创作者们的春天才刚刚到来。

当然,AI视频生成领域的想象力远不止于此,我们希望Synthesia会从默默无闻的独角兽发展成占据更多市场份额的AI视频企业,但更希望Synthesia会是AI生成视频领域企业当中的冰山一角。毕竟,个体、和企业的发展,永远赖以行业的生态持续繁荣为前提。

参考资料:https://techcrunch.com/2023/06/14/synthesia-secures-90m-for-ai-that-generates-custom-avatars/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAF9RjUJXsynBJ65XClDwx1Yigmf8UycOU6ZnWOtLiH7_7Tlllc9jk0xdpIXXmtntOXXA0LN-B-6kkUAwjng_JZDWFG-dJq4vmcmYTeKzqUpVGMY6g-fDvRwS-R3QRuM3Zy5E8qxU91aFU-kh57zH200cha3oCW_l8wchRVQskZoq
https://www.cnbc.com/2023/06/13/ai-firm-synthesia-hits-1-billion-valuation-in-nvidia-backed-series-c.html

1d955ecdc7993e34749c895588f04c0e.png

扫描图中二维码或点击“阅读原文 

查看更多LiveVideoStackCon 2023上海站精彩话题 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13105.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

巴比特 | 元宇宙每日必读:OpenAI CEO称短期内不会训练GPT5,公司正通过外部审计等措施评估潜在危险...

摘要:据财联社报道,OpenAI首席执行官Sam Altman周三(6月7日)在印度《经济时报》主办的一次会议上称,目前OpenAI仍然没有培训GPT-5。Altmam还反驳了一些对人工智能最直言不讳的担忧声,称该公司已经在通过外部…

未来已来,大模型无处不在。音视频技术人,你准备好了吗?

“音视频领域正面临着一场人机交互体验的革命,是算力、连接、显示整个端到端革命的升级,市场也在呼唤着颠覆式的终端,现象级的内容以及全新的产业生态。” 技术是从什么时候开始改变我们的生活的? 打开电视,电影《瞬息…

阿里CTO线退出历史舞台/ AI视频公司Runway估值破百亿/ OpenAI确认不用API数据训练…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是5月6日,又一个“星期五”。 科技圈更多新鲜事儿,下滑走起~ 阿里CTO线退出历史舞台 据雪豹财经社独家消息,充当各业务技术中台的阿里CTO线近日完成了组织架构的…

快影内测多款AIGC新功能,短视频智能创作时代即将到来?

AIGC作为AI细分之下的重要赛道,迅速在短视频、绘画、音乐创作等领域出圈,吸引了如阿里、字节、百度、美团等多个互联网大厂,并纷纷布局和计划推出AI类的产品。 特别是百度旗下生成式AI产品“文心一言”,已成为不少文字创作者的辅助…

一天搞定50条视频!AI替你打工的流程有人已经跑出来了

梦晨 金磊 发自 凹非寺量子位| 公众号 QbitAI 最近的AI狂欢属于ChatGPT,接下来该轮到AI生成视频了。 想做UP主但又不知道怎么剪视频的人,这下真的可以放开手脚,专心管内容创作,剩下的工作完全丢给AI来生成了。 最重磅的…

免费体验Stable Diffusion deforum文转视频插件,还有deforum API 接口部署介绍!

如何使用 Serverless Devs 和函数计算快速体验部署 Stable Diffusion,这个是小白也能简单体验安装部署的教程.有电脑就能操作,依托阿里云原生服务.不用考虑硬件问题 本篇主要讲解怎么安装跟部署自定义安装插件跟模型.以deforum文转视频插件举例.deforum api 接口 自…

华人团队颠覆CV!SEEM完美分割一切爆火,一键分割「瞬息全宇宙」

作者 | 新智元 编辑 | 自动驾驶与AI 点击下方卡片,关注“自动驾驶与AI”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【语义分割】技术交流群 后台回复【领域综述】获取自动驾驶全栈近80篇综述论文! Meta的「分割一切」的横空出世&…

SEEM:微软基于 CV 大模型新作,分割“瞬息全宇宙”

文 | 智商掉了一地 交互式视觉分割新作,具有语义感知的新模型~ 自从 Meta 发布了“分割一切”的 SAM 之后,各种二创如雨后春笋般冒出,昨天微软的一篇论文又在推特上引起讨论,虽然最开始吸引小编的是它的名字——分割“瞬息全宇宙”…

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性 1.什么是语言模型? 大家或多或少都听过 ChatGPT 是一个 LLMs,那 LLMs 是什么?LLMs 全称是 Large Language…

分享一个ChatGPT提示词技巧

先说原理: 核心点:利用ChatGPT的训练特性模仿功能; 先从网上找10来个优质的提示词; 然后把这些优质提示词“喂”给ChatGPT,目的是让它学会这些优质提示词的套路; 接着,我们再提供一个主题&a…

GPT-4发布!能打败ChatGPT的只有OpenAI自己!

众所周知,chatGPT的对话生成模型用的是GPT3.5,而今发布的GPT4相比GPT3,又有了巨大的升级: 输入仅文本 > 输入文本和图像,具备了强大的识图能力 文字输入限制3k字 > 2.5w字 准确率、对细节的理解能力大幅提升 o…

ChatGPT,音乐,与数据库

小编君是个不务正业,喜欢搞跨界,干啥啥不成的DBA,大概在十一年前就有个不成熟的妄念,能否用计算机来写音乐? ▌用ChatGPT来搞音乐? 音乐是一个个的音符,按照乐理规则排列的。音符之间是否和谐…

吴恩达 ChatGPT Prompt Engineering for Developers 系列课程笔记--08 Chatbot

08 Chatbot ChatGPT的一种重要功能是作为一个聊天机器人,本节将展示如何和ChatGPT进行对话 1) 不同的角色(Roles) 前面几节的课程中,我们通过如下函数调用ChatGPT的接口,输入用户输入的prompt,返回模型生…

大厂对ChatGPT的开发利用和评估案例收录

ChatGPT已经进入各行各业,但是实际在工作中的有哪些应用呢?这里分享互联网一线大厂分享的一些实际使用案例,所有文章收录到 大厂对ChatGPT的开发利用和评估案例收录https://www.webhub123.com/#/home/detail?projectHashid67792343&owne…

ChatGPT专业应用:生成导播规划表

正文共 971 字,阅读大约需要 5 分钟 直播运营必备技巧,您将在5分钟后获得以下超能力: 生成导播规划表 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者…

ChatGPT专业应用:生成节目串词

正文共 839 字,阅读大约需要 5 分钟 主持人必备技巧,您将在5分钟后获得以下超能力: 生成节目串词 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者 | …

4月份读书学习好文记录

4月份学习记录 找到自己感兴趣的方向,而不是人云亦云,知道自己想要的是什么,而不是一直得过且过! 差距是怎么出现的,四年来的点点滴滴!!! 一个前端大佬的十年回顾 | 漫画前端的前世…

一览 A16z 在 2023 年重点关注的 Crypto 和 Web3 游戏想法

原文来自:a16z 编译:DeFi 之道 隔夜的粥 注:顶级投资机构 a16z 刚刚发布了一份综合关注清单,列出了科技建设者在未来一年可能要解决的“大想法”,这份清单涵盖了消费科技、游戏、AI、Crypto 等多个领域,以下是一些让 a…

让ChatGPT分析下五一出行的数据

这个五一的真的真的真的很火,哪哪都是人人人人人人。 刚好看到官媒发出了五一期间的旅游宏观数据,我们就来简单分析下。 有了ChatGPT以后,就没必要自己亲自动手啦,直接丢给ChatGPT: 好吧,不得不说&#xff…

放大招:三步搞定ChatGPT提示词,轻松写出高质量提问,最新经验分享

在撰写ChatGPT提示语的时候,有一个基本的三层结构,经过在工作和生活上的实践,有助于解决大多数不同类型的任务。 尤其在你的问题有点复杂,想不清楚要怎么问比较好的时候,通过三层结构,让我们有结构的提出问…