ChatGPT之后,下个AIGC杀手级应用已近在眼前

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

大模型模式,正在新一波AIGC的浪潮里被再度验证。

从AI画画的出圈,到现如今ChatGPT的火爆,面向大众的爆款产品接口背后,无不是大模型技术的突破创新。

而当这种“大力出奇迹”的技术路径价值愈发凸显,行业内外也不禁好奇:

AI绘画、ChatGPT版搜索之后,下一个大模型的爆发点会出现在何处?

b650c53ec716e9188ead5c155656d780.png

遵循技术规律推测,可以预见的是,视频领域的技术革命已近在眼前

从技术的角度来说,在大语言模型迭代进化的同时,谷歌、Meta等大厂在视频自动生成领域已有更深层的探索。

而从商业的视角来看,中信建投就在报告中指出,AIGC在文本、音频、视频、游戏等等行业中,成长空间巨大。

量子位智库也预测,AI生成视频将在5年后迎来较为广泛的规模应用。

bd3fb3f1fdfd81bfe3c6ddbc54cc9f33.png
图源:量子位智库

AIGC下一站:视频生成

不妨先展开看看相关领域的技术进展。

谷歌:Phenaki和Imagen Video

就在ChatGPT刷屏之际,谷歌AI生成的一段视频突然爆火,一时分走不少讨论度。

背后的AI模型名为Phenaki。只需提供一段提示词,这个文本转视频(Text-to-Video)模型分分钟就能生成长达两分钟的视频。

不仅时长远超早期的文生视频模型,Phenaki生成的视频还颇具故事性。

比如给它这样一段场景描述:

一只逼真的泰迪熊正在潜水;随后它慢慢浮出水面;走上沙滩;这是镜头拉远,泰迪熊行走在海滩边篝火旁。

就能得到一个这样的视频片段:

a052828e7845e4f1c0c667c5213ce6c3.gif

除此之外,谷歌还推出过基于扩散模型的Imagen Video。其特点是分辨率高,同时可以理解不同的艺术风格和3D结构。

96436d233ef08dbcaf5130b33183e670.gif

Meta:Make-A-Video

在“拿嘴做视频”这方面,Meta也有所布局。

Meta的文生视频模型名为Make-A-Video,同样是文本图像生成模型的升级版,主要由三部分组成:

  • 文本图像生成模型P

  • 时空卷积层和注意力层

  • 用于提高帧率的帧插值网络和两个用来提升画质的超分模型

不仅给出一句“马儿喝水”,Make-A-Video就能生成出一段“纪录片”画面来:

d09192389872687fa93ad9d89ac57b18.gif

这个AI模型还具备将静态图像转成视频、根据前后两张图片生成一段视频,以及基于一段原视频生成新视频的能力。

23d9f521a66e1a7062fd4f6e3dbb64d2.gif

百度:VidPress

国内,百度也把文心大模型的能力,运用到了智能视频合成平台VidPress中。

VidPress能够实现图文自动转视频,即把文字脚本、视频内容搜索、素材处理、音视频对齐,以及剪辑这5个步骤自动化。

其中涉及的语义分析、素材相关度打分等环节,就都是基于文心大模型训练实现的。

59983295205819138773b97cc341d279.png

从技术的发展可以看出,在语言大模型、图像大模型之后,多模态大模型已经成为了新的趋势。视频就是其中具有代表性的一个应用领域。

而从商业化的角度来看,文化娱乐、教育、传媒等诸多领域,本身就对基于AI的可视化内容有强烈需求。

根据中信建投对各类内容未来可AI制作比例的测算,在视频成为信息主要表达载体的当下,无论是在游戏、短视频、直播,还是影视等领域,AI视频内容生成都将成为AIGC的主要关注方向。

a18e99fe0e54c47998dbbe964bce2e0d.png

并且在2022年,DALL·E、Imagen、Stable Diffusion等多个高质量文生图大模型的“轰炸”之下,一个新的市场规律已经得到验证:

当生成质量提高到专业水平时,原本AI生成内容的商业化瓶颈,如变现困难等,将得到突破。

哪些公司是潜力股?

机会自然属于有准备的人。

比如,Image Video的核心团队就已经从谷歌出走创业。据VC爆料,首轮估值1亿美元。

dea7046f2a87768d1b472961b07f9141.png

而除了前文提到的已有革命性技术储备的科技巨头外,还有两类公司值得关注。

其一,是具备数据基础和应用场景的公司。

在这一方面,行业中的大公司普遍更具优势。比如国外的网飞、迪士尼。

以网飞为例,公开资料显示,在2012年时,网飞就已拥有数十亿条会员评价,每天能新增百万级别的视频播放信息,包括观众的观看时长、播放设备等等。

事实上,基于如此庞大的独家数据,网飞已经在产品中尝试用AIGC替代标准内容制作。比如影片的缩略图,就是网飞采用AI算法,从影片中抽取符合用户观影习惯和需求的画面生成的。

就在今年2月初,网飞还发布了一支AIGC动画短片《犬与少年》。其中动画场景的绘制工作,都是由AI完成的。

76773b64247377af76077ba8fd42ae5f.png

同样,国内短视频行业两大巨头抖音和快手的动向,也值得关注。

目前,字节跳动的视频编辑工具剪映,以及快手的云剪,都已上线图文成片、文字转视频的功能。用户只需输入几个关键词或一段文字,AI就能自动搜集素材剪辑出一段视频片段。

其二,就是在垂直细分赛道上具有技术储备的公司。

比如国内的智能视觉技术企业影谱科技,成立之初就是以人工智能视觉技术产业化为主要目标,早在2018年就发布了基于生成式AI技术的AGC智能影像生产引擎,这也是国内较早提出的生成式AI的技术框架。

影谱科技的AGC通过MCVS技术(Moviebook Motion Capture from Video System)对现有视频的关键帧进行抽取,理解、关联及预测等处理,将视频内容分割为像素及子像素维度的结构化数据,并自动完成标记,即形成了对视频中各种内容的自动化理解和标注。接下来,利用3D虚拟重建等计算机图像技术,通过视频内容自动化生产引擎MAPE(Moviebook Auto-Production Engine)生成全新的视频,该方案融合了人工智能多模态语义理解,并利用深度学习实现视频自动化加工以及视频的同步生成,创新了视频影像生产方式。

这使得AGC可在极短时间内生成一段个性化视频内容,亦可以对拍摄视频进行重构,如自动锚定关键帧,根据帧内容生成原图像中没有的、无违和感的内容,再智能化生成一段AI视觉内容。

据公开数据显示,影谱科技AI生成引擎生成一段60s视频的总成本与传统方式相比降低79.8%以上,而生产率最高可以提高百倍以上;检索一段60s视频内相似帧图像或特定图像,所需总成本与人工相比降低99.73%,而错误率降低10倍以上,目前主要应用于政府服务、企业、科教、泛娱乐、媒体、文旅等领域。

151d948dbdf42c8e0339297cd2b8be2e.gif

例如,在视频采集和生产阶段,可实现主体识别、跟随拍摄、画质修复、自动剪辑、视频自动生成等功能;在分发阶段实现智能审核、个性化推荐等;在用户体验方面,结合数字孪生技术综合使用,实现数字内容、数字空间、数字人的高效生产及可视化互动等功能。

目前AGC在诸多行业的应用已十分广泛,随着与行业的数字化融合不断加深,未来发挥的作用也将愈加明显。

p.s. 前文提到的网飞AIGC短片,还有小冰公司的参与。

ChatGPT之火,正在加速AIGC走向成熟

不得不说的是,尽管ChatGPT的火爆,让大模型时代的AIGC获得了空前关注,但AIGC产业,还只能说是一个“新生儿”。

根据Gartner发布的2022年新兴技术成熟度曲线,生成式AI目前还处于“技术萌芽期”,预计距离生产成熟期还有5-10年的时间。

3a4a1550bee40d1696fd9710f3cdb502.png

但随着大模型这样的技术底座作用愈发凸显,越来越得到重视,不可否认的是,这个新生儿成长态势正呈现出一种加速状态。

并且,经过文生图、ChatGPT的验证,AIGC在其他垂直领域中的可拓展空间已经可以预见。

量子位智库预测,2030年,AIGC市场规模有望超过万亿人民币。

e816f5e44120e81c288ab3b48cbe0002.png

在这个过程中,如何抢占先机,将成为中国产业界亟需关注的命题。

至少,像影谱这样的垂直赛道种子选手,就已经得到国资基金的重视:具备国家社保基金、中央企业、国有银行、地方国资等出资背景。并且D轮融资13.6亿人民币,创下人工智能视觉生产领域的中国最高融资纪录。

这一回,我们能否走在世界之先?

—  —

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8454.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Excel做方差分析-CDA训练营笔记

1.确定Excel-数据-数据分析 这个功能有无打开 没有的话文件-选项-加载项-转到-勾选分析工具库-确定 2.单因素方差分析 第一步,数据分析-单因素方差分析 第二步,设置输入输出区域,根据实际情况选择是否勾选标志位于第一行(即标题…

easyExcel不同版本按照模板导出

Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的…

ChatGPT 从入门到精通,联动Excel 的八种方法

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 近期 AI 工具大爆发, 一天之内,AI 绘图两大神器之一的 Midjourney 中文版可申请试用了,ChatG…

网赚小项目,聊天挣钱,打字聊天就能挣钱的方法

大家好,我是蝶衣王的小编 你是不是也想利用你的空余时间赚点零花钱,但是又找不到很好的方法,网上这些小兼职呢,又容易被割了韭菜,今天我就教你们一个比较靠谱的网赚小方法,只需一部手机聊聊天就可以赚取佣…

够快,首个“开源ChatGPT项目“来了!网友吐槽:这谁能跑

文|明敏 源|量子位 就说程序员的手速有多快吧,首个开源ChatGPT项目已经出现了! 基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥Phillip Wang复刻了…

3 个令人眼前一亮的 ChatGPT 项目,开源了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 前不久,红杉资本提出了一个概念,叫 Developer Tool 2.0,很多传统的开发者工具,都值得基于 AI Copilot 能力,重新构建一遍。 目前…

五年时间,Transformer宇宙发展成了这样,ChatGPT 只是其中之一

源 | 机器之心 大家好,这里是 NewBeeNLP。关于 Transformer ,这是一篇很好的学习指南,可以帮助你熟悉最流行的 Transformer 模型。 自 2017 年提出至今,Transformer 模型已经在自然语言处理、计算机视觉等其他领域展现了前所未有的…

GPT专业应用:英语作文修改与解释

正文共 868 字,阅读大约需要 3 分钟 英语学习者/老师必备技巧,您将在3分钟后获得以下超能力: 快速修改英语作文 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编辑者 | Linda …

最新SpringBoot 整合 ChatGPT API 项目实战!!!

体验到了ChatGPT的强大之后,那么我们会想,如果我们想基于ChatGPT开发一个自己的聊天机器人,这个能搞定吗? ChatGPT平台已经为技术提供了一个入口了,很简单的就是实现了。 一、准备工作 (1)已…

使用宝塔面板的Docker安装ChatGPT-pandora项目

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 本机以腾讯云 轻量云服务器为例。 首先在轻量云服务器后台的防火墙放行端口3002。 然后登陆宝塔,点击Docker&#xf…

SpringBoot 整合 ChatGPT API 项目实战,十分钟快速搞定!

往期热门文章: 1、10款低代码平台YYDS! 2、使用 Autowired 为什么会被 IDEA 警告,应该怎么修改最佳? 3、每天 100 万次登陆请求,8G 内存该如何设置 JVM 参数? 4、12种接口优化的通用方案,我又偷…

chatgpt赋能python:Python的调试方法:如何看每一步的执行情况

Python的调试方法:如何看每一步的执行情况 Python是一门强大的编程语言,它易于学习,同时也被广泛应用于各种领域。当你在编写Python代码时,难免会遇到一些错误和问题。本文将介绍一些方法来调试Python代码,以帮助您更…

如何辨别ChatGPT是不是真的

随着ChatGPT爆红,国内陆续出现了几个所谓的“ChatGPT 反向代理站点”,乍一试回答似乎还挺靠谱,但它们真的是ChatGPT吗?本文以其中一个站点为例,对其真伪进行辨别。 其实最多只需要问两个问题,基本上就可以…

Excel到PPT动嘴就能做!ChatGPT4接入Office全家桶

微软把AI神器GPT-4全面接入Office,这下ChatPPT、ChatWord、ChatExcel一家整整齐齐。 CEO纳德拉在发布会上直接放话:今天,进入人机交互的新时代,重新发明生产力。 新功能名叫Microsoft 365 Copilot(副驾驶)&…

QQ 接入GPT,让聊天更自然

目录 0、文末点击公众号联系 1、先看效果 1.1 私聊: 1.2 群聊 2、下载文件 3、获取Api Key 4、Windows 封装版 4.1、进入py 文件夹。 4.2、打开 QBot 文件夹 5、代码版 5.1 进入 py 文件夹 5.1.1 安装依赖 5.1.2 启动 4.2、打开 QBot 文件夹 6、到此就…

我把ai聊天和绘画接入到了微信群

经过两天的努力,总算通过这种形式把ai聊天机器人接入到群聊中。挺有趣的,有没有测试下效果的。还可以画画哦。

在飞书上轻松集成ChatGPT,3步搞定!

在飞书上使用 ChatGPT,3步搞定 为了让用户更便捷地使用 ChatGPT,我们将 ChatGPT 集成到飞书,设置只需要几分钟。 步骤一:获取飞书 Webhook URL 在应用商店或点击飞书官网下载飞书。下载安装后进入飞书界面,点击上方➕…

ChatGPT 和知识策略,构建低成本的认知助手

ChatGPT 风靡全球!它无处不在。我的朋友不断向我发送 ChatGPT 所做的奇妙和意想不到的事情的例子。ChatGPT 在短短五天内就吸引了超过 100 万用户。 我对 ChatGPT 变得如此出色并不感到惊讶。但令我惊讶的是,在过去两个月中,人们对这些工具的认识有了惊人的增长。这鼓励我帮…

LangChain 基于 ChatGPT 构建本地知识库问答应用

一、使用本地知识库构建问答应用 上篇文章基于 LangChain 的Prompts 提示管理构建特定领域模型,如果看过应该可以感觉出来 ChatGPT 还是非常强大的,但是对于一些特有领域的内容让 GPT 回答的话还是有些吃力的,比如让 ChatGPT 介绍下什么是 L…

你想知道ChatGPT针对JAVA技术趋势等问题的答案不?

今天终于试了一下最近非常火的ChatGPT,针对JAVA技术趋势等问题与ChatGPT进行了沟通,感觉还挺好玩的,如同和一个人正常交流一样,问题的答案虽然不是很精准,但还算是正确的。 让人吃惊的是:ChatGPT 竟然都知道@EnumValue怎么使用 使用界面 问题及回复 问题: JAVA技术趋势…