今年以来,AIGC迅速崛起。
所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。
在这一技术赛道,不仅有诸多老牌巨头持续布局,甚至已经跑出了几家估值逾十亿美元的独角兽。
10月18日,Stability AI宣布获得1.01亿美元的融资。它正是开源界“当红炸子鸡”文本到图像生成器Stable Diffusion的背后公司。
10月19日,主打文字生成的AI初创公司Jasper宣布完成1.25亿美元的A轮融资,估值达到15亿美元。
此外,据统计,8成AIGC概念股前三季度实现盈利。创投圈无疑对其青睐有加,可以说一时风头无两。
这个不算新的概念为什么突然就火了?
从表面来看,一切似乎肇始于在今年8月于美国科罗拉多州举办的数字艺术家竞赛。一幅名为《太空歌剧院》的绘画作品获得了数字艺术类别冠军。消息一经公布就引发了诸多争议。
Théâtre D'opéra Spatial(太空歌剧院)@百度百科
争议焦点就在于,这幅作品是游戏设计师杰森·艾伦(Jason Allen)利用AI绘图工具Midjourney生成。虽然艾伦对其又进行了润色,但这一点显然不足以平复争议。
关于“AI绘画是否会取代画师”、“AI是否会导致艺术之死”的讨论迅速升温,事件发酵后,更多人则陡然发觉:原来AI绘画的发展水平已经到了十分惊人的地步。
其实早在去年年初,OpneAI推出的图像识别系统CLIP和语言模型DALL·E就是一个非常重要的信号。之后,AIGC领域就开始遍地开花,除了AI绘画之外,AI写作、AI编程工具也相继涌现。
今年以来,Disco Diffusion、Midjourney、Stable Diffusion等AI辅助工具陆续走红,更不用说国内外大厂在这一领域的不断深耕:
AIGC的爆火看似突然,实则也经历了较长的蛰伏期,而《太空歌剧院》碰巧成为了那根让其“一朝成名天下知”的引线。归根结底,多重因素的加持才让AIGC在今年名声大噪。
首先,技术层面达到了一定水平,尤其是生成扩散模型和多模态预训练模型等技术的发展进步显著,让AI可以迅速生成不同模态的数据内容,能广泛用于内容生成、编辑和辅助创作。
然后,市场需求驱动着内容生产方式的演进。人们对内容的需求快速增长,内容产业也需要相应升级。PGC制作门槛较高、质量有保证,但生产周期较长,UGC降低了生产成本与中心化程度,但质量往往参差不齐,而AIGC在某种程度上兼顾了产能和质量,可以被视作是内容生态在发展过程中的新一轮范式转移。
再者,经济下行的大环境让技术更趋向于务实的应用。后疫情时代,降本增效成为诸多企业努力的方向。生成式人工智能恰恰可以满足个人和团队在创意辅助上的提效需求。
最后,不得不提的是,Stable Diffusion的开源所产生的的破圈式效应。作为一款文本到图像生成器,Stable Diffusion不仅开放了程序,还有其已经训练好的模型,这意味着其允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态,这为更广泛的C端用户的链接提供了可能。
尽管AIGC在设计、绘画、写作、编程等领域均有了一展身手的空间,但关于其本身的质疑却从未中断。“AI绘画”相关话题甚至一度登上众多平台的热搜榜单,成为名副其实的流量密码。
在画师圈呈现出了两极分化的巨大差异。有人抱着抵触或警惕态度,也有人坦然接受甚至愿意主动接触。
反对者们认为,不知疲倦的AI“10秒可以出一幅画,而我却需要几天”。从短期来看,它的出现会挤占一大批中低层画师的职业空间。长期来看,会导致绘画圈的严重断层,到最后存活的只有“大佬”。
更有甚者,提出了这样一个观点——“绘画”已经是行业中比较具有不可替代属性的职业技能了,如果画师能被取代,其他职业还会远吗?
就像某位网友的评论:“不知未来路在哪里,我相信AI绘画无法完全代替人类,但是可以替代我。”这种危机感引发了不少人的共鸣。
而支持者则认为,技术发展势不可挡,AI绘画可以更高效地帮助画师制作内容,有时甚至可以提供灵感。优胜劣汰是发展的必然,不会以人的情感为转移。
当然,也有对此持无谓态度,主张它山之石可以攻玉的。比如CG画师乌合麒麟就表示:“画画这玩意不一直是谁画的好就学谁么?ai画的好把他好的部分学过来不就完事了。”
图源:CG画师乌合麒麟评论@微博
自人工智能诞生之日起,不可回避的一点就是:需要直面关于“AI取代人”的担忧。而AIGC的发展似乎又加剧了这一“饭碗”之争,但如果在众声喧哗中回归到AIGC本身,就会发现AIGC存在的意义更多是将生产者从枯燥的生产工作中释放,或者帮助生产者突破生产瓶颈,而非取代从业者。正如AI绘画工具Midjourney的创始人David Holz曾经提到的:
“我认为艺术家不仅仅是关于图像的产生者,艺术往往是关于故事和情感的,而AI没有故事和情感,AI创作的影像的叙事来源于使用它的人。贝壳皆来自大海,但海洋非造物者。美石皆来自川河,但河流非孕育者。这套系统并无创造的能力,但美可以来自其中。”
人工智能在创造性活动中的作用只是一种工具,一个载体,而不是创造者本身。Holz将人工智能比作水,“水是危险的,但你也可以在里面游泳、制造船只、用水坝发电”,关键是要学会如何利用它以及与之共处,“它没有意志,没有恶意,是的,你可能淹死在里面,但这并不意味着我们应该禁止水。当你发现一个新的水源时,这真的是一件好事”。
尽管很多人对AIGC的价值依旧存疑,甚至有些人批评其一直游走在道德和法律的边缘。但某种程度上,黑红也是红,AIGC已经进入了大众视野,并在逐步重塑众多行业场景,在认知和关注度上打下了基本盘。市场也普遍看好这一赛道的发展潜力。
据量子位AIGC图谱显示,现在AIGC主要用在文字、图像、视频、音频、游戏以及虚拟人上,里面涉及的初创企业大多集中在A到B轮,包括DeepMusic、倒映有声、聆心智能、彩云小梦、rct.ai、影谱科技、超参数等。
而国内大厂百度、腾讯、阿里巴巴、字节跳动、网易等也都在AIGC领域有所投入。
不过,尽管前景被多数人看好,但目前AIGC领域还存在着不少问题。
第一,关键核心技术仍然有待提升。围绕AI绘画、AI写作的批评中,很多人直指其生成的内容堆砌且质量层次不齐,有时甚至会产生类似“缝合怪”一般的滑稽感。不久前哈佛大学的一项研究表明,DALL-E 2对于文本提示内的关系根本不理解,只是把文本中的几个实体粘合在一起,图像正确率仅有22%。
第二,需求的差异化提升了开发门槛。以AI写作为例,AIGC能做到根据关键词自动生成文本,甚至达到一定的流畅度,但是不同场景对写作需求不同。比如,说明书和广告文案在措辞上就有天壤之别,新闻评论和小说也是风格迥异。需求不同,训练数据自然不同,这无疑提高了AIGC产品开发的成本和时间。
第三,大规模商业化落地依旧挑战重重。由于当前的人工智能还处在传统的弱人工智能阶段,必须高度依赖人类对实际问题的建模,但这种方式存在着相当的不稳定性,加之硬件设施的性能限制,导致生成结果不理想,以及用户缺乏付费意愿,这让AIGC距离大规模商业化落地还需时日。
此前,曾经拥有50万月活用户的AI编程工具Kite在坚持8年后宣布了失败,令人扼腕。其创始人Adam Smith将失败归因于“算法不够好”和“用户不买账”。“最大的问题是最先进的模型不理解代码的结构,例如非本地上下文。”其次,他们花了很长时间才发现,“个人开发者不会购买工具,只有他们的经理可能这样做。但仅仅使开发人员在编写代码时速度提高18%——这也不足以打动他们。”
第四,AI作品的版权之争未有定论。如今很多AIGC工具免费进行开放使用,但仍有很多使用者担心其版权的合法性。由于整个行业目前还处于探索阶段,各个国家的政策也不同,不同公司在面对相关问题时处理方法也千差万别,因此,全世界还都处在蒙昧和混沌期。
版权之争的核心问题主要集中在两个方面:一是你能获得AI模型所创造的东西的版权吗?二是你可以使用受版权保护的数据来训练AI模型吗?
不久前GitHub Copilot引发的官司就是一个典型案例。在这项集体诉讼中,广大程序员们指控OpenAI涉嫌违反开源许可,OpenAI和微软使用他们贡献的代码训练专有AI工具GitHub Copilot。不少业界人士认为,这起案件的进展和结果可能会为整个生成式人工智能领域的版权归属问题开创先例。
曾几何时,人们对AI在创造性活动,尤其是艺术方面的落地并不抱有幻想。因为AI永远只能依靠模仿而习得技能,而创作无疑是人的独有禀赋。但AIGC的出现似乎打破了人类的这点自傲,故而又出现了“艺术已死”的论调。但正如相机的出现并没有让绘画走上末路,AIGC的发展同样如是。
尽管在发展之路上还要面临核心技术不成熟、短期内难以实现大规模商用、相关法律法规不健全及技术伦理的挑战,但这基本上是技术发展路径上的普遍问题,碰撞不可避免,磨合尚需时日。不能否定的是,AI技术的发展确实会提升人类生产力。在争议不断的前路上,我们需要的可能只是一点耐心和一点信心。
所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。
在这一技术赛道,不仅有诸多老牌巨头持续布局,甚至已经跑出了几家估值逾十亿美元的独角兽。
10月18日,Stability AI宣布获得1.01亿美元的融资。它正是开源界“当红炸子鸡”文本到图像生成器Stable Diffusion的背后公司。
10月19日,主打文字生成的AI初创公司Jasper宣布完成1.25亿美元的A轮融资,估值达到15亿美元。
此外,据统计,8成AIGC概念股前三季度实现盈利。创投圈无疑对其青睐有加,可以说一时风头无两。
这个不算新的概念为什么突然就火了?
为什么一夜爆火
从表面来看,一切似乎肇始于在今年8月于美国科罗拉多州举办的数字艺术家竞赛。一幅名为《太空歌剧院》的绘画作品获得了数字艺术类别冠军。消息一经公布就引发了诸多争议。
Théâtre D'opéra Spatial(太空歌剧院)@百度百科
争议焦点就在于,这幅作品是游戏设计师杰森·艾伦(Jason Allen)利用AI绘图工具Midjourney生成。虽然艾伦对其又进行了润色,但这一点显然不足以平复争议。
关于“AI绘画是否会取代画师”、“AI是否会导致艺术之死”的讨论迅速升温,事件发酵后,更多人则陡然发觉:原来AI绘画的发展水平已经到了十分惊人的地步。
其实早在去年年初,OpneAI推出的图像识别系统CLIP和语言模型DALL·E就是一个非常重要的信号。之后,AIGC领域就开始遍地开花,除了AI绘画之外,AI写作、AI编程工具也相继涌现。
今年以来,Disco Diffusion、Midjourney、Stable Diffusion等AI辅助工具陆续走红,更不用说国内外大厂在这一领域的不断深耕:
- 谷歌Brain接连推出了AI绘画工具“Imagen”和“Parti”;
- 微软亚洲研究院发表了无限视觉生成模型 NUWA-Infinity;
- Github 的AI编程神器Copilot可以根据海量的开源代码生成子模块供开发者使用;
- OpenAI正式开放了DALL-E 2的程序接口;……
AIGC的爆火看似突然,实则也经历了较长的蛰伏期,而《太空歌剧院》碰巧成为了那根让其“一朝成名天下知”的引线。归根结底,多重因素的加持才让AIGC在今年名声大噪。
首先,技术层面达到了一定水平,尤其是生成扩散模型和多模态预训练模型等技术的发展进步显著,让AI可以迅速生成不同模态的数据内容,能广泛用于内容生成、编辑和辅助创作。
然后,市场需求驱动着内容生产方式的演进。人们对内容的需求快速增长,内容产业也需要相应升级。PGC制作门槛较高、质量有保证,但生产周期较长,UGC降低了生产成本与中心化程度,但质量往往参差不齐,而AIGC在某种程度上兼顾了产能和质量,可以被视作是内容生态在发展过程中的新一轮范式转移。
再者,经济下行的大环境让技术更趋向于务实的应用。后疫情时代,降本增效成为诸多企业努力的方向。生成式人工智能恰恰可以满足个人和团队在创意辅助上的提效需求。
最后,不得不提的是,Stable Diffusion的开源所产生的的破圈式效应。作为一款文本到图像生成器,Stable Diffusion不仅开放了程序,还有其已经训练好的模型,这意味着其允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态,这为更广泛的C端用户的链接提供了可能。
引爆画师圈的“抢饭碗”之忧
尽管AIGC在设计、绘画、写作、编程等领域均有了一展身手的空间,但关于其本身的质疑却从未中断。“AI绘画”相关话题甚至一度登上众多平台的热搜榜单,成为名副其实的流量密码。
在画师圈呈现出了两极分化的巨大差异。有人抱着抵触或警惕态度,也有人坦然接受甚至愿意主动接触。
反对者们认为,不知疲倦的AI“10秒可以出一幅画,而我却需要几天”。从短期来看,它的出现会挤占一大批中低层画师的职业空间。长期来看,会导致绘画圈的严重断层,到最后存活的只有“大佬”。
更有甚者,提出了这样一个观点——“绘画”已经是行业中比较具有不可替代属性的职业技能了,如果画师能被取代,其他职业还会远吗?
就像某位网友的评论:“不知未来路在哪里,我相信AI绘画无法完全代替人类,但是可以替代我。”这种危机感引发了不少人的共鸣。
而支持者则认为,技术发展势不可挡,AI绘画可以更高效地帮助画师制作内容,有时甚至可以提供灵感。优胜劣汰是发展的必然,不会以人的情感为转移。
当然,也有对此持无谓态度,主张它山之石可以攻玉的。比如CG画师乌合麒麟就表示:“画画这玩意不一直是谁画的好就学谁么?ai画的好把他好的部分学过来不就完事了。”
图源:CG画师乌合麒麟评论@微博
自人工智能诞生之日起,不可回避的一点就是:需要直面关于“AI取代人”的担忧。而AIGC的发展似乎又加剧了这一“饭碗”之争,但如果在众声喧哗中回归到AIGC本身,就会发现AIGC存在的意义更多是将生产者从枯燥的生产工作中释放,或者帮助生产者突破生产瓶颈,而非取代从业者。正如AI绘画工具Midjourney的创始人David Holz曾经提到的:
“我认为艺术家不仅仅是关于图像的产生者,艺术往往是关于故事和情感的,而AI没有故事和情感,AI创作的影像的叙事来源于使用它的人。贝壳皆来自大海,但海洋非造物者。美石皆来自川河,但河流非孕育者。这套系统并无创造的能力,但美可以来自其中。”
人工智能在创造性活动中的作用只是一种工具,一个载体,而不是创造者本身。Holz将人工智能比作水,“水是危险的,但你也可以在里面游泳、制造船只、用水坝发电”,关键是要学会如何利用它以及与之共处,“它没有意志,没有恶意,是的,你可能淹死在里面,但这并不意味着我们应该禁止水。当你发现一个新的水源时,这真的是一件好事”。
风光背后的阴翳
尽管很多人对AIGC的价值依旧存疑,甚至有些人批评其一直游走在道德和法律的边缘。但某种程度上,黑红也是红,AIGC已经进入了大众视野,并在逐步重塑众多行业场景,在认知和关注度上打下了基本盘。市场也普遍看好这一赛道的发展潜力。
据量子位AIGC图谱显示,现在AIGC主要用在文字、图像、视频、音频、游戏以及虚拟人上,里面涉及的初创企业大多集中在A到B轮,包括DeepMusic、倒映有声、聆心智能、彩云小梦、rct.ai、影谱科技、超参数等。
我国现有AIGC产业链划分
@《AIGC/AI生成内容产业展望报告》而国内大厂百度、腾讯、阿里巴巴、字节跳动、网易等也都在AIGC领域有所投入。
- 百度推出了AI作画平台“文心一格”;
- 腾讯研发的写稿机器人Dreamwriter可以在规定的22种场景中写作;
- 阿里巴巴旗下的AI在线设计平台Lubanner可以帮助营销人员生产Banner;
- 字节跳动旗下的剪映以及快手云剪都能提供AI生成视频;
- 网易推出了AI编曲系统“网易天音”;……
不过,尽管前景被多数人看好,但目前AIGC领域还存在着不少问题。
第一,关键核心技术仍然有待提升。围绕AI绘画、AI写作的批评中,很多人直指其生成的内容堆砌且质量层次不齐,有时甚至会产生类似“缝合怪”一般的滑稽感。不久前哈佛大学的一项研究表明,DALL-E 2对于文本提示内的关系根本不理解,只是把文本中的几个实体粘合在一起,图像正确率仅有22%。
第二,需求的差异化提升了开发门槛。以AI写作为例,AIGC能做到根据关键词自动生成文本,甚至达到一定的流畅度,但是不同场景对写作需求不同。比如,说明书和广告文案在措辞上就有天壤之别,新闻评论和小说也是风格迥异。需求不同,训练数据自然不同,这无疑提高了AIGC产品开发的成本和时间。
第三,大规模商业化落地依旧挑战重重。由于当前的人工智能还处在传统的弱人工智能阶段,必须高度依赖人类对实际问题的建模,但这种方式存在着相当的不稳定性,加之硬件设施的性能限制,导致生成结果不理想,以及用户缺乏付费意愿,这让AIGC距离大规模商业化落地还需时日。
此前,曾经拥有50万月活用户的AI编程工具Kite在坚持8年后宣布了失败,令人扼腕。其创始人Adam Smith将失败归因于“算法不够好”和“用户不买账”。“最大的问题是最先进的模型不理解代码的结构,例如非本地上下文。”其次,他们花了很长时间才发现,“个人开发者不会购买工具,只有他们的经理可能这样做。但仅仅使开发人员在编写代码时速度提高18%——这也不足以打动他们。”
第四,AI作品的版权之争未有定论。如今很多AIGC工具免费进行开放使用,但仍有很多使用者担心其版权的合法性。由于整个行业目前还处于探索阶段,各个国家的政策也不同,不同公司在面对相关问题时处理方法也千差万别,因此,全世界还都处在蒙昧和混沌期。
版权之争的核心问题主要集中在两个方面:一是你能获得AI模型所创造的东西的版权吗?二是你可以使用受版权保护的数据来训练AI模型吗?
不久前GitHub Copilot引发的官司就是一个典型案例。在这项集体诉讼中,广大程序员们指控OpenAI涉嫌违反开源许可,OpenAI和微软使用他们贡献的代码训练专有AI工具GitHub Copilot。不少业界人士认为,这起案件的进展和结果可能会为整个生成式人工智能领域的版权归属问题开创先例。
争议不断的前路
曾几何时,人们对AI在创造性活动,尤其是艺术方面的落地并不抱有幻想。因为AI永远只能依靠模仿而习得技能,而创作无疑是人的独有禀赋。但AIGC的出现似乎打破了人类的这点自傲,故而又出现了“艺术已死”的论调。但正如相机的出现并没有让绘画走上末路,AIGC的发展同样如是。
尽管在发展之路上还要面临核心技术不成熟、短期内难以实现大规模商用、相关法律法规不健全及技术伦理的挑战,但这基本上是技术发展路径上的普遍问题,碰撞不可避免,磨合尚需时日。不能否定的是,AI技术的发展确实会提升人类生产力。在争议不断的前路上,我们需要的可能只是一点耐心和一点信心。