视点 发自 凹非寺
量子位 | 公众号 QbitAI
过去三个月,AIGC和其背后的大模型浪潮席卷中文互联网,所有人都能享受到人工智能技术升级带来的便利。
在公司层面,拥有大模型技术和资源的头部企业获得了最多的关注,而大模型应用层的创业公司虽活跃,但存在感却并不高。
甚至随着ChatGPT相关功能插件的释放,没有直接参与大模型竞争的应用层企业都有可能被类似于OpenAI的企业的一个插件所“覆灭”。
毫无疑问,通用人工智能的发展还会持续影响应用层企业的生存空间。
那么,作为应用层的创业公司将如何在这种压力下,寻找到属于自己的创新空间、打造独特的业务模式呢?他们的创业价值又将如何得到社会和市场的认可?
围绕应用层创业公司如何通过链接大模型与客户发挥价值,一览科技联合创始人兼CTO陈锡言在「量子位·视点」直播中分享了他的从业经验和观点。
以下根据分享内容进行整理:
大模型的出现拉齐了很多公司的AI水平,革了很多AI服务商的命,同时它又以极快的速度普及,可以称为史上增长最快的月活破亿的应用,颠覆了很多技术、业务和服务。
ChatGPT开始免费之后,基于OpenAI生态的一些创业公司其实都是一脸懵。虽然OpenAI的CEO表示说“不会和客户产生竞争”, Jesper CEO也说“更多大模型的出现,让公司已经摆脱了对OpenAI的单一依赖。”但这些解释的逻辑其实很无力。
ChatGPT的出众之处,在于除了大模型本身以外,还有自然语言的交互模式,这是自命令行、图像化UI之后的最先进人机交互模式。GPT4提供了通用人工智能的可能性,对话的人机交互形式配上AGI之后似乎变得无所不能。文心一言、通义千问等国产大模型也都是如此。
这半年来,团队经常会讨论到一个问题,大家都用大模型了,我们的价值究竟是什么?
大模型阴影下,创业公司有什么机会?
在文心一言发布会上,李彦宏曾提出了一个四层模型:芯片、框架、模型、应用。但是他只说了这四层模型,但是没有说这四层模型的关系究竟是金字塔形的,还是倒金字塔形、橄榄形、菱形或别的结构。
芯片,肯定是卡脖子的核心竞争力。框架,是大公司的游戏。模型的话,现在看起来10亿起步,而百度还说文心同时做了10个行业大模型。
应用层,现在看起来ChatGPT、文心一言以及其他大模型的这种交互类应用都是ToC的,而且免费。大家都说要做AI大基座,要形成自己的应用生态。
如果AI大基座在模型关系里是底层(在地上),那么它对于应用层的创业者来说是一个平台。但如果AI大基座是顶部(在天上),留给应用层创业者的就会是阴影。
目前看起来,现在做大模型的AI大基座们都表现出了一个“我全要”的状态:说是大基座,实际上包含了全部的四层模型。
小孩子才做选择,做大模型花了那么多钱,当然是全都要。
阴影1:通用人工智能让很多SaaS一夜之间失去壁垒
通用人工智能好像什么都可以做,让很多SaaS软件很懵,多年的积累在大模型面前可能变得一文不值。所有软件公司都面临一种情况:被迫拥抱AI。
当“所有应用都值得用AI重做一遍”被提出来之后,大模型先把自己母公司各系产品都加上Copilot,比如浏览器、搜索引擎、即时通讯、办公软件等等。这真的让人很怀疑,我们还做其他软件的价值究竟是什么。
阴影2:不仅取缔机器和软件,还会更快取缔人类的工作
我认为能够被简单且精准描述input、process和output的工作更容易被取缔。
例如把图像中所有蓝色改成红色、仅仅做排版的文字编辑、按标准文档回复的客服服务,甚至说当制作一杯咖啡,加多少豆、怎么研磨、加多少水多少奶都非常标准的情况下,口感与手工咖啡的可能差别并不大。
阴影3:风头全是大模型公司的,没钱根本上不了船
现在几乎所有的风头热度都在制作大模型的这些公司,包括创业明星系的、BAT系的、名校系的。有一件事情可以肯定,创业公司根本就参与不了大模型的开发工作。
A100虽然不好买,但其实购买方法也很多,京东上就有——只不过上次查的时候是10万元一张,今天已经变成了119,999元。买不买得到并不是问题,买不买得起才是问题。
即使创业公司有5,000万,买完500张后连网线都买不起,电费也只能用花呗。所以创业公司入局大模型如果没有10个亿,根本上不了牌桌。
AIGC并没有创造新的需求。我要一幅AIGC的画,可能等于我要一幅更便宜的画,这是供需市场决定的。AIGC只是一个工具,而需求侧永远想要更便宜的产品。
AIGC重复了很多业务流程以及供求关系,几乎所有的企业其实都希望AIGC来提升生产力,但实际上其实困难重重。
AIGC对生产力提升中的真正困难
一、工作流程固化很难改变。
AIGC工具强调个体,个体是打工人,打工人卖的是时间,凑够时间可能就拿到工资了。而AI工具作为新事物,还有很多的不确定性,很难说服打工人为了一个不确定的工具去增加学习成本。
二、商务比系统更重要得多。
很多ToB业务一旦成熟之后,商务关系往往比业务本身更重要。系统被弱化了,甚至有些老板对技术部的要求就是,只要不宕机,做成什么样都不影响公司赚钱。我听到最无力反驳的一句话,客户的工作方式不变,自己公司单独变化有什么用。
三、很多打工人更愿意偷偷的使用。
我们不得不承认,很多场景尤其是创意类工作场景,使用AI并不是一个很体面的事情。如果借助AI制作了东西,或是使用AIGC节省出了更多时间来休息摸鱼,打工人自然不想承认,也永远不能承认。
四、担心信息泄露。
安全的确是一个问题,但更多时候可能是一个借口,没有前面三点重要。
AIGC工具现在更多的是个体的赋能,而不是对企业的赋能。希望大家记住这句话,这是我们创业的一个机会。
什么样的岗位不容易被AI取缔?
一、要求结果稳定精准
GPT4到底会不会解数学题是一个很有争议的问题。
比如:一个计算机只能执行「+1」和「X2」两个运算,如果输入「1」,问最少几个步骤可以得到63。GPT4肯定是倒推法,方法是正确的,但每次都会算错,比较好笑的是它知道算错了,还能拼命扯回来。比如在某一步骤中「X2」,然后得到70,突然发现超了,这时他告诉你最后再减7,也能得到63。
我不觉得稳定和精准是一个大模型应该有的必要属性,我也不相信语言模型能解决数学问题。这是我的一个比较偏执的世界观,有可能是错的。
二、强IP属性业务
大家有没有注意到,书法作为我们国家很重要的一种艺术形式,到现在为止却没有一个书法的AI模型出现。这可能是价值问题导致的,书法AI模型它可能就没有价值。
比如说这个字是启功写的,这字是苏轼写的,如果第三种字是AIGC写的,很有可能会被扔掉。因为书法很强调个人风格、审美和个人IP。
三、对安全要求很高
想象一个职业,AI理发师。
理发师这样的职业是需要极其信任和安全的,如果一个黑化的理发师拿着刀在我面前,我可以说大哥别伤害我,打感情牌可能还有一线生机。但如果对面是一个机器人,它仅仅是一个杀戮机器,我毫无办法。
另外理发师这个行业也具有强IP属性,任何一个理发师在社区都是强IP。
四、数据集缺少或者不容易被标注
大模型本身的泛化能力仍然受限于数据集。如果说某个行业会被取缔的话,那最简单的一个判定标准就是该行业能否组织足够多、足够好的标注数据;如果数据质量非常多非常好,大概率机器会代替人完成。
但如果是那种不容易被标注的,比如说一个艺术作品,它不仅包含了创作者的情绪和感情,还包含了观看者当下的情绪,大概率不会被替代。就像我们常说的“1000个人心中有1000个哈姆雷特”,这个复杂度很难得到有效标注,标注的意义也不大。
五、需要动手实验的
有一个很经典的问题:如果ChatGPT早发明500年,人类还会不会知道地球是圆的?
我认为在科学面前,AIGC和圣经是一样的,不是因为他们权威,而是因为在科学面前,他们都需要被摒弃。
AI虽然可以处理和模拟一些既定的任务,但它们缺乏人类的直觉、情感以及对抽象概念的理解,这是无法模拟的。
大模型背景下的技术创业机会
一、懂业务懂技术:链接大模型与用户
我们有个客户是影视行业的上市公司,老板最开始要求全公司都要用AI,100多号人响应号召使用一堆五花八门的工具,后来缩减到只剩ChatGPT和Midjourney,到最后就什么都不用了。直到后来找到我们来提供企业级的AI工具,和现有的工作流做无缝打通。
所以其实企业永远需要信息系统,如果又懂业务又懂技术的话,做大模型和企业之间的链接者是一个不错的选择。
二、有钱有能力:加入大模型创业
这里面还是有很多值得做的事情,比如多模态、潜信息、脑机交互等等,但需要有钱有能力。
三、有趣的灵魂:利用AI制作有趣的内容
AIGC对于内容创作者,其实是一个特别好的时代。以前很庞大的创作组织,现在可能只需要几个人。
另外,ChatGPT一本正经的胡说八道,或是天马行空的奇思妙想,这种能力特别适合做内容创作。
四、直男程序员:微调/定制模型
有一种纯技术方向:为企业提供微调大模型,或者提供行业定制模型。
当我第一次看到 MaaS,也就是Model as a Service的时候,我是绝望的,要被大公司逼近绝路的感觉。但是最近我又看到一个词Fine Tuning as a Service,我觉得特别有趣,一看就是程序员想到的。这个词让我感受到了程序员乐观、积极向上的情绪。
AIGC大背景下有哪些岗位会炙手可热?
其实淘金热中最赚钱的是卖牛仔裤的。在整个AIGC大背景下,除了刚才那些直接创业的机会,我认为还会有一些炙手可热的工作岗位或是可以形成服务的。
一、AI对齐工程师
随着AI工具的不断发展, AI如何与人类的价值观保持一致,以及AI系统如何保证自己的可解释性等等将会成为重点。AI对齐工程师,是要保证AI系统在任何时候都能和人类的价值观保持一致,保证人类的利益,以及保证人类对AI的控制权,甚至必要的时候拔网线、断电等等。
二、模型训练工程师
刚才说到每个企业都值得拥有自己的模型,那么在大模型基础上,通过微调或者蒸馏等方式,得到一个企业专有的模型,也是一个很重要的事情。
三、数据治理工程师
虽然企业都值得拥有属于自己的模型,但是模型依赖数据。
数据治理指的是在一个组织内部对数据质量、数据整合、数据隐私、业务流程等做合理的管理体,保证数据的准确性、一致性以及可用性。首先要数据可用,才有机会训练模型。
大多数企业的数据化程度是不足的。其实越是在线化业务的公司,或者做数据服务的公司,数据化程度越偏低,很多互联网企业的数据化程度甚至远不如一些工厂。
四、数据标注师
高质量的标注数据会成为AI系统的核心竞争力。前几天我看新闻,北京还提出了一个概念,要做统一的数据标注服务,大家也都看到了数据标注是一个非常重要的业务。
babyAGI和autoGPT有哪些启示?
前段时间babyAGI和autoGPT比较火,火得快,凉的也快,但是留下了几个词很有价值,比如「思维链」和「任务队列」,有的地方解释成「工作流」。
左图是babyAGI第二版的工作流程图,核心就是把第一个问题形成一个问题列表,然后放到队列里面,对每一个问题做相应地执行,然后通过ChatGPT解读相应的答案,再对答案生成若干个问题,类似于金字塔的结构,通过逻辑树的方式逐渐地去找解决方案的本质。
右图指的是autoGPT第一版里面最重要的几步,也是把一个问题拆解成多步,然后列出相应的计划,但是它比 babyAGI多了一步,就是检查这个东西对不对的概念,然后批评、反省。这个步骤对一个智能型的AI系统而言,是非常重要的。
从这两个开源项目里面,我们能学到很多做大模型还没有触及到的,或是比较有特色的AI系统的地方。我的想法是对它们做改进之后,使用专家系统来设置自己的业务工作流,提前录入到系统里面。
做应用层 AI产品的底气和优势
一览科技凭什么在应用层做AI视频工具,或者说在应用层AI这个产品上,我们具有什么样的优势?
第一个优势,数据积累。一览已经做了很多年的商用视频,服务了数千家企业用户,全球范围签约了数十万的视频创作者,积累了很多的商业视频数据,这些数据是独有的,且在创作以及视频交易的过程中,还会不断产生新的数据,具有成长性。
第二个优势,场景明确。我们一直垂直于视频的创作。
第三个优势,业务相对成熟,成立五年,我们已经积累了海量创作者和内容消费者。
第四个优势,创作的安全性。通用人工智能AGI有很多的风险及不确定性,但在内容创作上的包容度以及AI对齐和内容安全措施已经相对完善,涉政、涉恐、涉黄、涉暴的预警措施相对完善。
我们选择了一个适合自己的垂直的领域,并且在这个领域上具有一定的优势,这是一览AI视频工具在应用层的特色。
说了这么多,实际介绍下一览AIGC工作流中「AI编剧」这个产品。
我们提前把工作流注入到AI系统里,然后由AI一步步执行。在我看来,“Step by Step”这个过程并不应该由通用人工智能来执行,应该由人类专家来输入。
第一步,通过一句话生成若干个创意。生成创意的过程,等于头脑风暴,这特别适合AIGC。我们可以输入几个关键词,比如宫廷、狗血、爱情、伦理、逆袭、反转,它就能够瞬间输出很多个创意。
第二步,在工作流程之中开始角色设计。角色设计需要哪些东西,比如人物的性格特征,行为习惯,体貌特征,对话风格,包括性别、年龄等。
现在有了角色和创意,把这些内容输入给AI来生成剧情,剧情里面一定要有冲突和反转,这也是我们要提前录入进去的设置,然后就可以快速生成若干个剧情,同时批量生成几百字甚至几千字的脚本。我们可以选择1个最有挑战的剧情,接下来根据剧情,我们还可以生成一系列概念图。
另外,大家也知道Token的限制,其实对于剧情,我们也可以把一个剧情分解成若干个段落,每个段落再进行扩展,这也是一个能让剧本逐渐丰满的过程。
一览「AI编剧」工作流的四个核心:上下文存储、海量的创意,视觉化创作、评估反馈。
评估反馈,大家可以理解为剧本评分,相当于autoGPT里面的批评环节。这个过程中,我们可以产生更多的信息、更多的数据。
经过剧本评估之后,这些情节段落进行不停的调整和优化,然后进入下一步,再次生成视觉化的创作,不断打磨作品质量。
AIGC 加速了平庸时代的到来
AIGC可以提高所有生产工作或者创作的平均水平,但是它只能让未来比过去更好。但如果以前都变得一样好时,原来的更好就变成了现在的平庸。当AI工具全面普及,平庸的创作会无比廉价,人类的未来属于真正的工匠。
毋庸置疑,AI工具普及和 AIGC内容爆炸都是历史浪潮的一部分,不可倒退,无法避免。从媒体到时尚到建筑,再到其他一切,都会充满了不可避免的、普遍的平庸。但乐观的人总能找到自己的方式翻出不一样的浪花。最后用马斯克最近发的一个推特献给大家。
坚守自己的工匠精神,哪怕是不得不孤身前行。
Stay on the right path,even if you have to walk alone.
关于「量子位·视点」
量子位发起的CEO/CTO系列分享活动,不定期邀请前沿科技领域创业公司CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~
需要观看直播回放的小伙伴,请戳“阅读原文”吧~