如今打开互联网一看,会看到铺天盖地的“GPT-4好厉害”“太牛了”“科技革命到来了”“人类都要失业了”……
但这么伟大的变革到底是怎么到来呢?答案好像比较含糊。只有ChatGPT基础的问答、代写能力,以及微软已经开始做的搜索、办公是目前比较清楚的大语言模型落地方案。如果仅仅有这些东西,似乎也还达不到科技革命的效果。
为什么会这样?
答案在于,任何技术想要最终发挥效应,都要经历一个“技术-产品-经济效益”的三阶段发展。这其中,产品化是承上启下不可或缺的一步,很多优秀的技术就是因为无法产品化,最终只能停留在特殊或小众领域,也有很多变革并不需要明确的技术指向,仅仅是因为产品出色,就可以引发变革。就像iPhone集成了很多新技术,但本身是产品创新。
在如今这个节骨眼上,每个人都能感觉到GPT蕴藏的变革能量。但我们对他如何产品化还知之甚少,能看见的应用方案,主要还是以API的形式完成,更多属于极客和开发者。
那么,这轮AI热潮下,到底有可能产生哪些“杀手级”产品呢?我们以GPT-4的一些关键特性作为线索,来和大家分享几个大语言模型的产品可能性。
先别提颠覆世界,那太虚,也别仅仅盯着已有的技术能力,那又太实。只有中程的产品化阶段,才是绝大多数人在这轮AI爆发中的机会所在。
信息时代3.0,主线是“命令”
信息时代有两条颠扑不破的主线:信息获取与个人娱乐。搜索、信息流、门户网站、直播、短视频等,这些互联网产品样态都离不开信息获取效率的升级,以及个人娱乐体验的加强。GPT-4代表的大语言模型,可以在短时间内生成大量内容,甚至生成PPT、网站、视频,这些传统意义上AIGC难以做到的内容。
这个能力推演下去,最大的产品价值在于,大语言模型带来人与信息交互方式的彻底改变。
英伟达 GTC 2023 大会上,黄仁勋说:“生成式 AI 就是一种新型的计算机,我们可以用人类语言进行编程,任何人都可以命令计算机来解决问题。”
“命令”这个词非常关键。当GPT-4以及未来更多大语言模型成为产品基底,用户与信息产品、娱乐产品之间的互动方式,最大可能性就是命令。
在信息1.0时代,你的需求可以被查询到,这是搜索机制,代表产品就是搜索引擎。
信息2.0时代,你的需求可以被迎合,这是推荐机制,代表产品是信息流和短视频。
当AI能力进一步提升,你的需求可以被短时间内订制且满足,GPT-4乃至5、6、7带来的新机制,就是命令机制。
在这个阶段,信息不是已经成型,然后根据用户需求进行查找,而是信息本身不存在,当用户发出指令后再进行AIGC。比如说,我在搜索引擎时代,想要写一篇关于芯片的文章,就需要依靠关键词、关键信息去搜索、查询各种数据报告,需要用户有耐心和信息查找能力。而在信息流时代,AI推荐机制会根据我查找、浏览了芯片相关信息,自动推送相关内容,这些内容有的有益,有的没用,需要用户来辨别。
当“命令”成为主要的信息交互方式,我可以直接命令AI找到近期关于芯片的所有数据,并生成一份专属报告给我。如果不满意,我还可以命令它修改。
如果说,这种命令式信息收集,改变的生产、学习效率,以及信息获取方式。那么类似技术驱动的AI生成视频则可以极大改变娱乐模式。今天我们会觉得很多短视频的模式化、快餐化,简直像AI做的,未来这个担心或许就没有了,因为视频就是AI做的。
电影解说、明星八卦、劲歌热舞,AIGC未来将会随时订制大量视频内容,里面的电影信息是GPT抓取的,明星八卦是AI搜罗的,跳舞的男孩女孩形象都是AI生成的,不用再去寻找内容,不用再让AI推荐,也不需要大量短视频创作者、UP主费时费力制作剪辑,只需要一个命令,轻轻松松几个小时的娱乐时间就打发掉了。
如果说,信息时代1.0是人找信息,2.0是信息找人,那么AIGC带来的信息3.0时代,就是谁也不用找谁,AI自己可以生成。
这个产品化机会的核心是继搜索引擎、信息流之后,打造“命令引擎”这种新的产品形态。我猜“阿拉丁神灯”应该是个好名字。
游戏NPC正盯着你
GPT-4发布的那个晚上,我看到群里很多开发者都在讨论,而第一条蹦出来关于GPT-4应用的消息,是有人说可以把他放在游戏里当NPC。
让NPC使用大语言模型作为底座,来跟玩家进行内容丰富、高自由度的多轮对话,应该是一件很容易想到的事情,但这位朋友说的却不是这个意思。
GPT-4的一个关键创新特性,是让AI来识别图片,并且理解图片中的细节、内涵等,比如可以理解一张搞笑梗图中的幽默点到底在哪。
这种能力如果用到游戏里,将赋予游戏和游戏NPC一个前所未有的能力:看见玩家。
从电子游戏诞生之日起,玩家要做的就是去看到、听到一个虚拟世界,并沉浸其中。这个过程中,玩家要尽可能脱离自己周遭的现实,游戏感始终是单向的。虽然AR游戏、体感游戏的出现,一定程度上改变了这种情况,让玩家的体态、运动、力量以及游玩环境进入到游戏当中,但游戏本身对玩家是缺乏理解的。
如果让GPT-4成为游戏NPC,或者作为游戏本身机制的一部分,那或许我们距离游戏能够理解玩家,并做出对应反应已经不远了。你在观察游戏NPC的时候,他们可能也在观察着你,尝试理解你的表情、你的体态,解读你在游戏中的困惑、激动,或者卡关之后想摔手柄的暴怒。
如果这种机制被放置在一些游戏大师手中,最终作品一定是震撼人心的。事实上,AI生成关卡、环境,完成自动渲染等技术,已经极大改变了游戏开发,而GPT-4与游戏的深度融合,未来也是极大概率事件。
这种融合在两个领域最有可能性,一个是强调互动的AR、VR游戏,另一个是注重NPC自由互动的开放世界与多结局角色扮演游戏。
除了游戏之外,“看懂”这个能力还可以被用到数字人,甚至机器人身上。也可以带来相当有分量的产品机会。
“一嘴通办”
说了toC的,让我们再聊聊toB。今天很多人都知道一个词,叫做“一网通办”。就是说在政务系统中打通各个部门的信息系统界限,从而避免办事人要在不同部门之间来回奔波,产生办不完的手续、盖不完的章、跑不完的路。
在全球很多地方,一网通办都是城市服务、政务、金融、财税等领域的数字化核心发展方向,在中国的东部沿海地区和一线城市,“一网通办”也正在高速发展。
但是“一网通办”这种模式,其实依旧有痛点存在:
一是“通办”仅仅是数据打通了,但办理逻辑和办理方式依旧与之前无异,用户该不会的还是不会,该卡住的还是卡住,可能需要花费大量时间在反复询问、填写材料、咨询上。
另一个是“一网通办”的效率高度依赖操作人员能力。由于操作人员精力和专业能力有限,必然不了解各个业务领域,因此一旦出现复杂的情况,就会出现操作员虽然能处理,但不知道如何处理的问题,需要层层请示领导或者跨部门沟通,这样反而降低了效率。
大语言模型与这些领域的融合,必然能够解决一些问题。办事人可以直接咨询AI,了解复杂的部门、业务之间的内在逻辑、办事方法,从而尽量一次性完成办事需求;而操作人员也可以依靠AI来获取跨部门的操作方法、操作样例,从而能够完成较复杂情况的高效率处理。最关键的是,类似能力可以更多用AI替代人工。
这种依靠大语言模型知识抓取、逻辑分析能力的服务平台,可以把“一网通办”升级成“一嘴通办”,办事人说清楚诉求就全面搞定。当然这个名字纯属开玩笑,但城市服务的核心,一定要从“网”转变为“人”,这一点是毫无疑问的,也是大模型时代的toB产品核心机遇。
类似的能力,最具有落地需求的就是政务与金融方面,这两个领域涉及事项多、专业性强,并且与民众需求紧密相连,从更远一点考虑,可能也包括财税、法律、医疗。GPT代表的大语言模型,可以打破公众服务的边界,让AI连接起专业知识与用户需求。
集成了咨询、数据汇总、事项办理、文书认证等功能的新型AI服务平台,将是接下来toB市场AI技术的核心机遇。
超级无代码开发
移动互联网创业热潮的时候,经常有人开玩笑说,“我创意、机会、方法论都有了,距离拿到融资就差一个程序员”。
这当然是一个笑谈,但笑着笑着我们可能会发现,连那个程序员都不差了。
ChatGPT让人惊艳的一点,就在于代码的自动生成和修改。其实很多程序员朋友都说,类似AI模型的能力还主要是辅助工作,根本代替不了一个懂业务、懂产品逻辑与实现方式的程序员。
但复杂的开发可能做不了,简单的难道不行吗?GPT-4发布时演示的创新点之一,就是让模型根据需求自动生成一个网站,虽然生成结果比较粗糙,但已经实现了基本的开发需求。
在云计算与软件业,低代码开发,甚至无代码开发是近两年流行的热门概念。核心逻辑是利用代码库,将已有开发样例进行快速复写,但GPT-4的逻辑显然更加先进,他甚至不需要用户懂架构,而是直接根据需求生成开发程序。
这种能力,在短时间内生成复杂的软件应用或许不行,但对于很多没有编程与开发能力的人来说,通过AI来获取一个小程序、一个电商平台、一个简单的APP还是非常有意义的。
用一些模板搭配GPT-4,可以形成“超级无代码”的产品形式。用户只需要下达需求并支付费用,就可以获得属于自己的软件应用,整个开发过程中的人工成本趋近于0。
为人提供这种AI主导,模板+微调的软件开发,或许也将变成一个全新风口。其实想想,现在随手就能拉个群聊,这在早期的互联网聊天室时代简直难以想象,那么未来人手几个APP,一堆网站,一群数字人,可能也不是什么难事。
从预训练大模型崛起,再到今天的ChatGPT、GPT-4,最值得关注的是智能涌现效应驱动下,一些作为信息化常识的东西被改变了。换句话说,GPT-4是条件,而不是结果。
只有运用好这些新条件,得出新方法,创造新产品的人才能获得AI时代最好的结果。
有人会担心,这么大的变化之下,我的工作、生活会不会被颠覆?
其实吧,这种焦虑什么时候都有,但从没有真正变成灾难。
1999年,朴树有首歌叫做《New Day》,里面有句歌词是这么写的,“快来吧奔腾电脑,就让它们代替我来思考”。
20多年过去了,人类还在思考,奔腾电脑在哪里?