AI应用路线图:可控性是最强路标

50f53f4af2642de1f065be41d4ffb654.gif

生成式AI的可控性越强,对市场和产业的颠覆性就越大!

作者 | 王咏刚、童超

责编 | 夏萌

deadee3fa7852ab79110828299f9eaf8.png

生成式 AI 的应用场景在哪里

Stable Diffusion、ChatGPT等生成式AI技术(Generative AI)在2023年上半年吸引了IT创投圈的最多注意力。当我们稍稍从波澜壮阔的新技术浪潮中回过神来,开始认真思考到底什么样的应用场景才是生成式AI的最佳落地方向时,很多人还是会发现,科技与市场之间的关系错综复杂,很难梳理出生成式AI落地的最佳路径:

  • 某投资人:这几个月来,一线风投机构全体动员,忙得昏天黑地,结果发现除了四五家头部大模型创业项目被大家追捧外,其他AIGC项目都看不清,不敢投,不知道未来AI应用会向哪里发展。

  • 某分析师:几家头部大模型项目投入大,风险也高;所有B端、政府端应用受限于私有部署和私有数据的制约,周期长,难落地;C端应用大部分都太浅太薄,文本和图像生成项目同质化严重;有一两篇好论文就出来创业的现象很普遍,但团队自己也想不清具体应用落地方向……

这里面最大的思维症结是:

  • 大多数人还是在潜意识里把生成式AI看成是一组生成对话、文章、图片的工具。按这样的刻板印象:这东西只能帮文案工作者、设计师提高提高效率,哪里称得上颠覆式的变革?

  • 虽然有许多迹象表明,生成式AI显露出通用人工智能(AGI)的曙光,但受限于短期价值判断的人总会说:曙光又怎样?眼见为实。今天的AI不还是在聊天儿、写文章、画画儿吗?

显然,仅停留在单一视角或单一时间节点来分析生成式AI的应用前景是不可取的。有没有串联起生成式AI的发展脉络,简明易用的思考模型呢?

1982662287910013ceab02ea2aff8987.png

围绕可控性建立思考模型

我们认为,生成式AI是可以与桌面计算、移动计算相提并论甚至更具颠覆效应的信息产业革命。颠覆式变革从来都不是一蹴而就,而要随着生成式AI的不断发展、不断进步逐渐实现。如果想看清、看透生成式AI即将带来哪些新产品、新平台、新市场、新机会,我们觉得,有一条简明易懂,也易于指导产品选型、项目选型的思维路径:

生成式AI的可控性越强,对市场和产业的颠覆性就越大!

这条路径可以简单用一张图来表示:

79c1c117c8eb4a3d5b56131407c3cbb0.png

随着生成式AI对生成内容的可控性不断提高,生成式AI适用的应用场景也会不断扩展和深化。量变引起质变。一旦突破领域阈值,生成式AI就可以彻底改造现有的产品生态,为产品赋予真正的智能元素。

演进过程中,生成式AI的可控性大致会经历六个阶段。以最基本的文本生成为例:

阶段1:不可控

20多年前,基于N-grams算法的统计语言模型也可以生成连续的文本内容。只不过,生成的结果基本不可控。如此早期形态的“生成式AI”几乎没有转化到产品的可能性,更谈不上颠覆已有市场了。

阶段2:概略方向可控

从基于LSTM或RNN的文本生成,到早期GPT(如GPT-2)的文本生成,生成式AI逐渐拥有了描摹一段类似人类语言文字的能力。这一阶段的描摹能力,基本可以达到文句通顺,内容大致符合人类给出的提示,但因为细节、结构或逻辑不可控,还是很难转化成真正有用的产品。

阶段3:结构或局部逻辑可控

从GPT-3到ChatGPT(GPT-3.5),生成式AI第一次拥有了对生成内容的结构和局部逻辑的控制力。文字创作和多轮会话是这个时期的两种典型应用生态。前者可以支持自动文章摘要,法律文书生成,营销文案生成等实用场景,后者则可以满足会话式搜索,语言学习,智能客服,虚拟人,智能游戏角色的部分需要。

阶段4:初步的思维链可控

从GPT-3.5到GPT-4,生成式AI的逻辑推理能力显著提高。生成式AI第一次拥有了强大的分析能力(如从新闻报道中提取数据,总结趋势),控制能力(如将人类语言转化成复杂系统控制指令)和初步的逻辑推理能力(如解答简单的数学、逻辑题)。可生成的文本内容也扩展到数据、表格、代码、指令序列、工作流或工具链等结构化、半结构化文本。这直接引发了今天一大批以Copilot(直译为“副驾驶”)为特征的新工具、新系统。

阶段5:复杂逻辑推理可控

当然,今天的GPT-4生成文本时,可以控制的逻辑思维链还处在初级阶段。如果一切顺利,人类有望在不太远的将来研发出可精确控制复杂逻辑推理的下一代生成式AI。这样的AI具备记忆、学习、规划、决策等高级逻辑推理能力。这些能力足以在效率工具、内容平台、商业流程自动化、机器人、操作系统、智能设备等场景里,彻底颠覆过去数十年的人机交互形态,重新定义人类与计算机的关系。

阶段6:规则或原理可控

更前瞻一些看,人类思维的最高阶表现是:一、基于归纳思维发现原理、制定规则;二、基于演绎思维将原理或规则应用到具体场景中。生成式AI的理想进化形态是接近人类思维方式,生成与人类思维水平相当的规则或原理,并加以应用。一旦达到规则或原理可控的“自由王国”,生成式AI必将拥有强大的自我迭代、自我改进的能力,可以像人类一样设计系统规则、世界规则,甚至与人类科学家一道开展科学研究。

5190dea3281855cb4e7c40b3e60c1902.png

可控性与典型应用方向

生成式AI可控性的提升带来适用领域的大幅扩展。我们用下图概括生成式AI在不同发展阶段,可控性与最佳应用方向之间的关系:

59a106f9d2bee180b4bf0a44372b29a1.png

以可控性为脉络,生成式AI在每个发展阶段,支持的应用方向不断扩展、深化,从满足简单、局部需求,逐步发展到满足领域、平台需求,并最终积累到产品和商业模式的颠覆性变革。思维链、逻辑推理是否可控,在多大程度上可以精准控制,是这个量变到质变过程里最关键的因素。

70f75edba4e4652c6f4e8a60bd254064.png

可控性与具体应用案例

以生成式AI的可控性为脉络,我们将今天和近未来的生成式AI最适合的应用方向分成四个大类,并用下图将每个大类中的典型应用案例与生成式AI的不同发展阶段关联起来:

ac05e3a61661b0a8287310401398cc93.png

内容创建工具/内容平台

内容创建工具是生成式AI落地最直接也最快捷的场景。随着生成式AI可控性的提升,内容创建任务会从简单的文本、图片创建,过渡到复杂的视频、3D、动画、游戏、影视、虚拟世界等的自动创建。借助AI,每个普通人都将拥有原本只属于专业团队、专业工具的能力。普通人的创作欲一旦得到大幅释放,有关新内容形式的分享、观赏、购买、社交等更高层级的需求就必将带动新一代内容平台的诞生、发展和壮大。

商业自动化/企业服务

限于数据安全、私有部署、内容准确性及合规性等原因,商业流程对生成式AI的可控性要求非常高。今天的生成式AI最适合落地的商业领域可能包括市场营销中的内容创建和电商的用户界面。此外,生成式AI也可以通过自动生成SQL等中间代码,自动采集分析数据,自动生成报表,自动连接业务流程等,大幅提高商业效率。未来,随着生成式AI可控性的提高,商业流程中的规划、决策、优化等关键过程,一定会吸纳更多的前沿AI技术。

个人助理/专业助理

个人生活和办公场景中,生成式AI将逐渐以各类不同形态的“助理”身份,在数年内建立起人与AI相互协作的新生态。生成式AI的可控性有多强,从根本上决定了我们生活或工作中的AI助理有多聪明,可以帮我们解决哪些问题。一旦生成式AI在一部分工作中具备与人类文秘、司机、译员、律师等角色相当的水平,AI助理就会成为替代计算机、手机的新一代大众电子产品。

基础架构/开发工具/操作系统/搜索引擎

生成式AI的编程能力,数据处理能力,系统设计能力,知识处理能力等,将为开发工具、数据库、搜索引擎、操作系统提供全新的设计理念和跨时代的新功能。未来是否能真正诞生AI为核心的操作系统,AI为核心的智能计算平台,完全取决于生成式AI的复杂逻辑推理能力到底能达到怎样的高度。

22252729472859aaf34b3f09972282af.png

多模态AI的应用能力演进

与简单的文本生成、图片生成相比,包含声音、视频、3D场景、动画、复杂故事线的多模态系统与人类的常识感受和本源需求更加契合,明显拥有更宽广和深远的应用前景。有关多模态AI的技术现状和前景展望,可以参见本文作者的另一篇文章:后GPT时代,多模态是最大的机会 在多模态领域,我们认为,今天和未来的生成式AI会大致按照下图所示的脉络演进积累,不断催生有革命意义的新应用、新平台甚至颠覆性的新商业模式:

3f602baeb347aea4714ded43b1c0c795.png

以上所有应用路线图的图片和文字内容,均由 SeedV 实验室以 CC BY 4.0 协议发布,以上应用路线图的图片也同时开源在以下位置,欢迎访问(可直接点击文末【阅读原文】访问):github.com/SeedV/generative-ai-roadmap

作者简介:

  • 王咏刚:SeedV实验室创始人兼CEO,创新工场AI工程院执行院长

  • 童超:SeedV实验室联合创始人兼首席产品官

推荐阅读:

▶马斯克也爱 “天才少年”!14 岁神童,年薪百万,SpaceX 史上最年轻工程师

▶中国开源项目迈向全球化!

▶学历造假、拖欠工资、核心技术归属存疑?AI 独角兽创始人遭质疑后回应!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32972.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抖音根据关键词取商品列表 API 返回值说明

请求参数:q连衣裙&page1&sort 参数说明:q:关键词, filter:搜索类型:filtervideo 搜索视频、filtergoods 搜索商品、filteruser 搜索用户, page:页数 sort:排序(目前只视频可排序):sortnew 最新发布 sortcredit 最多点赞 sortbid 综合…

简单对接抖音小店的接口

最近公司需要对接抖音小店的接口。然后其实对接起来还是蛮简单的,不过自己阅读文档的能力还有点问题,所以这里记录一下开发遇到的问题。 文档地址:https://op.jinritemai.com/docs/guide-docs/6/14 首先是需要准备的配置。 抖音小店的整个流…

获得抖音商品详情 API 返回值说明

请求地址: https://api-gw.onebound.cn/douyin/item_get 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[item_search,item_get,item_sear…

抖音关键词月搜查询( API 返回值说明)

为了进行电商平台API开发,我们需要做下面几件事情。 1)开发者注册一个账号 2)然后在平台应用注册一个应用程序键(App Key) 。 3)下载平台API的SDK并掌握基本的API基础知识和调用 4)利用SDK接口和对象&a…

抖音跳转微信加好友功能实现解析

抖音现在毫无疑问的成为了大众喜闻乐见、爱不释手的娱乐利器,工作闲暇、茶余饭后、候车排队等等只要有空,就会随时随刻随手划拉,每个人都沉浸在这虚拟和现实的交互之中,乐不思蜀,忘乎所以,不能自拔。 抖音…

研究抖音的,点进来

作者:杨浩 全文共 5183 字,阅读需要 11 分钟 ———— / BEGIN / ———— 抖音之火,我们可能从主观上会听到很多声音,比如:“中毒了,我每天晚上要刷2个小时”,、昨晚刷到凌晨4点”、“我家小女…

获取详情API接口(抖音)

API接口名称: item_get - 获得抖音商品详情 响应参数 Version: Date: 名称类型必须示例值描述itemitem[]0宝贝详情数据 注册申请试用: 点击注册 请求参数:num_iid3514453298386183303 参数说明:num_iid:抖音商品ID 请求示例…

清爽聊天无多余功能!抖音聊天工具上线

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇 来源丨电脑报 https://mp.weixin.qq.com/s/iRwO_iot8DSfN5PZbbKMDA 近日,抖音在官网上线了一款桌面端聊天软件“抖音聊天”,将支持 windows 7…

今日推荐一款实用的搜题小程序,题多多搜题

为什么要用小程序 1、不用安装,即开即用,节省流量,节约安装时间,而且不占用桌面; 2、功能上更为集中、单一,降低用户的使用难度,减少手机的过度使用。 小程序怎么找 现在大厂都已经推出了各…

大学c语言作业用什么搜题比较好,快速查找题库_什么手机软件可以把题库输入进去然后输入关键字可以查找点道题_淘题吧...

❶ 什么手机软件可以把题库输入进去。然后输入关键字可以查找点道题 用试题通啊,这款软件可以的,题库录入过后搜索关键字就能看到答案和题目了。 ❷ 如何快速寻找题库中的答案我有份题库,答题时如何快速的找到答案 大家谁也好的方法 用啥软件…

chatgpt赋能python:Python学习者必备:如何使用Python搜题

Python学习者必备:如何使用Python搜题 Python是一种非常强大的编程语言,在各种行业和领域都有广泛的应用。其中,Python在搜索引擎优化中的作用越来越受到重视。本篇文章将介绍如何使用Python来实现搜题,以及如何将Python应用到搜…

AI、OpenAI、MidJourney发展史

1探索ChatGPT,协助工作学习创作。加入「阿杰与AI」公众号,一同探讨,一同成长,比他人更进一步。 1.AI、OpenAI、MidJourney发展史2.ChatGPT们对今后社会生活的影响3.目前市面比较好的AI产品介绍4.注册方式汇总5.针对初学者的 Chat…

[世界杯]根据赔率计算各种组合概率与赔率

目录 一、背景 二、数据输入 2.1 赔率示意图 2.2 字典保存数据 三、数据处理 3.1 计算各种组合可能性 3.2 修正概率 四、输出结果 五、代码 一、背景 本文以世界杯体彩“混合过关”4场串胜平负为的赔率进行编码 其他类型如比分 、总进球数可以参考代码进行相应修改 …

2/26周日 今日竞彩前瞻推荐,精选5场稳胆推荐,比分预测

大家好,我是千雅,本人热爱足球多年,对比赛有个人的独特的分析和见解,放平心态,细细分析,跟从自己的看法,结合盘口的走向,才能有效的把握住每一场比赛的最终结果。以下是我个人的见解…

用代码预测一波欧冠8强对阵吧

欧冠8强已经出炉,不知道你支持的球队晋级了吗 这8支球队分别是比利亚雷亚尔、切尔西、马竞、本菲卡、拜仁、利物浦、曼城、皇马。这其中英超联赛和西甲联赛分别有3支球队晋级,德甲联赛和葡超联赛则分别有1支球队晋级!五大联赛中的意甲联赛和…

这届 AI 预测欧洲杯冠军,通通被打脸

持续了一个月的欧洲杯,终于落下帷幕。 北京时间 7 月 12 日(周一)凌晨,本届欧洲杯决赛中,意大利对阵英格兰。两队在 120 分钟时间里 1-1 战平,意大利在欧洲杯中通过点球大战以 3:2击败英格兰夺冠。 意大利上…

这10本书,带你了解 ChatGPT 的底层逻辑

文末赠书 文章来源:人民邮电出版社 自2022年11月30日发布以来,ChatGPT已经真正意义上地火爆全球:它在不到40天内就拥有了1000万用户,而Instagram足足用了355天;最近它的日活已经达到1000万,这意味着其用户已…

在线K歌场景下实时合唱方案选型分析

摘要 在线K歌软件的开发有许多技术难点,需考虑到音频录制和处理、实时音频传输和同步、音频压缩和解压缩、设备兼容性问题等技术难点外,此外,开发者还应关注音乐版权问题,确保开发的应用合规合法。 前言 前面写了几期关于直播 …

技术选型|K歌App中的实时合唱如何进行选型

摘要 在线K歌软件的开发有许多技术难点,需考虑到音频录制和处理、实时音频传输和同步、音频压缩和解压缩、设备兼容性问题等技术难点外,此外,开发者还应关注音乐版权问题,确保开发的应用合规合法。 前言 前面写了几期关于直播 …