仿生学是一部人类为生存而斗争的历史,过去我们为了生存而模仿自然,未来,科技将越来越多地模仿人类,谁将为永存而创造历史?
AI会话是几十代技术发展的叠加,ChatGPT在正确的路径上完成一次超越:生成了近似人类表达流畅度的文字和声音。在强大的WebText(互联网语料训练)支持下,ChatGPT具有了基于词汇量组合的创造性,语言能力已经胜过一般工作者,再次引发了危机思考。
如果作为一种知识库,ChatGPT是否会取代以知识为基础的咨询行业?它还能再进化吗?本文简单易懂地为非技术人员介绍ChatGPT,并分析一下咨询顾问与ChatGPT必将充满交集的未来。
本文目录:
1. ChatGPT工作机制
2. ChatGPT能取代人类吗?
3. ChatGPT如何颠覆咨询业?
4. 咨询顾问如何战胜ChatGPT?
01.
ChatGPT工作机制
如果将Google搜索引擎视为最早的程序会话,就不难理解程序会话的难点:理解搜索者输入的长句意图(非关键词搜索),返回指定意图的文本片段。
一种解决方案是使网站更好地符合机器解析的需要,比如语义网(semantic web),它定义了网站结构、文本表示上的规范;许多搜索引擎返回的结构化结果,比如机票价格、招聘职位等,都是基于预定义的语义网规范抓取解析。
另一种解决方案是利用NLP技术帮助机器理解人类语言。它基于一种假设和两种模型来实现并不断优化。
概率分布假设
NLP的关键假设是词的概率分布。Google搜索引擎技术被称为基于Web的智能,它与人类智能最大的区别,是精确与模糊的区别:Web智能是精确的、基于事实的检索,如新闻报道在Web文本库中,它永远返回正确的时间、地点、人物;而人类智能是基于上下文返回的模糊的时间顺序回忆,包含着不少错误。概率正是对回忆情景的最好表述。
早期概率分布假设将文本中特定词汇出现的频率,视为文本表达的主要含义,缺点是忽略了那些出现频率低但重要的词汇。
二项式分布解决了低频词的问题,通过计算词汇在多个文本中的概率分布,取得一个序列,得到更接近文本真实含义的概率。
计算某两个词汇的二项式分布,得到二者一起出现的概率,即联合概率分布,到此,NLP的问题解决已经从词汇跨越到了句子。
在给定词汇的情况下,计算某些词汇出现的联合概率,再通过拼接产生输出句段,即条件概率分布,就完成了一次“会话”。
语言模型
语言模型是捕捉自然语言中单词序列分布的显著统计特征的函数或学习这种函数的算法,通常用前面给出的单词来对下一个单词进行概率预测。
要使会话的输出更准确,依赖于概率的逼近程度,即语言模型的优劣。应该说,截止至今,还没有一种完全解决所有问题的语言模型,它只是在不断近似地求解。
Google搜索引擎使用的文本评价模型为PageRank,即相互的连接数量作为重要程度的打分。为使机器能够计算本文,需要转为程序能够处理的编码,即文本表示。搜索引擎推动了倒排索引、语义网等技术,将文本转为词频向量。但在大量、长句的情况下,产生的数据(维数)非常大,输入的参数也非常多,而且向量也无法表示句子与句子之间的关系。
分布式表示(distributed representation)解决了向量维数的问题,将一个高维空间的向量如[0 0 0 0 1 0]映射到低维空间[0.1 0.5],词的分布式表示称为词嵌入。
可以将词嵌入理解为向量从平面投影到立体空间的新值,对空间几何来说是一个简单的知识,但把它应用到NLP领域,分布式表示是最富创见的想法之一!因为它能将已知文本中所有词汇全部映射到空间,再基于词的空间距离获得更近似的下一个词的概率预测,由此能够对所有语言建模。在此之前,用于预测文本相似度的词袋模型也是计算欧几里德距离。
我们从共现矩阵(cooccurrence matrix)讲讲分布式表示如何一步步驱动了可预测的语言模型诞生。
给定语料文本为:
I like deep learing.
I like NLP.
I enjoy flying.
构建共现矩阵如下表,矩阵行列为语料库中全部词汇,下一词的出现频率为矩阵值。
共现矩阵可以实现两个目标:一是对全文档的主题发现,二是局部的语法和语义捕获。基过目标二的输出可以直接学习词嵌入,如连续词袋模型(CBOW,continuous bag-of-words),将全部语言,表述为空间分布的词汇,从每一个词汇出发,都存在着基于后验概率分布的词汇树结构,它既可以寻找相似词汇,也可以拼接出连续词汇。
基于后验概率取得所有叶子结点,再使用softmax函数对概率归一化,就得到了一个输出层。
输入一个词汇作为提问,输出一组基于条件概率生成的语句作为回答,到此读者应该已经理解了ChatGPT回答语句生成背后的语言模型原理。
但还有一个关键问题需要解决:机器如何从句子中正确地理解提问者的意图?这正是搜索引擎的最大痛点。
自注意力模型
Google在2017年的论文Attention is All You Need提出Transformer模型,核心是自注意力机制,原用于解决机器翻译逐字处理时的理解错误。比如下面的两句,it分别指代什么?animal还是street?人类可以正确理解,但机器未必。
The animal didn't cross the street because it was too tired.
The animal didn't cross the street because it was too wide.
简要说明一下Attention的原理,基于词汇的连续出现条件概率与全句词汇的联合概率来更准确地判断句子中词汇的指代。
许多网上的文档没有讲清楚为什么要除dk开方,它是softmax分组计算,目的是提高计算速度。
自注意力模型聚焦关键词汇的算法驱动了更多的应用场景:正确地提取句子的特征,就能够帮助机器正确地理解提问者的意图。
在一个给定的问题下,基于自注意力模型提取到关键词汇,然后从语言模型中找到相关的词汇及连续词汇,基于自注意力模型比对与问题的相关性,再基于这条句子拼接它的段落,比对与问题的相关性,最后得到输出文本作为回答。
词汇、句子、段落的拼接关联性与流畅度,正是ChatGPT解决的核心问题,它通过对语言模型增加空间层次结构来进行输出全文本的流畅度校验,本质上,语言模型是将文本建模为一个复杂的巨型系统,从字、词、句、段、章层层堆叠,全文体现为一个高层次的涌现。按论文所述,ChatGPT已经建立了62层,因此,随着层次的扩张,它的语言表现力将越来越逼近人类。
02.
ChatGPT能取代人类吗?
ChatGPT是概率、数学与系统科学知识在自然语言处理领域的综合运用,能否替代人类,取决于:
第一,人类语言是否基于同样原理产生和工作。
第二,语言是否代表人类的思维。
人类在大自然中从零开始创造出语言,ChatGPT是基于自然语言构建的智能体,作为不同的物种,语言原理当然有本质的区别。
现代人的劣势是大家都和ChatGPT的起跑线一样:是语言的学习者而不是发明者。或者说,语言是极少数人发明,大多数人学习,ChatGPT作为智能体,语言学习积累和运用能力已经战胜了大多数现代人。
但语言研究早就有结论:语言不是人类特有,所有的动物都有语言。如果有语言的动物都不能取代人,光会说话的ChatGPT当然也不能。
不只是这样,你周围有谁因为比你更会回答问题而把你取代的么?没有。相反,很多太会回答问题的人收到的指令都是:闭嘴。
关于第二个问题,恰恰是因为文字无法完全表达人类的知识,在社会协作中,人类才发展出了抽象归纳能力。语言只是人类思考的输出系统,正因为新思想无法基于现有的语言和符号进行表达,所以在构建体系化输出、传播时会特别慢。
ChatGPT不是人类的取代者,而是一个协同演化的语言智能体,在将来,大多数人反过来可以利用ChatGPT作为巨型智能知识库,更好更快地学习语言、获得启发。
那这样一来,作为特定知识专家,ChatGPT会不会取代以知识运用为技能的咨询顾问?整个咨询行业是否被颠覆?
03.
ChatGPT如何颠覆咨询业?
说真的,一个行业天天都有人讲怎么颠覆你,你就离死不远了;等到一项具体的颠覆事物出现时,你差不多就已经死了。
我们先来看看ChatGPT将如何颠覆咨询行业当前一些作死的场景。
场景一:成为更强的案例专家
一些咨询公司给客户准备的案例,是从网上扒下来的。什么时候起,咨询行业开始流行给客户介绍的案例不是自己做的,而是从网上抄的?客户谁不会上网?找咨询公司之前,早就查过了。你能查到的,客户也能查到。
因为提供了太多毫无参考价值的案例,大部分客户连顾问的面都不想见,想约?先发案例来看看,看了不行,就不见了。而那些拥有真实案例的顾问,明白案例的价值,对索取案例的客户,一律拉黑。
最后造成一个死循环:真客户别想见到真顾问,真顾问也别想见到真客户。
ChatGPT颠覆咨询业需要做的第一件事,就是对行业领域进行案例训练,成为更有针对性、更拟人的案例讲解专家。前面忘了提,ChatGPT已经具备了成熟的声音阅读能力。
如此一来,除了自动过滤掉客户找咨询公司索取案例这一不必要的环节,那些专门讲案例、不会干活的咨询顾问都得失业。
我们不妨进一步精准画像一下,合伙人将全部失业,如果未来咨询行业还在,客户也是通过ChatGPT生成的超级合伙人询单:
便宜耐操哪家强?
场景二:建立更强的专业网络
一些咨询公司给客户的方案,不是自己的,而是通过各种渠道弄来的别人的成果,还美其名曰自己的咨询方法是:观察。
仅有观察的方案就是瞎子摸象:由于不是原有方案的总体提出者、实施者,并不知道全部的问题、现状,也不知道有哪些中间过程,各个实施子过程的结论;观察者就和瞎子摸象一样,只能摸到一部分,再去猜测是什么为什么,甚至懒得猜测,直接就说是什么。
这样一来,采用了瞎子摸象方案的客户,咨询效果超级烂,从此把咨询公司拉黑,一朝被蛇咬,十年怕绳头,下一次即使正牌专家出现,客户也不信了。
昨天下午我和客户开会,其中一个客户方提问:XX公司说的,是真的吗?弄得我好尴尬,找我到底是来解决问题的,还是做同行评议的?
这种问题最需要ChatGPT来回答。通过构建客户案例——咨询公司——顾问的事实关系,帮助客户找咨询公司交流之前,先过滤一遍:
分析能力哪家强?
04.
咨询顾问如何战胜ChatGPT?
要战胜ChatGPT,首先,你得让ChatGPT为你所用;其次,你要比别人用得更好。
搜索引擎为什么没有战胜记忆能力强的人?因为恰恰记忆能力弱的人靠死记硬背,记忆能力强的人是对记忆过程的算法优化。比如我习惯搜索引擎后,写作过程不像以前一样,直接头脑里引经据典,而是依赖互联网查询。
后来我发现,不是自己的记忆力下降了,而是记忆模式变了:只记忆关键词和事件顺序,根据需要去提取,如此一来,极大地扩张了记忆广度,也更利用于在一个更高的关联维度上构思方案的全貌。
这不就是词袋模型么!
其中的关键差异是顾问接受信息的来源。是只听说了一个词汇,还是从体系化的学习中抽取、提炼、归纳出的概念?只有后者才能把ChatGPT用得好,前者,依然是和搜索引擎时代一样,属于不知道搜什么,搜出来也不知道用哪个的菜鸟。
再次,你得比ChatGPT更准确地理解上下文。第一章我们已经介绍了,在自注意力模型和超级语言模型的强大算力优势下,ChatGPT的语言天然比我们丰富得多,反馈也快得多。但是——
客户交流通常比长句更长、比长篇还长,甚至很多时候我们得听上好几个小时的连续陈述——其中包括了非常多的信息以及冲突……
如何准确地理解客户的中心诉求,从交流中提取出问题,进行分析、排序,形成与客户确定的需求,ChatGPT无法胜任。
如何在与客户的互动中抓住与普遍事实的矛盾,引导客户反思,ChatGPT更无法胜任。
如何基于头脑中的潜在方案通过提问向客户获取更多的上下文,当前NLP研究领域都尚未触及,ChatGPT当然不可能具备这种能力。
我们不难发现,咨询行业及至所有基于知识的行业要战胜AI,需要明白的是:普通的顾问,回答问题;最好的顾问,提出问题。
能提出一个好问题,才是更高层面的人类思维表征。
作者:陈加兴,数字化咨询顾问,专注平台战略、自动化与研发效能。拥有20年技术及咨询背景,服务客户包括华为、招行、平安、海航、赛门铁克、联想、中兴通讯、中国移动、阿里巴巴等知名企业。中国信通院汽车云工作组技术专家,参与编写《汽车行业软件研发效能成熟度模型》、《GitOps技术白皮书》等行业标准。联系方式:jxchen@withfield.tech
相关推荐
数字化转型必读:平台战略
垂直加速度:商业系统微服务架构演进策略
传统企业数字化转型的几大误区
敏捷方法中的系统思考
系统化分析与设计
系统与技术系统
创业战略的历程
敏捷咨询的工作原则
什么是数字化管理咨询?
知识价值曲线:理解咨询在新产品市场开发过程中的效用与选择
中国企业软件市场转型路径(上):数字化机遇与产品化困境
中国企业软件市场转型路径(中):价值空间与成本结构
吸收能力理论:组织转型中的关键绩效差距
信不信由你:战略行动背后的认知与行为
水无常形:组织管理效率的思考