00 | 写在前面
大多数课程的第一课,都会对课程内容做一个基本的介绍,其核心离不开三个方面:为什么学?学什么?怎么学?根据不同老师教学风格,可能会补充介绍发展态势,引出未来挑战与期望。
在多数人理解中,上述内容可以纳入“课程概述”范畴。
自己也始终对“概述”抱有类似概念上的认识。只是最近孩子偶然问起什么是人工智能时,一时语塞,不知该从何处、以何种线索向孩子做简要说明。
猛然发觉,原先熟悉的“概述”,已经涵盖了人工智能的基本信息与基本问题,完全可以作为对人工智能最基本的“知识图谱”。
比如对于汽车而言,我们每天驾车上下班,可以说再熟悉不过。如果有人让你谈谈对汽车的认识,你会不假思索地描述汽车的品牌、外形结构,发动机排量,驾乘体验等;但是却很难向对方解释发动机、离合器、防冻液的工作机理,因此一旦汽车出现故障,我们往往会求助于专业修理服务,而非自己上手。
如果将关于汽车的外形结构、驾乘体验等描述为“基本认识”,而将汽车动力系统等内部机制原理描述为“深层认识”,那么可以说:我们大多数人对汽车都保有基本认识,但是较少的人具备深层认识。
现实中是可以理解的。不同于远古人,科技发展推动生产力提升,千变万化的生产力工具和生活服务产品走近千家万户,并且还在不断创新迭代。相比于远古人对手头木棒的了解,我们反而对周边工具的了解更少了。
但是,若想对世界保有常识,就应当对周围万物保有必要的“基本认识”,而对于关系更为紧密的事物,则需要深入探究内在机理,举一反三,学以致用。
我更愿意将这类对世界的基本认识,称为“通识”。
从这个意义上说,人工智能概述,也可以作为AI的通识。
01 | 什么是人工智能?
人工智能(Artificial Intelligence,AI),可以定义为“以机器为载体的人类智能或生物智能”。
其中有两个关键词:“智能”与“机器”。
011 | 关于“智能”的认识
若将具有智能的个体称为智能体(Agent),就可以从智能体具备的行为功能中尝试理解“智能”:
-
能感知:智能体(Agent)能够接收视觉、听觉、触觉、味觉等多维传感器数据,感知这个世界的信息
-
能认知:智能体(Agent)能够综合分析处理感知到的世界信息,对事物进行分类判断以及预测,如识别桌面上摆放的水果是苹果而非鸭梨,预测滚动的小球会从桌面掉落等
-
能交互:智能体(Agent)改变周围环境并从中接收反馈的能力,常见的如不假思索的本能反应和审慎思考后的分析决策并付诸实践
人类作为自然进化的结果,具有独特的大脑结构,借助丰富的神经网络,实现上述感知、认知与交互功能。但是若想复现上述智能表现,又该如何实现呢?
012 | 可计算思想
简单的智能可以看作是自主完成某项任务的表现。那么什么样的任务是可以自主完成的呢?
联想教孩子做饭的场景,现场演示洗菜、热锅、翻炒等一系列工序,孩子也会逐渐习得相应步骤。赋予智能体智能的过程,应该也可以按照上述方法实现,前提是可以将“做菜的步骤”描述给智能体。
推而广之,如果可以将一个任务的执行步骤,通过有限步清晰具体的步骤描述出来,那么该任务显然具备了智能体自主学习的可能性。
这恰恰是可计算思想的萌芽。
现实世界中并非所有任务都是可计算的,其实有大部分任务是不可计算的,比如对于费马猜想:当整数n>2时,关于x,y,z的方程没有正整数解:
x n + y n = z n x_n + y_n = z_n xn+yn=zn
那么该如何判断一个问题是否可计算呢?
图灵给出了一个答案:凡是可以使用图灵机有限步解决的问题,均是可计算的;对于不可计算问题,图灵机是不可停机的。
基于可计算思想,计算机作为新的载体应运而生。正是有了计算机的出现,才使得当今以机器为载体的人类智能或生物智能成为可能。
02 | 人工智能发展简史
人工智能术语诞生于1955年的Dartmouth会议,彼时几位计算机与信息领域的大牛联合发表一份报告,提出了Artifical Intelligence的概念。他们指出:“人工智能就是让机器能像人那样认知、思考和学习,即用计算机模拟人的智能”。
当时的AI报告中列举了值得关注的七个问题,其中的四个问题已经取得了进展,剩余三个问题依旧是AI研究领域的核心挑战,即“Self-improvement(自我学习和提高)”、“Abstractions(归纳和演绎)”以及“Randomness and Creativity(随机性和创造性)”。
人工智能的发展并非一帆风顺,而是先后经历了三次低谷。
第一次低谷源于1973年英国发表James Lighthill的AI报告,其中认为当时的AI研究进展缓慢,令人失望,建议取消相关研究。由于当时英国处于AI研究领先地位,其政府决策方向成为其他国家跟进的风向标,各国开始缩减、取消AI研究计划,AI研究迎来第一次寒冬。
第二次低谷源于日本智能计算机研制失败。1982年日本通产省主持研制第五代计算机,希望可以实现计算机从计算与存储数据向能直接推理和知识处理的新型结构过渡。然而今天的我们已然知道实现上述推理和知识图谱需要大数据存储分析架构支持,而彼时的硬件技术尚未成熟;且其目标计算机具备听说能力,显然超出了时代局限。因此1992年该项目在耗资近8.5亿美元后失败告终。
第三次低谷以知识词典日趋式微,网络百科兴起为标志。斯坦福大学1984年计划通过专家来建设知识百科全书,但是在90年代后期便走向衰败,被网络百科搜索取代。专家表达的知识并不完备,以致于不可避免出现错误,如“所有的鸟都会飞”结合“鸵鸟也是鸟”就可以推出“鸵鸟也会飞”,与事实相悖,因为“所有鸟都会飞”本身就不完备。若想用语言完备地组织表达出知识,十分困难,因此由此建立的逻辑推理模型也不可避免存在问题。
事实上,每一次低谷前都会迎来一次AI热潮,一般由某项振奋人心的研究引领,后续研究与技术疯狂投入,直到遇到现实瓶颈。
反观当今热炒的ChatGPT,不可否认其具备的强大语言智能能力和多功能集成性(翻译、搜索、对话等),且作为产品集成在Bing搜索中发布使得其更加贴近用户,因此可以“撬动”更多社会面价值。但是我们应该保持清醒,ChatGPT作为一种本质基于字符统计关联性预测的模型,其看似学会了统计上的关联性,却并未真正学会语言间的因果联系。
语言并非单纯作为符号存在,而是客观现实世界的符号化反映;客观现实世界遵循万物运动的统一法则,这些统一法则表现为了因果律;而NLP的语言模型中考虑字词句元字符间的统计概率,并结合人类强化反馈优选最合适的组合,其实质是用相关性去替代因果性,大比例上具有较好的任务拟合度,甚至以假乱真,但是终究无法取代因果律,距离真正的语言智能为时尚早。
冷静对待ChatGPT,而非像资本一样蜂拥而入;资本逐利,尤其喜爱短期高额回报,但AI的发展从来不是一锤子买卖,更像是以一场人神之间的马拉松。
03 | 人工智能主要研究内容
031 | 人工智能技术分类
从功能上看,当今的人工智能技术大致可以分为三类:
-
领域人工智能,此类AI专注于特定领域的任务,并且展示出远超于人的智能性。如IBM的沃森AI与AlphaGo,前者专注于推理运算,后者专注于围棋对弈。
-
通用人工智能或跨域人工智能,又被称为强人工智能,不同于领域人工智能从数据和规则中学习,并以程式化编程决策行为,通用AI已经具备了学习能力,可以从已有经验中学习,并且举一反三。
-
混合增强人工智能,此类AI是多种Agent的混合形式,如外骨骼机器人,物联网时代下的智慧城市等。
从智能实现方法上看,AI技术同样可以分为三类:
-
符号主义人工智能,即将逻辑推理作为AI的核心,构建相应的知识图谱。如基于专业知识构建出关于三峡大坝和葛洲坝大坝之间的反调节关系,那么若大古力水坝和达拉斯水坝之间具有相似的地理特征,则可以推断出二者也具有反调节关系。
-
联结主义人工智能,即挖掘数据所蕴含的内在模式,借助大数据存储分析技术,采用数据驱动的方式应用机器学习赋予Agent智能,当前主流的图像识别、自然语言处理等领域均属于此类,也是当前AI+应用的主流方法
-
行为主义人工智能,即从经验中学习策略,借助行动后的反馈牵引实现智能提升,典型的就是强化学习,常用于无人驾驶、机器人等领域
总体来看,符号主义AI类似人类知识推理过程,因而容易理解,可解释性强,但是受到世界复杂规律的限制,难以单由人类自身提供完备的知识库;联结主义以数据驱动模型,依赖于数据,可解释性不强,但是往往可以习得人类未知的新模式;行为主义需要在经验中进行持续学习,目前来看需要更好的搜索策略。既然三种方法各有千秋,未来根据实际需求综合应用三种方法或许才是明智之举。
032 | 当前人工智能代表性技术
作为AI通识,不需要理解具体的技术原理和细节,只需关注当前AI代表性技术即可。
其一是逻辑与推理。主要研究如何将实际问题命题化,然后建立推理规则,赋予知识AI获得新知识的能力。主要内容包括:命题逻辑、谓词逻辑、知识图谱推理和因果推理等。
其二是搜索求解。搜索算法通过模拟智能体的一系列动作,按照一定规则探索智能体的所有可能行动,直到找到一种满足约束限制的解法,以此来指导智能体的行动。
其三是机器学习。Machine Learning立足于统计模型,极大促进了AI的发展。其中最重要的有两类,一类是基于标记数据的监督学习,常用于分类和预测任务;另一类是基于非标记数据的非监督学习,常用于分布探查任务。
其四是深度学习。借助大数据技术的飞跃,原有的神经网络模型重获生机,之前不显示的数据存储与计算量简单易行,从而使得深度模拟人脑网络成为可能。Deep Learning在当前广泛应用于图像识别分析与自然语言处理领域,获得了巨大成功,极大提升了生产力。尤其重要的是,对于ML中需专家提供的特征参数,DL可以自动使用数据训练,且获得更好的效果。
其五是强化学习。这是一种来源于Agent本能的学习方式,也是我们人类引以为傲赢得进化生存的学习方式。从环境交互中学习,正反馈时加强行为,负反馈时调整行为,并逐渐记住性命攸关的行为反馈,作为条件反射长期存储。其关键问题是如何定义动作收益以及目标函数,并且找到合适的期望收益计算方法。
其六是人工智能博弈。博弈行为是多个带有相互竞争性质的主体,为了达到各自目标和利益,采取的带有对抗性质的行为。现代博弈论主要研究博弈行为中最优的对抗策略及其稳定局势,协助对弈者在一定规则范围内寻求最合理的行为方式。
04 | 人工智能学习建议
综上所述,当今的人工智能是一个多学科交融的技术领域,因此对于初次踏入AI领域的学习者而言,势必眼花缭乱。基于自己了解的大牛腾飞经历,以及自己求学过程中的教训,提供几点 学习建议供大家参考。
041 | 共性基础
虽然人工智能方法体系上大致分为符号主义、联结主义与行为主义,但是都要求具备一定的数学基础。毫不夸张地说,计算机专业的硕导博导更偏爱数学专业背景的学生。因此,如果想学习人工智能,必须学好高等数学(微积分+线性代数),同时还需要学好概率论。
人工智能以机器为载体实现,因此势必要懂得如何和机器打交道。硬件上需要具备计算机基础知识,需要了解计算机系统的基本架构,知晓CPU和GPU,内存与硬盘的区别;软件上需要掌握1-2门编程语言,同时需要具备数据结构与算法相关知识。
042 | 两条道路
接下来的学习有两条道路。
一条是按序扎实推进,选择一门好的教材或者好的在线课程,从头到尾跟着自学。这样做的好处有老师讲解和教材参考,学习相对顺畅,学完一遍之后,短期记忆可以帮助你迅速建立一张初步的知识图谱。不足是单纯采用书面教学,缺乏实践反馈,容易动力不足半途而废,而且单凭理论学习,对算法模型理解有限;同时学习需要较长时间,时间成本稍高。
另一条是按需野蛮生长,即选择一个自己比较感兴趣的方向或领域,迅速查阅相关资料,开始学习。比如某位同学对图像识别很感兴趣,那么可以先找几篇相关的经典论文浏览,重点关注论文的问题、研究思路、使用的技术以及实验设计搭建等,然后以复现为目标,对照自己技术积累,从头到尾补齐短板。这样学习的优势显而易见,这是一种见效最快、目标明确的学习方式,但是也是一种困难的学习方式,因为时刻会遇到新知识新挑战,不断在受挫中前进。
事实上,大家可以根据自身情况二选其一。一般而言,如果时间充足,想慢慢学习积累,可以选择按部就班路线;如果科研压力较大,急于落地出成果,想尽快对一个领域有较为深入的体验认识,那么建议第二种按需生长。
如果是对于日后有志于科研的青年朋友,建议直接选择野蛮生长路线,因为这是以后你做科研的常态,早习惯可以更早爱上“她”。
05 | 写在最后
一点浅见,仅供感兴趣的朋友们参考。
希望有更多的朋友们喜爱投身于AI事业,在AI领域实现自己的梦想。
诸君平安喜乐,万事顺遂。