参考资料
- 维基百科-人工智能史
- 百度百科-炼金术
- 百度百科-图灵
- 图灵机快速入门教程
- 百度百科-第五代计算机
- 野心勃勃的日本第五代计算机,如何一步步走向失败(上)
- AI缘起-达特茅斯会议
- 人工智能发展史
- Imagenet官网
- 机器之心——专家系统
- 炼金术与人工智能:休伯特•德雷福斯对人工智能发展的影响
- 机器学习——感知机
- 什么是感知机?
- 关于强人工智能
话说炼金术
炼金术(中国类似炼丹),一种魔法般的技艺,不论是古代中国、还是中世纪的西方,都有着一群信仰者不断的去探索。即便是我们再熟悉不过的科学巨人牛顿也曾经进行过大量炼金术的试验,当人们无法触及到真理之时,是人们的想象和坚定的信仰在支撑着他们前行。
16世纪到18世纪,大约有4000本相关于炼金术的书籍出版。从当时留下的诸多手稿、信札、笔记和文学作品中,可以轻松找到炼金术的痕迹。
我们现代人看来这似乎是可笑的,以当时的技术,想把一抔铁渣变成金子,基本是不可能的。即便是如今的科技也没有可行的方法,反而大量的研究表明是不可能的。那么这些为之努力的探索者岂不是白白耗费了精力?我想并没有。尽管我们今天的科学已经摆脱了神学和迷信,但是也不能磨灭那些古老的炼金术士在照明、炸药、实验化学等领域留下的印记。他们甚至为现代科学打下了基础。
当时那些充满“信仰”不知疲倦的探索的术士们并不知道自己的研究对以后的人们有怎样的影响。他们只是在冰山下的一角雕刻属于自己的花纹,漂流在历史的大海中。
那么炼金术与人工智能有什么关系呢?下面由我细细道来。
机器觉醒
是谁先提出让机器去思考这个问题呢?
从古至今都有不少人想象一种机器有人一样的智能,也有不少人去实践,当然也有迷信神学的身影。但是要说真正在计算科学史上留名的第一人,那我们就不得不介绍这样一位传奇的计算科学家艾伦·图灵。
艾伦·麦席森·图灵(1912年6月23日-1954年6月7日)是英国计算机科学家、数学家、逻辑学家、密码分析学家和理论生物学家,他被誉为计算机科学与人工智能之父。二次世界大战期间,(Hut 8)小组,负责德国海军密码分析。 期间图灵设计了一些加速破译德国密码的技术,包括改进波兰战前研制的机器Bombe,一种可以找到恩尼格玛密码机设置的机电机器。 图灵在破译截获的编码信息方面发挥了关键作用,使盟军能够在包括大西洋战役在内的许多重要交战中击败纳粹,并因此帮助赢得了战争。
图灵的传奇是他不仅在科学理论上提出新颖的理论,而且在第二次世界大战期间将计算科学的理论用于解决实际问题,成功破译了德国的密码技术,之后有人估计,图灵的贡献使二战提早结束两年。
当然,我们不需要被一长串的介绍吓到,关于这位大佬在人工智能领域,我们只需要记住它的两个重要贡献:
- 图灵机
- 图灵测试(模仿游戏)
那什么是图灵机和图灵测试? 我不详细展开,只做简要的概括帮助理解。
图灵机
图灵机是图灵于1936年提出的一种将人的计算行为抽象化的数学逻辑机,其更抽象的意义为一种计算模型,可以看作等价于任何有限逻辑数学过程的终极强大逻辑机器。
图灵机就是指一个抽象的机器,它有一条无限长的纸带,纸带分成了一个一个的小方格,每个方格有不同的颜色。有一个机器头在纸带上移来移去。机器头有一组内部状态,还有一些固定的程序。在每个时刻,机器头都要从当前纸带上读入一个方格信息,然后结合自己的内部状态查找程序表,根据程序输出信息到纸带方格上,并转换自己的内部状态,然后进行移动。
关于图灵机存在一个普遍的误解,这关系到图灵当初为论证可计算的数时提出的抽象的“计算机器”,然而我们在详细的了解了图灵机的运作过程之后你就会明白,图灵机实际上是指一台机器的一个特定的运行过程或使用方式,包括对初态和终态的划分,并不是一个特定的机器。
这里有更多详细的内容可以参考:计算机不是只会 “计算”,图灵机也不是一台“机器”、图灵机的运作过程。
这里有些抽象,本就是因为图灵机就是图灵抽象出来的,不必深究,但是这种让机器用于证明计算的方式一直被后来的科学家沿用,影响深远。我们知道了什么是图灵机,再来看看另一个重要问题的提出,其中就包含了图灵测试。
机器能思维吗?
如果他们发现一只鹦鹉可以回答一切问题,我会毫不犹豫宣布它存在智能。— 狄德罗
其实早在1637年,笛卡尔就预言了图灵测试。笛卡尔指出,机器能够与人类交互,但认为这样的机器不能作出适当的反应,但是任何人都可以。因此,笛卡尔借此区分机器与人类。笛卡尔没有考虑到机器语言能力未来能够被克服。其实哲学家们很早就开始探讨这一问题,有唯心和唯物两种观点,但是一直在争论之中。没有人去真正的找到一种证明的方法,直到图灵发表了一篇划时代的论文。
1950年,图灵在 MIND 期刊上发表了一篇题为《计算机器与智能》(Computing machinery and intelligence)的论文。文中他预言了创造出具有真正智能的机器的可能性,并提出了图灵测试用于定义“智能”这一概念,最后对机器能否拥有思维这一问题有异议的不同声音进行了回答。这在当时引起了轰动,关于这篇论文的译文可查看计算机器与智能。
通过译文我们就可以知道,图灵希望通过一种游戏的形式来回答“机器能思考吗?”这个元问题。文中介绍的测试场景是这样的:
这个游戏需要三个人来玩,一个男人(A),一个女人(B)和一个男女皆可的提问者©。
提问者呆在一个与另外两人相隔离的屋子里,游戏的目标是提问者要判断出外面哪个是男人,哪个是女人。
问者用标签X,Y指称外面的两个人,游戏结束时,他要说出“X是A,Y是B”或者“X是B,Y是A”。
提问者C允许向A和B提出下面这样的问题:
- C:X,请告诉我你头发的长度。
现在假如X实际上是A,那么A必须回答。A在游戏中的目标是努力使C做出错误的判断,他的回答可以是:
- 我的头发乌黑发亮,最长的一缕大概九英寸长。
为了排除声音帮助提问者得出结论,问题的答案应该写出来,最好是打出来。理想的安排是,让两个屋子用远程打印通讯,也可以通过中间人传递答案。而B在这个游戏中的任务是努力帮助提问者,她的最优策略可能就是给出正确答案。她可以在她的答案中加入“我是女的,别听他的”这样的话,但是这并不能提供更多的帮助,因为男人A同样也能做出相似的评论。
现在提出这样一个问题,“如果用机器代替A,将会发生什么情况?”同与两个人玩这个游戏相比,提问者判断错误的几率是否发生变化?这个问题取代了原问题“机器能思考吗? ”
图灵测试的意义有多大呢?尽管如今有很多组织、团队宣称自己通过了图灵测试,但是当那个所谓的“智能”出现在我们面前时,实际上我们可以很轻易的知道它并没有自己的思想,也不存在想人一样的智能。
计算机首次通过图灵测试意味着什么?意味着图灵测试该升级了。 –知乎
下面是一个关于2208年图灵测试的漫画:
玩笑的同时,我找到西瓜书的作者南京大学的周志华教授有这样一段话:
“对图灵测试的一个重要反思就是它可能混淆了 cheat human 与 think like human 的能力,做到前者并不需要能做到后者。这催生了替代图灵测试的维诺格拉德测试 。”
显然,图灵测试并不能满足人们对人工智能的幻想,维诺格拉德测试是近几年流行起来的测试,是图灵测试的改进版,旨在找到能够匹配人类表现的最佳系统。但是同样也存在一些漏洞和质疑,不论是什么测试,我们都可以很清楚的知道,真正的智能离我们还很远。
那现在的人工智能发展到什么地步了?什么时候才能有真正的智能出现?
为了解决这些问题,我们不得不先来看一看人工智能的发展。
看累了可以先休息一下再继续阅读,来杯卡布奇诺- 。
人工智能科学简明史
“技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。”——约翰·冯·诺依曼(John von Neumann)
下面我们就进入人工智能科学的起点
黎明
在20世纪40年代初期,许多不同领域的科学家(数学,心理学,工程学,经济学和政治学等)都与图灵一样对“ 机器能否思考?”这一问题很感兴趣,便都想着手去研究、探讨制造人工大脑的可能性。因此最初的人工智能研究是一系列科学进展交汇的产物:
- 神经学研究发现大脑是由神经元组成的电子网络,其激励电平只存在“有”和“无”两种状态,不存在中间状态。
- 维纳的控制论描述了电子网络的控制和稳定性。
- 克劳德·香农提出的信息论则描述了数字信号(即高低电平代表的二进制信号)。
- 图灵的计算理论证明数字信号足以描述任何形式的计算。
这些密切相关的想法暗示了构建电子大脑的可能性。
有的科学家认识到了大脑与电子网络的精密联系,因而用电路来模拟人的神经元,这就产生了早期的人工神经网络:
1951年,马文·明斯基(Marvin Minsky)与Dean Edmonds建立了一个神经网络(SNARC),用于模拟神经信号的传递,在人工智能领域有一定的开创作用。这也被认为是人工智能的起源。
除了模拟人的神经网络,一些科学家思考先通过让机器与人在智力游戏上的对抗来不断迭代,还有一些则想通过对数学定理原理的证明来完善机器能产生逻辑的可能性:
1955年,赫伯特·西蒙(Herbert Simon)、艾伦·纽维尔(Allen Newwell)实现了一个名为“逻辑理论家”(Logic Theorist)的程序,用来模拟人类解决问题,证明了一本大学数学教科书里52个定理的38个。(后来经过改进,52个定理都被证明了。),后来这个程序被称为“史上首个人工智能程序”。
黎明以至,所有从事相关研究的工作者都知道新事物将冉冉升起。
初秋的会议
时间来到1956年,当时科学界对人工智能没有统一的名称命名,但是对人工智能这一类问题的科学研究已经是许多人关注的方向,因此在这样一个特殊的结点,众多科学家齐聚达特茅斯学院召开了著名的达特茅斯会议,这次大会标志着“人工智能”这一概念的诞生。
熊熊炉火
在这次会议之前,其实就已经有了小规模的讨论,但是并不敬人意。其中包含了贝尔实验室的香浓所编的文集,但是香浓对智能并不是很感兴趣:
1953年夏天,麦卡锡和明斯基都在贝尔实验室为香农打工。香农那时的兴趣是图灵机以及是否可用图灵机作为智能活动的理论基础,麦卡锡向香农建议编一本文集,请当时做智能研究的各位大佬贡献文章,这本文集直到1956年才以《自动机研究》(Automata Studies)为名出版,这个书名最后是香农起的,他不想花里胡哨,但麦卡锡认为这没有反映他们的初衷。
贝尔实验室是相当有名的,香浓本人可能对推动人工智能发展这一功绩可能毫不在意,但是确实失去了一个很好的机会。麦卡锡看到自己的想法不能被很好的体现,自然想着筹备后续的计划。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VSvKfL4e-1684836069484)(null)]
那么这场会议的提议者约翰·麦卡锡(J. McCarthy),当时在会议开办前,关于人工智能这个名字的来源还有一个这样的小插曲:
麦卡锡给这个第二年的活动起了个当时看来别出心裁的名字:“人工智能夏季研讨会”(Summer Research Project on Artificial Intelligence)。普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。麦老晚年回忆也承认这个词最早是从别人那里听来的,但记不清是谁。后来英国数学家菲利普.伍德华(Woodward)给《新科学家》杂志写信说他是AI一词的始作俑者,麦卡锡最早是听他说的,因为他1956年曾去MIT交流,见过麦卡锡。但麦卡锡的建议书1955年就开始用“人工智能”了,人老了回忆真不靠谱。当事人除了明斯基之外,都已仙逝,这事恐怕要成悬案了。
盛宴开始
刚刚入秋的新罕布什尔州汉诺威镇,冷气已经席卷,但是科学家们对新事物的诞生的热情不减,会议在众人的支持下顺利召开。达特茅斯研讨会进行了两个月,其中,纽厄尔和西蒙公布的程序“逻辑理论家”(Logic Theorist)引起参会者极大的兴趣。
前面介绍过这个程序模拟人证明符号逻辑定理的思维活动,并成功证明了《数学原理》第2章52个定理中的38个定理,被认为是用计算机探讨人类智力活动的第一个真正成果,也是图灵关于机器可以具有智能这一论断的第一个实际证明。此外,逻辑理论家开创了机器定理证明这一新的学科领域。
下面来一张帅哥海报,哈哈~
图片中的都是参会的各个领域的大佬,份量都是顶级的:
John McCarthy:数学博士,发明Lisp语言、斯坦福大学人工智能实验室的主任、人工智能之父。
Marvin Minsky:数学家,建立了一个神经网络、人工智能框架理论的创立者、人工智能之父。
Claude Shannon:数学家,信息论创始人、引入信息熵。
Ray Solomonoff:机器学习的先驱,算法概率论的创始人,通用概率分布之父,通用归纳推理理论的创建者。
Alan Newell:计算机科学和认知信息学领域的科学家,信息处理语言发明者,写了该语言最早的两个AI程序。
Herbert Simon:计算机领域著名科学家,获得”诺贝尔经济学奖“,计算机领域的“图灵奖”,罕见的通才。
Arthur Samuel:是计算机游戏和人工智能领域的先驱,“机器学习”术语的创造者。
Oliver Selfridge:模式识别的奠基人,后来领导了MAC项目,后演变为麻省理工学院最大的实验室MIT CSAIL。
Nathaniel Rochester:IBM 701总设计师,编写了第一个汇编语言。
会议的内容大致如下:
- 自动计算机(自动指可编程)
- 如何为计算机编程,使其能够使用语言
- 神经网络
- 计算规模理论
- 自我改进(指“机械学习”,和现在的机器学习不同)
- 抽象
- 随机性与创造性
但是会上学者们对“人工智能”这个词并没取得完全共识,很多人认为什么事一加“人工”两字就变味了。纽厄尔和司马贺一直主张用“复杂信息处理”这个词,以至他们发明的语言就叫IPL(Information Processing Language)。他们从某种意义上说偏功能学派,也就是说找到智能的功能不一定非得依靠结构相同或相似。图灵机和递归函数等价,但结构完全不同,所以他们强调“信息处理”,他们俩一开始颇不喜“人工智能”几个字。
但是这并没有阻止“人工智能”这一说法在AI的学者中广为流传,直至第一次人工智能的寒冬,才彻底被学界所知。
"人工智能"一词真正被学界接受要到1965年,德雷弗斯(Hubert Dreyfus)发表了著名的《炼金术与人工智能》报告,这一报告对当时人工智能的研究提出质疑,意图说明这些研究是没有基础的无用功。由于报告标题与内容过于大胆,最初兰德公司仅以备忘录的方式发布了油印版,直至1967年,兰德公司才正式发布了这一报告的印刷版。该报告后来成为兰德公司销量最高的报告之一,在AI学者中广为流传。
人工智能是如何经历第一次发展低潮的,我们稍后再讲。
至于”人工智能“是如何广泛流传的我们已经了解了,现在要具体来看它背后的意义。具体的学术名称是根据定义来确定的,这里我们就不得不深入了解一下,人工智能中的智能,在学者们眼中究竟是什么?
智能元问题
我常常在思索人是如何思考的?是因为有灵魂吗?还是大脑内神经元的交互作用?尚未有明确的答案。但是我曾在《生物心理学》中看到过这样一句话:
如果意识是没有实体的,那它如何去影响物质的身体呢?
这句话似乎表明了一些东西,但仍存很多疑虑,我们可以先把这个问题放在一边。就像我们还没有研究出人类智能的起源,那么我们就不能去定义它。尽管有许多科学家已经发表了自己的看法:
有人从生物学角度定义为“中枢神经系统的功能”,有人从心理学角度定义为“进行抽象思维的能力”,甚至有人同义反复地把它定义为“获得能力的能力”,或者不求甚解地说它“就是智力测验所测量的那种东西”。
这些定义并未被人们所普遍接受。既然连人类智能都无法给出精确的定义,对人工智能也只好众说纷纭了。例如:
- 西蒙认为AI是学会怎样编制计算机程序完成机智的行为,学习人类怎样做这些机智行为。
- 明斯基则认为人工智能一方面帮助人的思考,另一方面使计算机更有用。
- 鉴于图林是用行为来判断机器是否具有智能,麻省理工学院温斯顿(P. Winston)在AI教科书里下定义说:“人工智能就是研究如何使计算机去做过去只有人才能做的智能的工作。”
事实上,我怎么对于什么是人类智能(或者说智力),科学界至今还没有给出令人满意的答案。
难道一切都到此为止了吗?并没有。
关于这个人工智能的元问题,即便没有结果我们当然也可以坐下来,好好研究一晚上、一个星期,甚至一整年。但是人工智能的发展不会因此停下脚步,众多科学家另辟蹊径,让人工智能这颗树苗开枝散叶。
(往后的讲述,我不想通过哲学的派别来介绍人工智能的发展,我觉得这并不利于初学者理解发展的联系,过多的阐述抽象的思想会让初学者有理解上的负担,因此我旨在用具体的技术的发展来讲述人工智能的兴衰。)
AI大发现年代(1956 - 1974)
达特茅斯会议之后,许多研究者被强大的号召力所吸引,那种对未知领域的探索精神也同样鼓舞着众多学者孜孜不倦。这一阶段开发出的程序堪称神奇,从50年代后期到60年代涌现了大批成功的AI程序和新的研究方向。下面列举其中最具影响的几个。
-
专家系统
专家系统是早期人工智能的一个重要分支,它可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。一般来说,专家系统=知识库+推理机,因此专家系统也被称为基于知识的系统,主要用于各个行业的专业领域,距离普通大众是比较远的。
一个专家系统必须具备三要素:
-
领域专家级知识
-
模拟专家思维
-
达到专家级的水平
其中标志专家系统诞生的是最初的化学领域专家DENDRAL:
1965年, 在斯坦福大学化学专家的配合下,费根鲍姆研制的第一个专家系统DENDRAL是化学领域的“专家”。在输入化学分子式和质谱图等信息后,它能通过分析推理决定有机化合物的分子结构,其分析能力已经接近、甚至超过了有关化学专家的水平。该专家系统为AI的发展树立了典范,其意义远远超出了系统本身在实用上创造的价值。在费根鲍姆发表演讲后, 专家系统如同雨后春笋迅速遍及世界各地。
为继承DRNDRAL的衣钵,化学领域判断结构的专家系统大量涌现,有判断蛋白质结构的,有判定原子排列结构的,有推论未知化合物分子结构的,目前已呈汗牛充栋之势。此外,在极其广泛的领域, 人工智能研究者构建了不计其数的“电脑专家” 。 如数学专家MACSYMA,农业专家PLANT,生物专家MOLGEN,地质探矿专家PROSPECTOR,教育专家GUIDON,法律专家LDS,军事专家ACES、ADEPT、ANALYST等系统。
-
-
搜索式推理
搜索式推理是早期的一种代表性的AI领域的推理理论,是众多学者共同的成果。
许多AI程序使用相同的基本算法。为实现一个目标(例如赢得游戏或证明定理),它们一步步地前进,就像在迷宫中寻找出路一般;如果遇到了死胡同则进行回溯。这就是“搜索式推理”。
这个问题的困难就是随着逻辑岔路的增多,问题的规模是成指数级增长的,因此在这一问题的解决上,多个计算科学家从包括几何定理、目标和子目标等思路做出程序或系统来解决问题。
-
机器数学家
这是一个华裔科学家的例子,早期“逻辑理论家”只是完成了一小部分的证明,留存的一大部分证明对当时来说是极其困难的,时隔多年后才有了新的进展。
在纽厄尔和赫伯特·西蒙之后,美籍华人学者、洛克菲勒大学教授王浩在“自动定理证明”上获得了更大的成就。
1959年,王浩用他首创的“王氏算法”,在一台速度不高的IBM704电脑上再次向《数学原理》发起挑战。不到9 分钟,王浩的机器把这本数学史上视为里程碑的著作中全部(350条以上) 的定理,统统证明了一遍。
该书作者、数学大师罗素得知此事后感慨万端,他在信里写到:“我真希望,在怀海特和我浪费了10年的时间用手算来证明这些定理之前,就知道有这种可能。”王浩教授因此被国际上公认为机器定理证明的开拓者之一。
如今这位王浩教授在国内鲜有人知,但却是在当时有着不菲的成绩,足以在人工智能的历史上留下一笔。另外在数学原理证明方面,还有一个有说服力的例子,那就是四色定理的证明,这里不再展开。
-
自然语言
自然语言相对视觉方面是最先有突破的领域,因为语言相对规则有序,很自然的联系到能否用计算机来处理。早期的自然语言处理关注较多的是自动翻译,但是第一代机器翻译系统设计上的粗糙所带来的翻译质量的低劣,最终导致了一些人对机器翻译的研究失去信心。有些人甚至错误地认为机器翻译追求全自动质量目标是不可能实现的。标志着机器翻译的研究就此陷入低谷。
发展较好的是如下的聊天机器人,但也只能做娱乐之用:
Joseph Weizenbaum的ELIZA是第一个聊天机器人,可能也是最有趣的会说英语的程序。与ELIZA“聊天”的用户有时会误以为自己是在和人类,而不是和一个程序,交谈。但是实际上ELIZA根本不知道自己在说什么。点击旁边就可进入到聊天页面与ELIZA聊天吧。
-
感知机
感知器(英语:Perceptron,有的翻译为感知器)是Frank Rosenblatt在1957年就职于康奈尔航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。
这个就非常重要啦,我们先来看一张图:
第一眼看到这张图肯定会有许多不解,我们可以忽略它的符号表示,简单的看图像的样式,我们就可以很容易的联想到一种组成思维必备的元素那就是神经元。事实上,感知器正是用激活与未激活模拟神经元电信号的,简单来说,激活与未激活就要判断看x与权重w带入到wx+b的值是否大于或小于某一阈值,具体如何分类就不详细说明了。
可以说罗森布拉特就是人工神经网络的开山鼻祖,它是最简单的机器学习模型算法。它不仅是神经网络与支持向量机的基础,而且深度学习神经网络依然有感知机的理论思想。
这一时期的学者们普遍给予人工智能极其乐观的发展估计,比较出名的便是那四大预言:
1958年,艾伦·纽厄尔和赫伯特·西蒙:十年之内,数字计算机将成为西洋棋世界冠军。十年之内,数字计算机将发现并证明一个重要的数学定理。
1965年,赫伯特·西蒙:二十年内,机器将能完成人能做到的一切工作。
1967年,马文·闵斯基:一代之内……创造『人工智慧』的问题将获得实质上的解决。
1970年,马文·闵斯基:在三到八年的时间里我们将得到一台具有人类平均智能的机器。
此时对人工智能科学发展的资助可以说是几乎无条件,正执科学家喜出望外的时候,谁曾想凛冬将至…
AI的第一次寒冬(1974 - 1980)
由于前期AI研究者们过于乐观的估计,未能对自己选择的研究课题有正确的判断,使之前的承诺不能兑现,导致大量的资金没有产出。这和后来的日本要研制第五代计算机如出一辙,还是没有吸取教训呀。
1965年12月,休伯特·德雷福斯以兰德公司顾问的身份,发表了编号为P-3244的《人工智能与炼金术》的研究报告,对兰德公司本身主导的人工智能(以下简称AI)研究提出了重大理论挑战,1972年德雷福斯以该报告为基础出版了《计算机不能做什么——人工智能的极限》,该书与1966年美国国家科学院ALPAC报告,1973年英国科学研究理事会的LightHill报告一起,标志着AI发展历史上的第一次寒冬。
哲学家休伯特·L·德雷福斯认为:过去AI领域的蓬勃发展是基于少量的数据,以及基本的定理式的计算,与正真的智能所需的复杂程度不再同一个量级,在计算机上模拟认知过程的尝试遇到了比预期更大的困难。
在许多的质疑声当中还有一个形象的比喻,说获得真正智能的过程好比从地球到月亮,AI现在的发展不过只是在大气层飞罢了。事实上确实如此,由于硬件和一些领域的基本问题尚未解决,人工智能发展遇到了前所未有的瓶颈,主要有以下几点:
- 计算机的运算能力
- 计算复杂性和指数爆炸
- 常识与推理
- 莫拉维克悖论
- 框架和资格问题
再加上**《人工智能与炼金术》**这一研究报告的推动,更多的人们对人工智能发展的前景失去希望,随之而来的就是资金缩减,不少学校也出现了批评的声音,感知机等神经网络算法也因为1969年Minsky和Papert出版的著作《感知器》提出的批评而没落。想查看更多请点击。
如今有人找到休伯特教授,提出了当初的疑问:
**问:**休伯特教授,您好,我们首先想了解的是,您从现象学出发对人工智能提出一些看法,是否起到了作用?
**休伯特:**我对哲学家们能够充当科学技术的批判者这一角色很感兴趣。因此,我作为一名哲学家,曾受政府基金管理部门(比如国防部)的邀请做他们的投资顾问。他们问我,向符号化的人工智能提供资助,是否有价值。我说,“肯定没有价值”。于是,他们停止了对这个领域的资助,然后,人工智能就进入所谓的“寒冬”期。这意味着,没有人再从事这项工作。我不能说,这是我造成的,我只能说,我的看法被当局采纳了,我赢了。
我不禁想说,这老头子说得很有道理。
AI的复兴(1980-1987)
历史总是螺旋上升的,我们不难判断,在长期的销声匿迹之后又会有这新的事物出现。
在80年代,一类名为“专家系统”的AI程序开始为全世界的公司所采纳(这里注意,专家系统早期已经出现,只不过在这一时期有了突破),而“知识处理”成为了主流AI研究的焦点。日本政府在同一年代积极投资AI以促进其第五代计算机工程。80年代早期另一个令人振奋的事件是John Hopfield和David Rumelhart使联结主义重获新生。AI再一次获得了成功。
-
专家系统
“长江后浪推前浪”,1977年,曾是赫伯特·西蒙的研究生、斯坦福大学青年学者费根鲍姆(E.Feigenbaum),在第五届国际人工智能大会上提出了“知识工程”的概念,标志着AI研究从传统的以推理为中心,进入到以知识为中心的新阶段。人工智能重新获得人们的普遍重视,逐步跨进了复兴期。
专家系统在AI大发现年代就已经出现,只不过在第二次浪潮时达到了成熟。
在大学的一次讲演中,费根鲍姆向听众发起挑战:“各位正在研究博弈问题,下棋和逻辑推理都属于博弈。假如你们解决了下棋和逻辑推理,那么博弈问题也就得到了解决,各位正在做的仅此而已。请大家跨入真实世界,努力解决现实世界中的问题吧!”他具体介绍了他们开发的第一个“专家系统”,并提出“知识库”、“知识表达”和“知识工程”等一系列全新的概念。要说明什么是“专家系统”,必须弄清什么是人类“专家”。一个人要成为专家,至少必须掌握某一学科渊博的知识,具有丰富的实践经验,能解决一般人不能够解决的疑难问题。专家的数量和质量标志着一个国家、一个时代的科学水平。
到20世纪70年代中期,专家系统已逐步成熟起来,其观点逐渐被人们接受, 并先后出现了一批卓有成效的专家系统。其中,最具代表性的是肖特立夫等人的MYCIN系统,该系统用于诊断和治疗血液感染及脑炎感染,可给出处方建议。另一个非常成功的专家系统是PROSPCTOR系统,它用于辅助地质学家探测矿藏,是第一个取得明显经济效益的专家系统。
-
Hopfield神经网络
神经网络在1980年代复兴归功于物理学家约翰·霍普菲尔德(Hopfield)。
1982年,霍普菲尔德提出了一种新的神经网络,可以解决一大类模式识别问题,还可以给出一类组合优化问题的近似解。这种神经网络模型后被称为Hopfield神经网络。
Hopfield神经网络是一种递归神经网络,由约翰.霍普菲德在1982年发明。Hopfield网络是一种结合存储系统和二元系统的神经网络。它保证了向局部极小的收敛,但收敛到错误的局部极小值(local minimum),而非全局极小(global minimum)的情况也可能发生。
Hopfield网络也提供了模拟人类记忆的模型。Hopfield网络原理基于Lyapunov稳定性定理和LaSalle不变性定理。对于初次接触Hopfield网络的非控制领域的人来说,Hopfield网络的核心理论晦涩难懂。本文忽略艰深的理论,取而代之的利用应用例子来介绍Hopfield神经网络的工作原理。一旦建立了Hopfield神经网络的总体认识后,再去细究其理论基础(书上及网上博客)就会有高瞻远瞩的感觉,最终完全掌握Hopfield神经网络及其思想。
-
第五代计算机
1981年,日本经济产业省拨款八亿五千万美元支持第五代计算机项目。其目标是造出能够与人对话,翻译语言,解释图像,并且像人一样推理的机器。令“芜杂派”不满的是,他们选用Prolog作为该项目的主要编程语言。
然而,“五代机”的命运是悲壮的。1992年,因最终没能突破关键性的技术难题,无法实现自然语言人机对话、程序自动生成等目标,导致了该计划最后阶段研究的流产,渊一博也不得不重返大学讲坛。也有人认为,“五代机”计划不能算作失败,它在前两个阶段基本上达到了预期目标。 1992年6月,就在“五代机”计划实施整整10年之际,ICOT展示了它研制的五代机原型试制机,由64台处理器实现了并行处理,已初步具备类似人的左脑的先进功能,可以对蛋白质进行高精度分析,已经在基因研究中发挥了作用。
流产也好,失败也罢,历史已经给“五代机”划上了句号,现实迫使人们寻找研制智能电脑新的途径。就在1992年,日本科学家重新开始实施“现实世界计算机”计划,接着研制具有类似于人的右脑功能的计算机,可是以如今逐渐经济低迷的日本估计难以负担巨大的科研费用。
AI的第二次寒冬(1987-1993)
80年代后期到90年代初期这段时间,人工智能在经历了一系列金融挫折后进入了第二个冬天。起初由于苹果公司和IBM生产台式电脑,专家系统和很多硬件公司日渐衰落,后来加之宣传方面的问题以及越来越少的投资者等综合因素再次导致人们对人工智能的关注度下降。
专家系统在备受关注后,也遇到了瓶颈:
- 知识不足
- 解决问题的方法不妥
不久之后很多人也转向失望。这些原理上研究的停滞导致大量财政削减,整个人工智能学科的发展受到了阻碍。
AI稳定期(1993-2011)
此时的学者已经充分的反思了学科发展的缺陷,每一步都谨慎小心。“实现人类水平的智能”这一最初的梦想曾在60年代令全世界的想象力为之着迷,其失败的原因至今仍众说纷纭。各种因素的合力将AI拆分为各自为战的几个子领域,有时候它们甚至会用新名词来掩饰“人工智能”这块被玷污的金字招牌。
-
深蓝
199年俄罗斯国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)输给了人工智能深蓝(Deep Blue),引起了全球轰动。到了这个时代,计算机的处理能力已经有了质的飞跃。
深蓝是美国IBM公司生产的一台超级国际象棋电脑,重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步。“深蓝”输入了一百多年来优秀棋手的对局两百多万局。
深蓝的成功并不是人工智能理论框架的进步,而是由于当时的硬件和算法达到了高度的吻合,研究人员不惜专门研究适用于下棋算法的硬件来达到这样一个效果。但是不能否认,效果是良好的,很多人又对人工智能重拾信心。
-
摩尔定律
摩尔定律是英特尔创始人之一戈登·摩尔的经验之谈,其核心内容为:
集成电路上可以容纳的晶体管数目在大约每经过18个月便会增加一倍。换言之,处理器的性能每隔两年翻一倍。
摩尔定律是内行人摩尔的经验之谈,汉译名为“定律”,但并非自然科学定律,它一定程度揭示了信息技术进步的速度。这样高的计算机迭代速度支撑着如今的计算机运行庞大的深度学习算法,但摩尔定律在现如今已经有些放缓。
-
深层神经网络
功夫不负有心人,2006年Hinton和学生发表了利用RBM编码的深层神经网络的Science Paper:Reducing the Dimensionality of Data with Neural Networks,不过回头来看,这篇paper在当今的实用性并不强,它的更大作用是把神经网络又推回到大家视线中,利用单层的RBM自编码预训练使得深层的神经网络训练变得可能,但那时候Deep learning依然争议很多,最终真正爆发是2012年的ImageNet的夺冠,这是后话。
AI+赋能时代(2011-至今)
这个阶段AI的各个领域都有着快速的发展。
-
大数据
近20年是计算机以及互联网快速普及的时期,不仅几乎所有的企业、政府单位,甚至包括绝大部分的个人都可以在网络上产生数据,大数据时代悄然来临。
麦肯锡全球研究院在一份题为《大数据:创新、竞争和生产力的下一个前沿领域》的报告中估计,到2009年,美国经济所有行业中具有1000名以上员工的公司都至少平均拥有一个200兆兆字节的存储数据。
相信现在的存储数据也已经不是在一个量级上了,就是因为有这样大量的数据,使得机器可以通过神经网络来大量的学习。这在之前的发展时期几乎是不可能的,因此深度学习为什么能引领第三次浪潮也很容易理解了。
-
卷积神经网络
首先介绍一下ImageNet:
ImageNet项目是一个大型可视化数据库设计用于使用可视对象识别软件的研究。该项目已经对超过 1400 万张图像进行了手工注释,以指示所描绘的对象,并且在至少 100 万张图像中,还提供了边界框。这里不得不提一下华人科学家李飞飞,她是这个项目主要的推动者。
这里有一段李飞飞TED的视频感兴趣可以看一下
由此产生的年度竞赛现在被称为 ImageNet 大规模视觉识别挑战赛 (ILSVRC)。ILSVRC 使用仅包含 1000 个图像类别或“类”的“修剪”列表,包括按完整 ImageNet 模式分类的 120 个狗品种中的 90 个。
2010 年代,图像处理取得了巨大进步。2011 年左右,一个好的 ILSVRC 分类 top-5 错误率为 25%。2012 年,一个名为AlexNet的深度卷积神经网络达到了 16%;在接下来的几年里,top-5 错误率下降到几个百分点。虽然 2012 年的突破“结合了之前所有的部分”,但显着的数量改进标志着全行业人工智能热潮的开始。
-
AlphaGo
这个离我们就很近了,我做简单介绍
阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。
围棋,是我们通常一直轻视的一个事物,在现有的计算尺度来看,围棋的变化复杂程度和宇宙种原子变化的复杂程度在同一个量级。这就是为什么当机器能在围棋上战胜人类的时候,会出现如此大的轰动。如同第二次浪潮的开端一样,这无疑又给人工智能提供了一个发展的良好阶段。
不经长舒一口气,人工智能的发展真是曲曲折折。
我们花了很大的功夫终于介绍完了整个发展的历程,过程并没有很详细,还有很多未纳入的成果和研究,只是希望通过一系列的例子来简明的展示整个人工智能的发展这一个复杂的过程。
我们现在回头来看开头的关于智能的问题,人们解决什么是智能了吗?
实际上并没有,将近百年的发展,科学家依然没有对什么是智能这个元问题有很好的解答。
真正的智能,就像文章开头所说的炼金术一样,是当时人们无法理解的原理,但是这不影响前仆后继的研究者们信仰人工智能的诞生。
我们不能说如今的一切努力都是没有用的,因为人工智能切切实实的改变了我们的生活。就像炼金术时代同样发明了火药、和一些其他的技艺改变了人们的生活。
那么强人工智能何时到来?下面为你解答。
强与弱人工智能
事实上,如今我们所接触到的人工智能均属弱人工智能,你可能有些失望。有时候我们会开玩笑说眼前的AI简直是人工智障,但自从AlphaGo在围棋上战胜人类后,许多人就已经望而生畏,如今对于强弱人工智能大致有下面定义:
-
强人工智能
希望研制出达到甚至超越人类智慧水平的人造物,具有心智和意识、能根据自己的意图开展行动。
-
弱人工智能
借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动。
知道了定义,我们再看身边的Siri、语音识别的工具等,确实都是弱人工智能。
人工智能技术现在所取得的进展和成功,是缘于“弱人工智能”而不是“强人工智能”的研究。
正如国际人工智能联合会前主席、牛津大学计算机系主任迈克尔·伍德里奇(Michael Wooldrige)教授在 2016 年 CCF-GAIR 大会¹报告中所说:强人工智能几乎没有进展,甚至「几乎没有严肃的活动」(「little progress, little serious activity」)。
事实上,人工智能国际主流学界所持的目标就是弱人工智能,也少有人致力于强人工智能。那么,这是不是因为强人工智能太难,所以大家退而求其次呢?不然。绝大多数人工智能研究者认为,不能做、不该做!
我们来详细看一下原因:
-
技术迭代的风向标并不是朝着强人工智能
现在人工智能取得的成功包括图像识别、语音识别、实时翻译、棋类游戏等在某一领域的功能,上述的成功有一个共同的特点:它们都是在考虑某种特定类型的智能行为,而不是「完全智能」行为。因此,现有技术即便发展再快、发展再好,也不会直接使得强人工智能成为可能,还是因为元问题。
-
想研究强人工智能,就躲不开元问题
想回答元问题可不是易事,有一种观点认为,我们只要用电路模拟出大脑的神经连接不就会产生智能了吗?然而这种说法从来没有得到过丝毫证明,也不能称其为猜想。因为猜想也应该有一些即便不够完备但尚能显示可能性的证据,例如通过仿制简单细胞,做出了单细胞智能生物。实际上,我们完全有更强烈的理由认为,即便能精确地观察和仿制出神经细胞的行为,也无法还原产生出智能行为。
国际人工智能终身成就奖得主、多伦多大学赫克托·莱韦斯克(Hector J. Levesque)教授在他2017年的新著⁵中所说,即便在最理想的情况下,神经科学家也仅是能获得「目标代码」而已,没有理由认为获得了目标代码就能还原出源代码,因为这样的「反向工程」即便对软件程序来说也几乎是不可能的,更何况神经细胞内部还存在「分布式表示」。
-
即便可能,强人工智能也不应该出现
每门科学都存在着不可触碰的领域,克隆人就是其中之一。如果人类可以研究出正真的智能,那这种智能是否在我们之上就是影响人类命运的巨大威胁。背后的伦理问题、哲学问题难以估量,哈西莫夫的三定律也苍白无力,或许真正的强人工智能还是不要出现为好,这也是许多科学家的共识。
尾言
所以到这里就结束了吗?
回看整个历史,你就会明白,人工智能的路还有很长的路要走,相信随着量子技术等一大批高精尖的研究取得突破,人工智能也会有长足的发展。
ChatGPT是强人工智能吗?在我看来还不是,只能是加强的弱人工智能,还有更多问题需要解决。
我致力于从一个简明的角度和一些有深度的思考来一步步揭开人工智能的面纱,如有不足之处或有讨论交流的想法,还请到评论区留言。你的支持就是我最大的动力!