(转)图灵测试与人工智能

什么是图灵测试?

在一篇1950年发表的著名论文《Computing Machinery and Intelligence》中,数学家阿兰·图灵详细讨论了“机器能否拥有智能?”的问题。有趣的是,作为计算机科学与人工智能领域共同的先驱,图灵成功定义了什么是机器,但却不能定义什么是智能。正因如此,图灵设计了一个后人称为图灵测试的实验。图灵测试的核心想法是要求计算机在没有直接物理接触的情况下接受人类的询问,并尽可能把自己伪装成人类。如果“足够多”的询问者在“足够长”的时间里无法以“足够高”的正确率辨别被询问者是机器还是人类,我们就认为这个计算机通过了图灵测试。图灵把他设计的测试看作人工智能的一个充分条件,主张认为通过图灵测试的计算机应该被看作是拥有智能的。

 

具体就操作层面来说,图灵在他的论文原文中是这样定义图灵测试的[2]:

“我们称下面这个问题为“模仿游戏”。游戏参与者包括一个男人,一个女人,以及一个任意性别的询问者。询问者与另两个人待在不同的房间里,并通过打字的方式与他们交流,以确保询问者不能通过声音和笔迹区分二者。两位被询问者分别用X和Y表示,询问者事先只知道X和Y中有且仅有一位女性,而询问的目标是正确分辨X和Y中哪一位是女性。另一方面,两位被询问者X和Y的目标都是试图让询问者认为自己是女性。也就是说,男性被询问者需要把自己伪装成女性,而女性被询问者需要努力自证。现在我们问:如果我们把“模仿游戏”中的男性被询问者换成计算机,结果会怎样?相比人类男性,计算机能否使询问者更容易产生误判?”

这里有几个细节值得注意,它们在很大程度上决定了图灵测试的有效性。

 

(1)首先,图灵测试中询问者与被询问者之间进行的并不是普通的日常聊天,询问者的问题是以身份辨别为目的。这种情况下询问者通常不会花费时间寒暄和拉家常,而是会开门见山地说“为了证明你的身份,请配合我回答下面问题…”。事实上,目前网络上聊天机器人有时能够以假乱真,往往是采用了在用户在不知情的情况下尽量把谈话引到没有鉴别力的话题上的策略(例如“谈谈你自己吧”)。

 

(2)其次,图灵测试中人类被询问者的参与是必不可少的,她的存在是为了防止计算机采取“消极自证”的策略,例如拒绝正面回答问题,或者答非所问闪烁其词,就像一个真正的不合作的人所做的一样。在这种情况下,另一个积极自证的人类被询问者可以保证询问者总是有足够的信息做出判断。类似的情况也适用于当计算机试图模仿正在牙牙学语的幼童或头脑不清的病人等“特殊人类”时。

 

(3)另外,图灵测试的原则是要求询问的交互方式本身不能泄露被询问者的物理特征。在图灵所处的年代这几乎只能全部通过基于文本的自然语言来完成,因此图灵限定测试双方基于打字进行交流。但在多媒体技术发达的今天,视频、音频、图片等等“虚拟内容”都可以通过计算机以非物理接触的形式呈现(这当然是60年前的图灵不能预知的!)。因此,允许询问者在图灵测试中使用多媒体内容作为辅助材料进行提问(例如“请告诉我这个视频的笑点在哪儿”)似乎是对原始图灵测试定义的一个自然合理的补充[3]。

 

(4)最后,今天一般意义上理解的图灵测试不再严格区分人类参与者的性别。通常我们允许人类被询问者是任意性别,而询问者的目标也随之变成辨别哪一位被询问者是人类。

 

除此之外,完成一次具体的图灵测试还要注意很多操作细节,例如多少人参与测试算“足够多”,多长的讯问时间算“足够长”,多高的辨别正确率算“足够高”,如何挑选人类询问者和被询问者才能代表“人类”的辨别和自证能力,等等。由于图灵测试的巨大影响力,几十年来一直有人尝试挑战它,不时就会传出“某某计算机程序成功通过图灵测试”的消息。我想,正是对于意义深远的实验,我们才理应格外审慎。只有在仔细检查上面所列和其他一些重要细节之后,我们才能对其结果的有效性做出正确判断。类似几年前“超光速实验”那样的闹剧应该尽量避免。

 

图灵测试与人工智能是什么关系?

如果有一天机器真的通过了图灵测试,这到底意味着什么?这个问题涉及到图灵测试与人工智能的关系。的确,几乎所有有关人工智能的书籍都会谈到图灵测试,但一个经常被误解的地方是,图灵测试是作为一个人工智能的充分条件被提出的,它本身并没有,也从未试图定义智能的范畴。这一点图灵在他的论文里写的很清楚:

“机器能否拥有智能,为了回答这个问题我们应该首先定义‘机器’和‘智能’。一种可能性是根据大多数普通人的日常理解去定义这两个概念,但这样做是危险的。… … 在这里我并不打算定义这两个概念,而是转而考虑另一个问题,它与原问题密切相关,同时可以被更清楚无疑地表达。… …(图灵测试的描述)… …可能有人会说这项测试对机器而言过于严格——毕竟人类也无法反过来成功伪装成机器,这只需检查算术的速度和正确度即可辨别。难道被认为拥有智能的机器就不能表现出和人类不同的行为么?这是一个很有力的反对意见,但至少不管怎样,假如我们有能力制造出一个可以成功通过测试的机器的话,也就无需为这个反对意见烦恼了。”

 

借助集合的概念我们可以更容易地理解图灵测试与人工智能的关系。如图1所示,“所有智能行为”对应的集合和“所有人类行为”对应的集合既有交集又互有不同。在全部智能行为中有一些是人类靠自身无法做到的(比如计算出国际象棋中白棋是否必胜),但无论如何人类都被认为是有智能的,因此,在各方面都能达到“人类水平”— 也就是完成两个集合的交集部分—就应该被认作是“拥有智能”的。[4]另一方面,人类行为并不总是和智能相关。图灵测试要求机器全面模拟“所有人类行为”,其中既包括了两个集合的交集,也包括了人类的“非智能”行为,因此通过图灵测试是 “拥有智能”的一个有效的充分条件。

 

图灵本人对机器能够通过他的测试相当乐观,他大胆预测到2000年左右时,一台拥有1GB内存或类似规模的计算机可以在接受普通人5分钟的询问之后,使他们的判断正确率不超过70%”。然而直到2014年的今天,仍然没有任何机器被公认为已经通过图灵测试。有趣的是,这一失败事实反而还带来了一个我们再熟悉不过的应用 - 图形验证码。(每一次输入验证码都是一次图灵测试!)

 

图灵测试问题的进展缓慢与目前人工智能学界对图灵测试这个“充分条件”的研究热情不高有关。[5]这一部分上由于主流人工智能研究与图灵测试所追求的目标之间存在差异,同时也因为图灵测试本身难度巨大。下面我们通过人工智能研究的三个重要特征来进一步讨论图灵测试与人工智能之间的异同,以及为什么图灵测试不大可能在短时间内解决。

 

一、主流人工智能研究关注智能体的外部行为,而不是产生该行为的内部过程

 

在这方面图灵测试的思想和人工智能学界是完全一致的。只关注外部行为是一个典型的功能主义/行为主义风格的做法,事实上这也是一个人工智能经常被外界所指摘的地方。严格的“主观思考”定义要求智能体具有自我意识。但一方面,从严格的科学方法讲,我们甚至并不真的确定是否有客观证据证实 “意识”的存在。更重要的是,人们发现智能行为和主观思考完全可以被看作是两个独立的问题来考虑,二者并不必要纠缠在一起。具体来说,可以从数学上证明任何一台数字计算机的行为都可以用查表的方式机械地模拟。假设我们真的制造了一台具有“意识”的机器A,我们总可以制造另一台机器B以查表的方式来机械地模拟A的内部运行,问题是B是否具有意识?如果每一台“拥有”意识的机器都能被一台B这样的“机械查表式”的机器所模拟,那么我们就无法通过外部行为来断定一个机器在内部上是真的在“思考”还是只是在模拟“思考”的过程,[6] 因此“是否拥有意识”从行为主义的角度也就成了相对独立的“另外一个问题”。同时,“拥有意识的机器总可以被没有意识的机器模拟”也说明“拥有意识”并不能给机器带来额外的“行为能力”,这进一步降低了“拥有意识”在行为主义者眼中的重要性。

 

基于外部行为与主观思考之间的独立性,主流人工智能研究和图灵测试把实现外部行为作为唯一目标,这样的观点被称为弱人工智能观点。我们知道每个学科的研究都基于一个“基本假设”展开。比如支撑物理研究的基本假设是“万物运转都受一套普适的、永恒的规律所约束”,而物理研究的目的“只是”找出这套规律是什么。类似的,“弱人工智能假设”(weak AI hypothesis) 认为经过良好设计的计算机可以表现出不低于人类智能水平的外部智能行为。可以说主流人工智能研究是以弱人工智能假设为出发点,研究如何实现这样一个计算机。

 

二、主流人工智能研究关注如何模拟人类的纯粹智能活动,而不是全部脑力活动

 

就像前面提到的,人类的脑力活动 (mental process) 不仅包括智能,同时具有情感、审美能力、性格缺陷、社会文化习惯等等一系列“非智力特征”。因为图灵测试的模仿对象是普通人,事实上它对这些非智力特征的要求甚至可能还高过对纯粹智力的要求——作为一个普通人,他/她完全有可能对国际象棋一窍不通,但却不大可能从照片分辨不出美女/帅哥来。

 

当然,“非智力特征”的引入本身并不妨碍图灵测试成为一个有效的充分条件,但除非我们假设所有这些“非智力特征”都是拥有智能之后的必然产物,否则不得不承认图灵测试确实在机器智能这个核心问题之外加入了过多充满挑战却又显得不那么相关的因素。就像《人工智能》这本经典教科书里写到的,“航空领域试图制造性能良好的飞机,而不是使飞机飞得如此像鸽子以至于可以骗过其他鸽子。”人工智能研究确实应该更多关注与智力活动相关的抽象功能和一般原则。

 

三、人工智能的最终目标是能够综合适应“人类所在环境”的单一智能体,而不是专门解决特定数学问题的算法

 

在这一点上图灵测试与人工智能研究的最终目标也是一致的,只不过现有的人工智能水平离这一目标还相去甚远。事实上“综合模拟人类的智力活动”正是人工智能区别于其他计算机科学分支的地方。我们通过比较人工智能软件与传统软件来说明这一点。首先从最广义的角度看,传统软件也应属于人工智能的范畴:实际上很多早期的计算机科学家,比如图灵,就是以人工智能为动力展开对计算机科学的研究。所谓“计算”本来就是诸多人类智能活动中的一种。一个从未接触过计算机的人也许很难说清 “从一个数列中找出所有素数” 和“从一张照片中找出一只狗”哪个更有资格代表“智能”(前者属于传统软件范畴,后者属于传统人工智能范畴)。但另一方面,传统软件并不代表人工智能的全部内涵。粗略讲,我们可以认为传统软件对应了这样一类“计算问题”,它们的共同特点是,问题本身是用一个算法(或非构造性的数学描述)来描述的,而对它们的研究主要关注在如何找到更好的算法。[7]而我们称之为“人工智能问题”的问题可以理解为另一类“计算问题”,它们的共同特点是无法用算法或从数学上对问题进行精确定义,这些问题的“正确答案”从本质上取决于我们人在面对这类问题时如何反应。对于人工智能问题,我们可以基于数学模型或计算模型来设计算法,但问题的本质并不是数学的。

 

通用人工智能(Artificial General Intelligence)基于弱人工智能假设,以全面模拟人类的所有智力行为为目标。注意到图灵测试作为一个充分条件,是不可能在通用人工智能真正实现之前得到解决的。另一方面,可以说现有每一个AI分支的成功都是通过图灵测试的必要条件,而它们中的大部分还没有达到“人类水平”。因为我们不可能穷尽所有人类智能行为,必须依赖有限个具有通用性的模型和算法来实现通用智能。目前人们仍然只能基于一些简单初等的模型来设计学习、推理、和规划算法。这些AI分支的研究都默认基于针对自己领域问题的弱人工智能假设,而支撑这些子领域研究的动力往往是其巨大的社会实用价值。它们固然已经在很多具体应用领域成绩斐然,但看起来离图灵测试所要求的水平仍然相差甚远。 

图灵测试与人工智能
图灵测试与人工智能
图4:一排包含素数的数列和一张包含狗的照片

 

(本文部分摘录自发表于《NEWTON科学世界》2014年第3期的文章“什么是人工智能?”。文中图片部分引自互联网。)



[1] http://www.bbc.com/news/technology-27762088

[2] 为清楚起见,这段摘录并非逐字翻译,且语句顺序也稍有调整,具体可参考原文第一节。

[3] 参见Total Turing Test及相关工作。

[4] 但反之未必,不一定非要达到人类水平才能被认作是智能的。

[5]一般认为人工智能学科正式成型于1956年的一次著名的研讨会前后,也就是说图灵测试实际上提出于人工智能领域诞生之前。正如Stuart Russell和Peter Norvig在一本人工智能的经典教科书中所写,在随后的60年间,整体而言“人工智能研究者们在图灵测试方面只投入了很少的精力”。

[6]一个有趣的不同是,人类研究“动物意识”(包括人类自身)的方法恰恰是通过观察动物在特定环境下的外在行为。这背后隐含的假设是我们相信没有意识的动物并不会“有意识地”装出一副有意识的样子(当然!),而这一假设对机器(或者机器的制造者)而言却并不一定成立。

[7]需要注明是,对传统软件的研发同样也并不是计算机科学的全部内涵,就像“计算机”的概念远远不只是“电子硬件”。计算机科学的根本问题是“什么是计算”。而人工智能,作为计算机科学的重要分支,可以认为主要研究“智能是不是计算”的问题。

 

转载于:https://www.cnblogs.com/yifangtongxing/p/5077000.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22022.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

73年后,人工智能通过了图灵测试

73年后,人工智能通过了图灵测试! 意味着进化加速… 人工智能咋起源? 又会走向何方? 趣讲大白话:知道未来有多远,就要知道过去有多久 【趣讲信息科技112期】 **************************** 1950年&#xff1…

计算机首次通过图灵测试

今天图灵测试 2014 的举办方英国雷丁大学发布新闻稿,宣称俄罗斯人弗拉基米尔维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试。如果这一结论获得确认,那么这将…

重磅!图灵奖,公布!

来源:青塔 3月22日,现年76岁的以太网发明者、3Com公司创始人鲍勃梅特卡夫(Bob Metcalfe)荣获2022年图灵奖,这一计算机科学的最高荣誉,表彰他为引领大众进入超级连接时代所做的贡献。 鲍勃梅特卡夫发明的以太…

Hinton等6位图灵奖得主、百余位顶级学者邀你加入群聊,共话人工智能下一个十年...

Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的…

面对面的办公室——纪念艾伦•图灵百年诞辰 1912.6.23-2012.6.23

一、左边的办公室 冯诺伊曼教授每年换一部新凯迪拉克。早上十点,他把爱车停在帕尔玛物理实验室门口,神采奕奕地走进隔壁数学系的办公室。那时候普林斯顿高等研究院才刚成立,和数学系挤在一幢叫作Fine Hall的楼—— “还不错的楼”。冯诺伊曼教…

科普两个著名人工智能思想实验:图灵测试和中文房间

导读:人工智能的字典定义是机器模仿人类智能行为的能力。那么如何定义智能? 作者:道格罗斯(Doug Rose) 来源:大数据DT(ID:hzdashuju) 01 图灵测试 艾伦图灵是一位英国计算…

chatgpt赋能python:Python如何找出超链接的Xpath

Python如何找出超链接的Xpath 1. 什么是Xpath? Xpath是XML Path Language的缩写,意为XML路径语言,是一种用来定位XML文档中节点的语言。Xpath通过路径表达式来选取XML文档中的节点或者节点集。在Python中,使用lxml库可以解析XML…

弘玑Cyclone与RPA中国联合主办「第三届中国RPA+AI开发者大赛」

近日,弘玑Cyclone与RPA中国达成合作,双方将以联合主办「第三届中国RPAAI开发者大赛」的形式,共同推动RPA与AI技术融合运用的发展和普及,为开发者们创造一个更加开放包容、充满活力的行业新生态。 在RPA与AI技术的融合发展上&#…

大江南北十三省,蓬门今始为君开,数字政府建设“实在”必行

引言: 推动数字中国建设是实现中国式数字化进程、抢占未来发展制高点的关键。为全面推动数字化转型在政府领域的纵深发展,各地领导不断进行数字化探索。其中,数字员工凭借流动的数据、流畅的体验,百姓少跑腿、数据多跑路特点&…

RPA开发者要失业?用ChatGPT写RPA脚本?附带亲测案例

学RPA、用RPA、考RPA,尽在 RPA学习天地(https://www.rpa-learning.com/) RPA开发者要失业?用ChatGPT写RPA脚本?附带亲测案例 随着人工智能技术的不断发展,AI已经开始在多个领域发挥着越来越重要的作用。从…

XAMPP下载速度太慢了

(先啰嗦一些废话)这两天突然想学php,于是就着手安装配置PHP的开发环境,由于是第一次安装,踩了不少的坑。这里就不一一说了。 解决方法: 选择不同的下载节点下载一个下载器试试(我用的NDM&…

3分钟搭建ChatGPT图形化问答应用

将公众号设置为星标🌟,第一时间接收到文章推送 检查 Python 版本 image-20230323233753576 安装 langflow 通过 pip 安装 pip install langflow image-20230323232855642 在安装过程中出现了如下错误: image-20230323234104800 同时&#xff…

微软VS中国云厂商,下一步应该走向哪?

透过微软当下营收模型,或许能给在迷雾中的中国云厂商带来一些新的启示。这种启示不单在云计算本身,也更在中国云厂商的当下和未来路径。 作者|斗斗 编辑|皮爷 出品|产业家 后退一步。这是过去两年市场对中国云厂商的普遍印象。 这种后退更多的在集成…

硅谷上市公司 Confluent 饶军:我能开公司,所有人都有机会

注: 本文是音频节选后保留的大约 1/3 的内容,并有少量次序调整和及很少量文字添加来帮助阅读。 ▲文字有删减和整理,欢迎在小宇宙、喜马拉雅、Apple Podcasts、Spotify等各大音频平台收听完整音频 大厂十年,让我选择更多 徐老师&a…

除了SVN,大家都用什么软件来做文档的版本管理呢?

整理全网推荐最高的10款文档版本管理工具/软件,除此以外还将介绍三种使用SVN控制版本的方式。 使用何种方式进行文档版本管理完全取决于需求,无论是SVN还是专业的文档管理产品,能够广泛流行就必然有其可取之处,鄙视是源于需求和方…

除了Confluence,还有哪些好用的文档管理软件?测评

在早期,文档管理软件主要是为了将企业内部海量的电子文档集中存储、管理,通过设置共享权限进行内部员工的文档分发,有些甚至可能要提供API接口,便于将ERP、OA等系统的文档纳入其中,形成企业文档管理中心。 而随着时间的…

视频虚拟主播怎们搞?体验报告全记录;一图掌握SD应用精髓;Chat效率工具大汇总;品牌营销进入AI时代 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『Stable Diffusion界面解读』一张图掌握SD使用精髓 ShowMeAI资源编号:No.R052 图片可能被平台压缩,加入知识星…

一二线城市有哪些值得加入的互联网公司?

点击上方“朱小厮的博客”,选择“设为星标” 后台回复"书",获取 后台回复“k8s”,可领取k8s资料 网络流传了一份一二线城市知名的互联网(或者说IT相关)公司名单,比较全,本文新增了长沙…

公众号900篇文章分类和索引

杂货铺的文章,已经积累到900篇了,写第一篇文章时,没想太多,就是纯粹的兴趣,无论是技术,还是生活,都会有些值得用文字记录的,在让自己温故知新的同时,如果能够帮助一些朋友…

阿里首创7天全薪陪伴假,员工关怀卷起来了?

2021年的下半年,我们沉浸在大厂“反内卷”的热搜中,前有字节取消“996”,后有腾讯提前退休方案,眼瞅着年底了,阿里内部再次升级员工关怀制度——推7天全薪陪伴假! 据悉,早在今年7月&#xff0c…