图灵测试还重要吗?

640?wx_fmt=jpeg

撰文丨Harry Collins(卡迪夫大学社会学教授)

来源丨原理(ID:principia1687)

1

我们正在步入人工智能时代。随着人工智能程序越来越擅长像人类般行事,我们也越来越多地面临这样一个问题:人类的智能是否真有什么特别之处?还是说我们只是另一种类型的机器?有一天,我们所知道和所做的每件事,是否有可能被一个安装在足够复杂的机器人上的复杂计算机程序所复制?

1950年,计算机先驱和战时密码破译者图灵(Alan Turing)做出了最有影响力的尝试来解决这个问题。在一篇具有里程碑意义的论文中,他提出,通过一个简单的测试,就可以消除人类和机器智能之间的模糊性。这个“图灵测试”评估计算机模仿人类的能力,由另一个看不见机器但可以问它书面问题的人来判断。

在过去几年里,有几款人工智能软件宣称已经通过了图灵测试。这使得有些人认为,这个测试太过于容易,以至于无法用作为人工智能的有用判断。但我认为那些软件根本没有通过图灵测试,甚至在可预见的将来都不会通过。但是如果有一天,人工智能真的通过了一个设计恰当的图灵测试,那么我们就有理由开始担心我们的独特地位。

图灵测试实际上一项是针对语言流利性的测试。如果理解得当,它可以揭示的是人类最独特的方面——我们不同的文化。文化的不同导致我们在信仰和行为上表现出巨大的差异,这种差异在动物或大多数机器身上是看不到的。事实上,我们可以在计算机程序中编写这种差异,这正是赋予了计算机模仿人类能力的潜力的程序。在判断模仿的流畅性时,图灵测试让我们可以通过了解计算机在社会环境中对语言的掌握,来判断它们在人类文化中的分享的能力。

2.

图灵测试的基础是“模仿游戏”。假定在游戏中有三个人(如下图):男A、女B,以及询问者C。C独自呆在一个房间中,C与A、B的交流只能通过两个连接A、B所在房间的传真机来完成。C需要通过和A 、B进行对话,判断他们哪个是男人、哪个是女人。A的目的是模仿女人,尽量扰乱C的判断;B的目的是尽量让C相信自己是个女人。

640?wx_fmt=jpeg


现在,如果我们将A换成一台机器,再按照如上规则重新进行游戏,那么C在进行判断时的准确率是否与当A是一个男人时一样?

在1950年那个时期,图灵没能制定出可以让我们来评判今天人工智能软件的必要协议。首先,他建议测试可以在五分钟内完成。但他没有发现,判定者和人类玩家必须共享同一种文化,而计算机必须能试图模仿这种文化。这才导致了有的人声称已经通过了测试,而还有一些人则称测试过于简单,或者应该将物理能力的模拟包含在内。

3

在随着计算机科学家Joseph Weizenbaum在近50年前创建了名为ELIZA的程序后,这一点变得很明显。ELIZA被用来模拟一种被称为罗杰斯式(或以人为中心)的心理治疗师。几个与这个程序接触过的病人都以为它是真实的,从而形成了最早的关于图灵测试已被通过的说法。

但Weizenbaum很清楚,ELIZA实际上就是个笑话。这个设置甚至没有遵循图灵提供的协议,因为病人并不知道它们可能不是真的,也没有一个真正的心理治疗师同时做出反应。此外,在那项测试中并不涉及文化,因为罗杰斯治疗师需要说得尽可能少。而任何有价值的图灵测试都必须让判定者和玩家尽可能像人类一样行事。

基于这是一个关于理解文本的测试,计算机需要根据前百分之几的文字编辑的能力来进行判断。如果提的问题正确,它们可以表明计算机是否理解了其他参与者的物质文化。

4

正确的问题类型可以基于1975年的“Winograd模式”,即两个句子之间的差别仅为一两个单词,但需要具备关于这个世界的知识才能理解。这样的人工智能测试被称为Winograd模式挑战,它于2012年首次提出,是对图灵测试的一种改进。

举个简单的例子,想想下面这句有两个可能结尾的话:“这个奖杯放不进这个手提箱,因为它太小/大了。”如果最后的形容词是“小”,那么“它”指的就是手提箱;如果最后的形容词是“大”,那么“它”指的就是奖杯。

若要能理解这一点,你必须了解奖杯和手提箱的文化和现实世界。你还必须了解奖杯和手提箱的物理世界,以及你是否真的触碰过这些事物。因此,采用了这种方法的图灵测试将会使那些包含了对人工智能模仿人类身体能力的评估的测试变得多余。

这意味着一个基于Winograd模式的图灵测试比简单的五分钟对话更能评估计算机的语言和文化流利性。与此同时,它也设立了一个更高的标准。在2016年的一场相关比赛中,所有的计算机都惨败给了这个测试,没有任何来自大型人工智能公司的竞争者参与这场比赛,因为他们知道自己注定会失败。

如果把图灵测试设置为一系列对人类创造和理解文化的独特能力的严峻考验的话,那么那些所谓的已经通过了图灵测试的说法都变得毫无意义。有了恰当的协议,测试才能达到要求。再一次,图灵又是对的。而且就我们目前的情况来看,并没有明显的途径可以创造出能够充分深入参与人类文化,并通过正确的语言测试的机器。


原文标题为“Turing Test: why it still matters”

原文链接:https://theconversation.com/turing-test-why-it-still-matters-123468,中文内容有增删,仅供参考,一切内容以原文为准。

640?wx_fmt=jpeg

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3942.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图灵测试与人工智能

什么是图灵测试? 在一篇1950年发表的著名论文《Computing Machinery and Intelligence》中,数学家阿兰图灵详细讨论了“机器能否拥有智能?”的问题。有趣的是,作为计算机科学与人工智能领域共同的先驱,图灵成功定义了…

软件测试/测试开发丨ChatGPT训练营来,手把手带你玩转ChatGPT

ChatGPT的出现为测试行业带来了新的机遇和挑战。尽管许多人担心它的强大可能会取代测试人员,但实际上ChatGPT可以成为测试人员的强大助手,提高测试工作的效率和准确性。那么,我们应该如何借助 ChatGPT,让我们的测试工作更高效呢&a…

改bug神器ChatGPT AI测试将取代人工吗?

最近ChatGPT大火,各大论坛中都会出现它的关键词。 机器和人对话本不是什么新鲜事,而ChatGPT上线仅5天,用户数量就超百万,之所以能在短时间吸引到这么多用户尝鲜,是因为它比“人工智障”的AI前辈们聪明多了~ 玩了一会…

一个故意不通过图灵测试的人工智能

一个故意不通过图灵测试的人工智能 人工智能很可能导致人类的永生或者灭绝,而这一切很可能在我们的有生之年发生。 上面这句话不是危言耸听,请耐心的看完本文再发表意见。这篇翻译稿翻译完一共三万五千字,我从上星期开始翻,熬了好…

Google AI真的通过了图灵测试?还是图灵测试已经过时?

作者 | 阿司匹林 出品 | AI科技大本营(公众号ID:rgznai100) 本月初的时候,Google 在一年一度的开发者大会上大秀肌肉,其中最引人瞩目的当属 Google Duplex(全双工)技术。基于这种技术的 Google …

图灵测试是人工智能的标准吗?

来源:赛先生 编者按 科学就是一个可以被证伪的学说。任何一个科学论述,都要能够被实验检验。比如说,要科学地解释定义什么是自我意识,其本质就是设计一个实验。比如观察动物在镜子里看到自己时候的行为,是寻找镜子后面…

ChatGPT到底有多聪明?我测试了ChatGPT的数学能力

来源:AI前线 译者:马可薇 人人都听说过最新,也是最复杂的聊天机器人 chatGPT。而众所周知,它在英文文学等“软话题”方面甚是熟练,所以我决定测试它在数学这类“硬话题”方面的表现。你可能不知道,但我是…

什么是图灵测试?

图灵测试一词来源于计算机科学和密码学的先驱阿兰麦席森图灵写于1950年的一篇论文《计算机器与智能》。阿兰麦席森图灵1950年设计出这个测试,其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为…

高校教师 | ChatGPT的23种用法

近日,ChatGPT引发舆论风暴,火遍全球,甚至隔着“防火墙”引发了中国民间的应用热潮。 作为一款生成式人工智能软件,ChatGPT可以就任何议题生成文本,完成包括回答问题,撰写文章、论文、诗歌在内的多种工作。各…

在IDE中使用Bito - 一个不需要VPN就可以使用的chatgpt

文章目录 在IDE中使用Bito什么是Bito为什么要使用BitoBito可以做什么如何在IDE中安装Bito使用Bito 在IDE中使用Bito 什么是Bito 用他自己的介绍就是: Bito’s AI helps developers dramatically accelerate their impact. It’s a Swiss Army knife of capabilit…

如何使用 AWS 和 ChatGPT 创建最智能的多语言虚拟助手

上周ChatGPT发布了,每个人都在尝试令人惊奇的事情。我也开始使用它并想尝试它如何使用AWS的AI 服务进行集成,结果非常棒! 在这篇文章中,我将逐步解释我是如何创建这个项目的,这样你也可以做到! 最重要的是…

ChatGPT编程能力实证研究

CODEWISDOM ChatGPT编程能力实证研究 刘子夕 冯洋1 陈碧欢2 娄一翎 彭鑫 陈振宇 1 fengyangnju.edu.cn; 2 bhchenfudan.edu.cn 南京大学 计算机软件新技术国家重点实验室 复旦大学 计算机科学技术学院 摘要 近年来,大型语言模型(LLM)得到了快…

chatgpt赋能python:Python如何帮你更聪明地买股票

Python 如何帮你更聪明地买股票 股票市场是一场风险与机遇并存的游戏,每位投资者都希望能够购买到高品质的股票并赚取稳定的利润。而借助 Python 编程语言,你可以更加轻松地分析市场趋势,提高股票投资的准确性和盈利能力。 一、数据分析与预…

谷歌版 ChatGPT 翻车!市值暴跌七千亿

01 前言 最近微软出品的 ChatGPT 确实引起很大的关注呀,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,今天带大家来看看微谷的第一波较量。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如…

基于ChatGPT完美替代 Grammarly润色和语法纠错的免费插件!

OpenAI Polisher Bob Plugin 简介 ChatGPT 向我们展示了 GPT 模型的伟大之处,所以我使用 ChatGPT 的 API 实现了这个用来给语言润色和语法纠错的 Bob 插件,效果拔群!完美替代 Grammarly! 使用截图 使用方法 安装 Bob (版本 > 0.50)下载此插…

ChatGPT Prompting开发实战(一)

第7章 ChatGPT Prompting开发实战 7.1 Prompting在LangChain框架中的应用 本节跟大家讲提示工程(Prompt Engineering),主要基于工业级的源码以及具体的项目,无论是工程人员,还是不具有技术背景的人员,大家多少都听说过提示词,或者频繁使用过,简单而言,当我们使用OpenA…

ChatGPT prompt指令大全

ChatGPT prompt指令大全 更多Prompt自动使用,可以在chrome插件中搜索 WebChatGPT,没有账号的,可以拉到文章最下面。 目录 担任雅思写作考官 写小说 充当 Linux 终端 充当英语翻译和改进者 充当论文润色者(拿摘要部分举例&am…

火爆出圈的OpenAI模型ChatGPT体验

1、ChatGPT简要介绍 ChatGPT是一种高效的语言模型,全称为"聊天式自动回复生成技术"(Chat-based Automatic Reply Generation Technology),用于预测人类语言的后续内容。它是基于OpenAI的GPT-3模型构建的,具…

每日一个 ChatGPT 使用小技巧系列之1 - 给出提纲,让 ChatGPT 帮你写作

我以前写过一篇文章,介绍了我日常工作和学习中使用 ChatGPT 的一些技巧: 与其整天担心 AI 会取代程序员,不如先让 AI 帮助自己变得更强大 为代码生成对应的单元测试代码 利用 ChatGPT 帮助自己研读经典框架的源代码 代码重构和性能优化 阅读…

ChatGPT最新研究:可能影响80%工作岗位,收入越高影响越大

Datawhale分享 最新:ChatGPT影响,来源:机器之心 ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。 改变经济、劳动力和教育环境 和很多专家一样,Altman 担心人工智能技术的强大能力会制造过多虚假信…