什么是图灵测试?

图灵测试一词来源于计算机科学和密码学的先驱阿兰·麦席森·图灵写于1950年的一篇论文《计算机器与智能》。阿兰·麦席森·图灵1950年设计出这个测试,其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。

2014年6月7日是计算机科学之父阿兰·图灵(Alan Turing)逝世60周年纪念日。这一天,在英国皇家学会举行的"2014图灵测试"大会上,聊天程序"尤金·古斯特曼"(Eugene Goostman)首次"通过"了图灵测试。

1.简要介绍

图灵测试是测试人在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。问过一些问题后,如果被测试者超过30%的答复不能使测试人确认出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类智能。图灵测试 2014 的举办方英国雷丁大学发布新闻稿,宣称俄罗斯人弗拉基米尔·维西罗夫(Vladimir Veselov)创立的人工智能软件尤金·古斯特曼(Eugene Goostman)通过了图灵测试。如果这一结论获得确认,那么这将是人工智能乃至于计算机史上的一个里程碑事件。
在这里插入图片描述
2.产生背景

1950年,图灵来到曼彻斯特大学任教,同时还担任该大学自动计算机项目的负责人。就在这一年的十月,他又发表了另一篇题为《机器能思考吗?》的论文,成为划时代之作。也正是这篇文章,为图灵赢得了一顶桂冠——“人工智能之父”。在这篇论文里,图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调,做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义,由此提出一假想:即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。当时全世界只有几台电脑,其他几乎所有计算机根本无法通过这一测试。但图灵预言,在20世纪末,一定会有电脑通过“图灵测试”。目前为止还没有电脑通过图灵测试。美国科学家兼慈善家休·勒布纳20世纪90年代初设立人工智能年度比赛,把图灵的设想付诸实践.比赛分为金、银、铜三等奖。

要分辨一个想法是“自创”的思想还是精心设计的“模仿”是非常难的,任何自创思想的证据都可以被否决。图灵试图解决长久以来关于如何定义思考的哲学争论,他提出一个虽然主观但可操作的标准:如果一台电脑表现(act)、反应(react)和互相作用(interact)都和有意识的个体一样,那么它就应该被认为是有意识的。消除人类心中的偏见,图灵设计了一种“模仿游戏”即图灵测试:远处的人类测试者在一段规定的时间内,根据两个实体对他提出的各种问题的反应来判断是人类还是电脑。通过一系列这样的测试,从电脑被误判断为人的几率就可以测出电脑智能的成功程度。

图灵预言,到2000年将会出现足够好的电脑,能够在不超过7成人的长达5分钟的提问中全部回答正确。成功通过图灵测试的电脑还没有,但已有电脑在测试中“骗”过了测试者。最终将会出现能够骗过大多数人的电脑吗?前几年IBM公司研制的计算机“深蓝”与国际象棋世界冠军卡斯帕罗夫进行的那场人机大战,最终以“深蓝”战胜卡斯帕罗夫而宣告结束,让我们不得不佩服图灵的天才预言。

现代计算机之父冯·诺依曼[iv]生前曾多次谦虚地说:如果不考虑查尔斯·巴贝奇[v]等人早先提出的有关思想,现代计算机的概念当属于阿兰·图灵。冯·诺依曼能把“计算机之父”的桂冠戴在比自己小10岁的图灵头上,足见图灵对计算机科学影响之巨大。

3.现今发展
尤金·古斯特曼(Eugene Goostman)是由俄罗斯人 Vladimir Veselov(现居美国)开发的智能软件,模仿的是一位 13 岁的男孩。在图灵测试 2012 上,尤金就获得了第一名,当时的成绩是 29.2%,距离通过图灵测试仅一步之遥。而在2014年6月7日(也是1954年图灵去世的那天)举行的共有 5 台超级计算机参赛的图灵测试竞赛上,尤金设法让测试人相信被测试者 33% 的答复为人类所为。这意味着这台超级计算机通过了图灵测试。[1]

雷丁大学的客座教授 Kevin Warwick 说,尽管此前曾有人声称图灵测试已经得到通过,但是相比之下,这次活动的标准是最为严格的,没有对问题做任何预设。因此,他们自豪地宣布图灵测试首次获得通过。

4.提出原因
(1)问题
一种测试机器是不是具备人类智能的方法。如果说有一台电脑,其运算速度非常快、记忆容量和逻辑单元的数目也超过了人脑,而且还为这台电脑编写了许多智能化的程序,并提供了合适种类的大量数据,使这台电脑能够做一些人性化的事情,如简单地听或说,回答某些问题等。那么,我们是否就能说这台机器具有思维能力了呢?或者说,我们怎样才能判断一台机器是否具存了思维能力呢?

(2)研发
为了检验一台机器是否能合情理地被说成在思想,人工智能的始祖阿兰·图灵提出了一种称作图灵试验的方法。此原则说:被测试的有一个人,另一个是声称自己有人类智力的机器。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都可以。问过一些问题后,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。还没有一台机器能够通过图灵测试,也就是说,计算机的智力与人类相比还差得远呢。比如自动聊天机器人。同时图灵试验还存在一个问题,如果一个机器具备了“类智能”运算能力,那么通过图灵试验的时间会延长,那么多长时间合适呢,这也是后继科研人员正在研究的问题。
具体就操作层面来说,图灵在他的论文原文中是这样定义图灵测试的[2]:
(3)“模仿游戏
“我们称下面这个问题为“模仿游戏”。游戏参与者包括一个男人,一个女人,以及一个任意性别的询问者。询问者与另两个人待在不同的房间里,并通过打字的方式与他们交流,以确保询问者不能通过声音和笔迹区分二者。两位被询问者分别用X和Y表示,询问者事先只知道X和Y中有且仅有一位女性,而询问的目标是正确分辨X和Y中哪一位是女性。另一方面,两位被询问者X和Y的目标都是试图让询问者认为自己是女性。也就是说,男性被询问者需要把自己伪装成女性,而女性被询问者需要努力自证。现在我们问:如果我们把“模仿游戏”中的男性被询问者换成计算机,结果会怎样?相比人类男性,计算机能否使询问者更容易产生误判?”
在这里插入图片描述

这里有几个细节值得注意,它们在很大程度上决定了图灵测试的有效性。

(1)首先,图灵测试中询问者与被询问者之间进行的并不是普通的日常聊天,询问者的问题是以身份辨别为目的。这种情况下询问者通常不会花费时间寒暄和拉家常,而是会开门见山地说“为了证明你的身份,请配合我回答下面问题…”。事实上,目前网络上聊天机器人有时能够以假乱真,往往是采用了在用户在不知情的情况下尽量把谈话引到没有鉴别力的话题上的策略(例如“谈谈你自己吧”)。

(2)其次,图灵测试中人类被询问者的参与是必不可少的,她的存在是为了防止计算机采取“消极自证”的策略,例如拒绝正面回答问题,或者答非所问闪烁其词,就像一个真正的不合作的人所做的一样。在这种情况下,另一个积极自证的人类被询问者可以保证询问者总是有足够的信息做出判断。类似的情况也适用于当计算机试图模仿正在牙牙学语的幼童或头脑不清的病人等“特殊人类”时。

(3)另外,图灵测试的原则是要求询问的交互方式本身不能泄露被询问者的物理特征。在图灵所处的年代这几乎只能全部通过基于文本的自然语言来完成,因此图灵限定测试双方基于打字进行交流。但在多媒体技术发达的今天,视频、音频、图片等等“虚拟内容”都可以通过计算机以非物理接触的形式呈现(这当然是60年前的图灵不能预知的!)。因此,允许询问者在图灵测试中使用多媒体内容作为辅助材料进行提问(例如“请告诉我这个视频的笑点在哪儿”)似乎是对原始图灵测试定义的一个自然合理的补充[3]。

(4)最后,今天一般意义上理解的图灵测试不再严格区分人类参与者的性别。通常我们允许人类被询问者是任意性别,而询问者的目标也随之变成辨别哪一位被询问者是人类。

除此之外,完成一次具体的图灵测试还要注意很多操作细节,例如多少人参与测试算“足够多”,多长的讯问时间算“足够长”,多高的辨别正确率算“足够高”,如何挑选人类询问者和被询问者才能代表“人类”的辨别和自证能力,等等。由于图灵测试的巨大影响力,几十年来一直有人尝试挑战它,不时就会传出“某某计算机程序成功通过图灵测试”的消息。我想,正是对于意义深远的实验,我们才理应格外审慎。只有在仔细检查上面所列和其他一些重要细节之后,我们才能对其结果的有效性做出正确判断。类似几年前“超光速实验”那样的闹剧应该尽量避免。

5.问题示范
图灵采用“问”与“答”模式,即观察者通过控制打字机向两个测试对象通话,其中一个是人,另一个是机器。要求观察者不断提出各种问题,从而辨别回答者是人还是机器。图灵还为这项测试亲自拟定了几个示范性问题:

问: 请给我写出有关“第四号桥”主题的十四行诗。

答:不要问我这道题,我从来不会写诗。

问:34957加70764等于多少?

答:(停30秒后)105721

问:你会下国际象棋吗?

答:是的。

问:我在我的K1处有棋子K;你仅在K6处有棋子K,在R1处有棋子R。轮到你走,你应该下那步棋?

答:(停15秒钟后)棋子R走到R8处,将军!

图灵指出:“如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至提问者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。”

从表面上看,要使机器回答按一定范围提出的问题似乎没有什么困难,可以通过编制特殊的程序来实现。然而,如果提问者并不遵循常规标准,编制回答的程序是极其困难的事情。例如,提问与回答呈现出下列状况:

问:你会下国际象棋吗?

答:是的。

问:你会下国际象棋吗?

答:是的。

问:请再次回答,你会下国际象棋吗?

答:是的。

你多半会想到,面前的这位是一部笨机器。如果提问与回答呈现出另一种状态:

问: 你会下国际象棋吗?

答:是的。

问:你会下国际象棋吗?

答:是的,我不是已经说过了吗?

问:请再次回答,你会下国际象棋吗?

答:你烦不烦,干嘛老提同样的问题。

那么,你面前的这位,大概是人而不是机器。上述两种对话的区别在于,第一种可明显地感到回答者是从知识库里提取简单的答案,第二种则具有分析综合的能力,回答者知道观察者在反复提出同样的问题。“图灵测试”没有规定问题的范围和提问的标准,如果想要制造出能通过试验的机器,以我们的技术水平,必须在电脑中储存人类所有可以想到的问题,储存对这些问题的所有合乎常理的回答,并且还需要理智地作出选择。

6.瓶颈
图灵测试并不直接测试计算机的行为是否智能,它只测试计算机是否像人一样行为。由于人类行为和智能行为并不完全相同,因此在下面两种情况,测试可能无法准确测量智能:

1.一些人的行为本身即是不智能的

2.一些智能行为并不“人类”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3934.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高校教师 | ChatGPT的23种用法

近日,ChatGPT引发舆论风暴,火遍全球,甚至隔着“防火墙”引发了中国民间的应用热潮。 作为一款生成式人工智能软件,ChatGPT可以就任何议题生成文本,完成包括回答问题,撰写文章、论文、诗歌在内的多种工作。各…

在IDE中使用Bito - 一个不需要VPN就可以使用的chatgpt

文章目录 在IDE中使用Bito什么是Bito为什么要使用BitoBito可以做什么如何在IDE中安装Bito使用Bito 在IDE中使用Bito 什么是Bito 用他自己的介绍就是: Bito’s AI helps developers dramatically accelerate their impact. It’s a Swiss Army knife of capabilit…

如何使用 AWS 和 ChatGPT 创建最智能的多语言虚拟助手

上周ChatGPT发布了,每个人都在尝试令人惊奇的事情。我也开始使用它并想尝试它如何使用AWS的AI 服务进行集成,结果非常棒! 在这篇文章中,我将逐步解释我是如何创建这个项目的,这样你也可以做到! 最重要的是…

ChatGPT编程能力实证研究

CODEWISDOM ChatGPT编程能力实证研究 刘子夕 冯洋1 陈碧欢2 娄一翎 彭鑫 陈振宇 1 fengyangnju.edu.cn; 2 bhchenfudan.edu.cn 南京大学 计算机软件新技术国家重点实验室 复旦大学 计算机科学技术学院 摘要 近年来,大型语言模型(LLM)得到了快…

chatgpt赋能python:Python如何帮你更聪明地买股票

Python 如何帮你更聪明地买股票 股票市场是一场风险与机遇并存的游戏,每位投资者都希望能够购买到高品质的股票并赚取稳定的利润。而借助 Python 编程语言,你可以更加轻松地分析市场趋势,提高股票投资的准确性和盈利能力。 一、数据分析与预…

谷歌版 ChatGPT 翻车!市值暴跌七千亿

01 前言 最近微软出品的 ChatGPT 确实引起很大的关注呀,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,今天带大家来看看微谷的第一波较量。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如…

基于ChatGPT完美替代 Grammarly润色和语法纠错的免费插件!

OpenAI Polisher Bob Plugin 简介 ChatGPT 向我们展示了 GPT 模型的伟大之处,所以我使用 ChatGPT 的 API 实现了这个用来给语言润色和语法纠错的 Bob 插件,效果拔群!完美替代 Grammarly! 使用截图 使用方法 安装 Bob (版本 > 0.50)下载此插…

ChatGPT Prompting开发实战(一)

第7章 ChatGPT Prompting开发实战 7.1 Prompting在LangChain框架中的应用 本节跟大家讲提示工程(Prompt Engineering),主要基于工业级的源码以及具体的项目,无论是工程人员,还是不具有技术背景的人员,大家多少都听说过提示词,或者频繁使用过,简单而言,当我们使用OpenA…

ChatGPT prompt指令大全

ChatGPT prompt指令大全 更多Prompt自动使用,可以在chrome插件中搜索 WebChatGPT,没有账号的,可以拉到文章最下面。 目录 担任雅思写作考官 写小说 充当 Linux 终端 充当英语翻译和改进者 充当论文润色者(拿摘要部分举例&am…

火爆出圈的OpenAI模型ChatGPT体验

1、ChatGPT简要介绍 ChatGPT是一种高效的语言模型,全称为"聊天式自动回复生成技术"(Chat-based Automatic Reply Generation Technology),用于预测人类语言的后续内容。它是基于OpenAI的GPT-3模型构建的,具…

每日一个 ChatGPT 使用小技巧系列之1 - 给出提纲,让 ChatGPT 帮你写作

我以前写过一篇文章,介绍了我日常工作和学习中使用 ChatGPT 的一些技巧: 与其整天担心 AI 会取代程序员,不如先让 AI 帮助自己变得更强大 为代码生成对应的单元测试代码 利用 ChatGPT 帮助自己研读经典框架的源代码 代码重构和性能优化 阅读…

ChatGPT最新研究:可能影响80%工作岗位,收入越高影响越大

Datawhale分享 最新:ChatGPT影响,来源:机器之心 ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。 改变经济、劳动力和教育环境 和很多专家一样,Altman 担心人工智能技术的强大能力会制造过多虚假信…

爆红的chatgpt是如何诞生的?

今年,人工智能行业最大的新闻当属 DeepMind的 AlphaGo战胜了李世石,这是 AlphaGo在与人类围棋高手对战中,以总比分4比1击败李世石。 DeepMind团队公布的研究成果在 AI界引起了巨大反响。它从深度学习(Deep Learning)入…

爆火的ChatGPT太强了,写代码、改bug,网友:可取代Stack Overflow了

关于 AI 的问题,可以直接问 AI。 OpenAI 新上线的 ChatGPT 可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug…… 只要和它聊上几句,一会儿功夫它就能把…

有趣!深挖推特开源算法;ChatGPT封号对策汇总;ControlNet最全教程;搭建ChatGPT应用;构建开源项目阅读工作流 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『推特开源了推荐算法源码』大佬分析出了11条有意思的规律…… 3月31日,Twitter 对其推荐算法进行了开源。Steven Tey 持续…

全球最大的 ChatGPT 开源替代品来了,支持 35 种语言,网友:不用费心买 ChatGPT Plus了!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。ChatGPT 的落地不仅仅可以提供代码建议、总结长文本、回答问题…

对标ChatGPT的开源中文方案

目录 前言 一、Meta发布大语言模型LLaMA 二、斯坦福基于 Meta 的 LLaMA 7B 模型微调出Alpaca 三、基于TencentPretrain训练中文LLaMA大规模语言模型 四、基于斯坦福Alpaca训练中文对话大模型BELLE 五、 清华开源项目ChatGLM中文对话模型 六、基于LLaMA的开源中文语言模型…

ChatGPT 开源了第一款插件,都来学习一下源码吧!

3 月 23 日,OpenAI 又投出了一枚重磅炸弹:为 ChatGPT 推出插件系统! 此举意味着 ChatGPT 将迎来“APP Store”时刻,也就是围绕它的能力,形成一个开发者生态,打造出基于 AI 的“操作系统”! 插…

开源版ChatGPT,30分钟训完,性能堪比GPT3.5!

转自:新智元 话说,ChatGPT 开源,是一件好事吗? 此前,OpenAI 不 Open 的事件,已经引发了坊间的诸多争议。 光放出基准和测试结果,不提供训练数据、成本、方法,是真的要「赢家通吃」了…

2023-02-18 什么是chatGPT?如何使用chatGPT?chatGPT可以胜任人类当前哪些工作?.什么是openAI?chatGPT的使用示例

文章目录 1.什么是chatGPT?2.如何使用chatGPT?3.chatGPT可以胜任人类当前哪些工作?4.什么是openAI?5,使用示例一:旅游攻略6.使用示例二:AI绘画 1.什么是chatGPT? chatGPT本质上是一个应用在对话场景中的语言模型,它是基于GPT3.5(Generative Pre-trained Transformer,是指…