图灵测试与中文屋
这篇文章想分享关于人工智能的“中文屋论证”(也叫汉字屋,Chinese room)。什么是中文屋论证呢,我们知道图灵测试是判断是机器否是人工智能的公认标准。我先说图灵测试,知道了图灵测试就很好理解汉子屋论证了。
图灵测试非常简单,就是图灵提出来的,判断一个机器是不是具有智能,就是在你和机器对话以后(前提是你不知道他是机器),你分辨不出来他是真人还是机器——如果你无法判断,就说明这个机器可以算做人工智能。图灵测试得到了很多人的认可。所以往后很多人工智能领域的研究,都是朝着这个目标而努力。
后有个人,叫赛尔,他觉得图灵测试不太行。理由是什么呢,好主题来了:汉字屋论证。他说啊,弄一个小屋,里面放一个只会英语而不懂汉语的美国人,外面放一个懂汉语的中国人,屋里屋外两个人通过递纸条来通信,纸条上必须写汉语。屋里的人呢,想法设法欺骗屋外的人他会汉语,屋外的人努力判断屋里的人是不是真会汉语。屋里的人不是不懂汉语吗,但是他有一本工具书,书上告诉他,当你看到写成这样的纸条“你吃饭了吗”,你就抄下“吃了,谢谢。”这几个字递出去。就这样,屋外的人每次用汉语写一句话给他,他都去查书来寻找对应,假设工具书非常强大内容十分丰富,然后这个人查找速度非常快。那你觉得屋外的人能找到破绽吗?不太能吧。那有人说了,我就一直问“你吃饭了吗”,我连续问个十遍,如果屋里的回答全都是“吃了谢谢吃了谢谢吃了谢谢”。那我不就能发现他比较古板、不懂汉语了吗。那如果工具书有学习和记录功能呢,比如工具书告诉他,对于“你吃饭了吗”出现三次及以上的情况,你就抄这张纸条:“我说过啦我吃了,别再问这个问题了。” 总之,对于任何情况,工具书都可以帮屋内的人做出最优响应。
好,终于屋外的人崩溃了,无法判断屋里的人是不是真的懂汉语。那么按照我之前说的,假如把屋里的人换成机器——因为显然屋里人所需要的操作无非就是搜索和映射,这个谁最擅长,机器最擅长,所以是可以替代的。
假设屋里的是台机器,它通过同样的手段与屋外的人流畅地交流,判断者连它懂不懂汉语都判断不出来,更何况判断它是不是真人或机器。那此时,机器就通过这样一本强大的工具书,通过了图灵测试。按照图灵测试的标准,我们认为这个机器具有智能——可是我们很清楚,屋里的人是不懂汉语的。
这就矛盾了。汉字屋论证引起了很大的震动,也就是说,无论我们做出来的人工智能是不是通过了图灵测试,他总能被汉子屋说明是没有智能的,那我们还研究啥,反正也做不出真正的智能,都是自己骗自己。
对中文屋的质疑、反驳与接收现实
汉字屋是赛尔提出来的,那有人就反驳了:“赛尔你不是一个人!你就是一个“英文屋”,我是屋外的人,你是屋里的人;其实你不懂英语,你也不是真人,你的一切语言和行为都是由你大脑里的机器人参照着工具书操作的!”那赛尔怎么证明自己真的懂英语,他证明不了对吧。这个也是著名的“他心论证”。
那为什么会这样呢,因为汉字屋论证杀伤力太大了。它不仅能说明机器人没有心智,他也能说明真人没有心智。换句话说,对于人我们都有充分但不完全的理由怀疑他没有智能,更何况对于机器呢?用一个可以说明一切事物都没有智能的理论去说明机器没有智能,那结论当然是没有智能。
话说回来,我们判断一个人是不是有智能的标准是什么,难道是去看他是不是真的有心智,他是不是真的知道红色的是什么感觉,绿色是什么感觉?不是吧,那我们判断一个人的标准无非就是我指着红色他说红色,我指绿色他说绿色,说白了,我们只在乎外部表现。电影《人工智能》里的大卫,《超能查派》里的查比,能让你落泪吗,能,那这就够了。因为他们通过他们的外表现让观众觉得他们真的懂了什么是爱,什么是痛。但是你说他们真的懂吗,不见得。
那其实聪明人就发现了,那我说了一大圈汉子屋论证,最后还不是回到图灵测试上来了。对吧,看外部表现!我认为这也是图灵测试的权威性和魅力所在。
那汉子屋论证都是废话吗?不是,汉字屋论证告诉了我们什么,他让我们产生了一个思考——人工智能真的懂吗?换句话说,汉字屋可能打破了我们美好的想象。
比如,我们的汉语古诗,有的豪迈潇洒,有的意境很深,就是你读到它,那就可以跨越时空去想象到那个画面,然后对作者产生共情——而这种感觉机器人会有吗?比如我们听一首歌,我们可以单曲循环一整天,出不来,为啥,说不清。反过来,听到很恶心的东西,就感觉浑身起鸡皮疙瘩,整个人不好了。这种反应机器人有吗。再比如我们听闻一些英雄事迹、家国情怀,马上就会由内而外的肃然起敬,甚至还会流泪。种种这些反应,机器人可以表现出来,但不一定不会真有。人工智能只能按自己的方式理解,而不会按人的方式懂。这大概就是Chinese room给我带来的启发和思考。