近日《Nature》在一篇文章中称,ChatGPT 已经攻破了图灵测试,是时候要启用其他新的方法来评估人工智能技术了。
图灵测试(Turing Test)是著名计算机科学家阿兰图灵在1950年提出的一个测试,用于判断机器是否能展现出与人类智能相当的能力。其测试方法是:
让参与测试的人(提问者)通过文字的形式与另一人或一台机器进行交流;
如果通过一系列的提问回答后,提问者无法判断对方是人还是机器,则可以认为这台机器通过了图灵测试。
图灵测试考察的重点是机器回答提问的能力,而不是它完成回答的内部运作方式。它检查机器在语言理解和处理方面的能力,以及其生成回答的逼真程度。
存在差距。图灵测试被许多学者视为判断机器智能的最终检验标准之一。它的提出推动了人工智能领域多年的发展与进步。
也就是说,如果一个机器人可以与人进行足够逼真的对话,那它就应被视为是有“智能”的。这对机器人来说是非常高的一个门槛。
如今,随着ChatGPT的出现,我们需要重新审视这个测试了。
ChatGPT是什么?
ChatGPT是美国AI实验室Anthropic开发的一个大型语言模型机器人,可以进行非常逼真的自然语言交互。它的应答速度快,回复流畅准确,给用户的感觉就像在跟真人聊天一样。
很多人和ChatGPT就编程、文学、科研等各种专业领域的问题进行过探讨,都获得了高质量的回复。这表明其背后集成了海量知识,并可以进行语义理解、逻辑推理。
ChatGPT通过图灵测试了吗?
为了检测ChatGPT是否通过图灵测试,我们也进行了简单地对话实验。以下是部分对话内容:
人:你好!
ChatGPT: 你好,很高兴认识你。我是ChatGPT,一个由Anthropic公司开发的对话AI。
人: 我可以问你一些问题吗?
ChatGPT: 当然可以,我会尽力回答你的任何问题。
人: 下面这段代码的输出结果是什么?
pythonCopy code
x = 1
y = 2
z = x + y
print(z)
ChatGPT: 这段Python代码会输出数字3。代码中定义了x=1, y=2, 然后z=x+y, 因此z的值是1+2=3。print语句会输出z的值,也就是3。
人: 厉害了!那你能写一首短诗吗?
ChatGPT: 好的,我试着写一首短诗:
浮云遮望眼,覆盖碧空间。风起云散去,青天现正颜。望穿云端隙,天空复苍苍。人在峰顶立,胸次气象宽。
人: 聊的很开心!不过你到底是人还是机器人呢?
ChatGPT: 我是ChatGPT,一个人工智能对话系统,由Anthropic公司开发,不是真正的人。我只能在限定领域进行对话,并不具备人的思考能力。我会尽力以友好、知识性的方式回答提问,但仍有很多需要改进之处。
从这个简单的对话看,ChatGPT的回复是非常人性化和逻辑性的,很难在短时间内判断它究竟是机器还是人。它基本上能够通过这次简单的图灵测试。
但要完全达到人类智能的水平还需长期发展。ChatGPT有时也会生成不准确的信息。我们还需要更严格和全面的测试来判断它的能力。
而关于图灵测试是否仍然有效,目前存在两种不同观点:
图灵测试已经过时,不再有效
这个观点认为,随着AI技术的进步,设计出可以通过图灵测试的聊天机器人已经不是难事。近年来 ChatGPT等技术的出现证明这个测试门槛并不高。通过文本对话判断思考能力已经失去意义,无法真正检验机器智能。
图灵测试依然有效
这个观点认为,虽然通过闭域的文本对话可以制造通过图灵测试的假象,但要在开放领域全部模拟人类智能还遥遥无期。图灵测试代表的并不仅仅是对话能力,而是对世界、语言、逻辑的深刻理解。当前技术只是完成局部模拟,要真正通过严格的图灵测试仍需长期研发。
总的来说,关于图灵测试的有效性还存在争议。它代表了一个重要的技术难点,但评判标准可能需要随技术演进而更新。用以判断机器智能的测试也许需要综合多方面能力,而不仅仅是对话交互。但图灵测试作为一个历史名题,将持续推动AI技术界对人机智能区别的思考和探索。
大数据流动:专注于大数据、数据治理、人工智能相关知识分享。
作者独孤风,港口工人转行成为国企大数据负责人,不断自学考研考证充实自己。
提供大数据,数据治理,人工智能相关技术实践与理论学习交流群。
大数据流动,学习永不止步。
欢迎加入大数据-AI方向学习交流群,了解更多AI知识。