为何语言学家乔姆斯基对ChatGPT持否定态度?

本文比较了乔姆斯基关于语言知识的本质、来源和使用的理论与 GPT 的不同, 说明了GPT没有可解释性。

 2023年3月8日著名语言学家乔姆斯基与罗伯茨(Ian Roberts)、瓦图穆尔(Jeffrey Watmull)共同在《纽约时报》发表了题为“ChatGPT的虚假承诺”的文章。他们强调,人工智能和人类在思考方式、学习语言与生成解释的能力,以及道德思考方面有着极大的差异,并提醒读者如果ChatGPT式机器学习程序继续主导人工智能领域,那么人类的科学水平以及道德标准都可能因此降低。乔姆斯基还认为,ChatGPT使用的大语言模型,实质上是一种剽窃。

乔姆斯基对于GPT持否定态度,这是不足为奇的。在乔姆斯基生成语法(Generative Grammar)的发展过程中,赋予生成语法以生命活力的是生成语法的语言哲学理论。其中,最为重要的是关于人类知识的本质、来源和使用问题(Chomsky,1995)。乔姆斯基把语言知识的本质问题叫做“洪堡特问题”(Humboldt's problem)。

德国学者洪堡特(W. Humboldt)曾经提出“语言绝不是产品(Ergon),而是一种创造性活动(Energeria)”,语言实际上是心智不断重复的活动,它使音节得以成为思想的表达。人类语言知识的本质就是语言知识如何构成的问题,其核心是洪堡特指出的“有限手段的无限使用”。语言知识的本质在于人类成员的心智/大脑(mind/brain)中,存在着一套语言认知系统,这样的认知系统表现为某种数量有限原则和规则体系。高度抽象的语法规则构成了语言应用所需要的语言知识,由于人们不能自觉地意识到这些抽象的语法规则,乔姆斯基主张,这些语言知识是一些不言而喻的或者无意识的知识.

乔姆斯基主张把语言知识和语言的使用能力区分开来。两个人拥有同一语言的知识,他们在发音、词汇知识、对于句子结构的掌握等方面是一样的。但是,这两个人可能在语言使用的能力方面表现得非常不同。因此,语言知识和语言能力是两个不同的概念。语言能力可以改进,而语言知识则保持不变。语言能力可以损伤或者消失,而人们并不至于失去语言知识。所以,语言知识是内在于心智的特征和表现,语言能力是外在行为的表现。生成语法研究的是语言的心智知识,而不是语言的行为能力。语言知识体现为存在于心智/大脑中的认知系统。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言行为是行之有效的,但是,这种技术是处于人类的心智之外的,根本不存在“有限手段的无限使用”问题,与乔姆斯基对于语言知识本质的认识是迥然不同的。

 语言知识的来源问题,是西方哲学中的“柏拉图问题”(Plato’s problem)的一个特例。“柏拉图问题”是:我们可以得到的经验明证是如此贫乏,而我们是怎样获得如此丰富和具体明确的知识、如此复杂的信念和理智系统呢?人与世界的接触是那么短暂、狭隘、有限,为什么能知道那么多的事情呢?刺激的贫乏(stimulus poverty)和所获得的知识之间为什么会存在如此巨大的差异呢?(杨小璐,2004)与“柏拉图问题”相应,人类语言知识的来源问题是:为什么人类儿童在较少直接语言经验的情况下,能够快速一致地学会语言?乔姆斯基认为,在人类成员的心智/大脑中存在着由生物遗传而天赋决定的认知机制系统。在适当的经验引发或一定的经验环境下,这些认知系统得以正常地生长和成熟。这些认知系统叫做“心智器官”(mental organs)。决定构成人类语言知识的是心智器官中的一个系统,叫做“语言机能”(language faculty)。这个语言机能在经验环境引发下的生长和成熟,决定着人类语言知识的获得(Pullum & Scholz,2002)。

研究发现,FOXP2是人类的独特基因。这一基因与其他哺乳动物的类似基因同属于一个家族,然而,这基因的排序却是人类特有的。因此,FOXP2也许就是乔姆斯基所假设的“语言机能”的生物学基础。由于存在FOXP2,所以,语言是天赋的,FOXP2给语言天赋论和刺激贫乏论提供了生物学上的支持(俞建梁,2011)

语言机能有初始状态(initial state)和获得状态(attained state)。初始状态是人类共同的、普遍一致的;获得状态是具体的、个别的。语言机能的初始状态叫做“普遍语法”(Universal Grammar,UG),语言机能的获得状态叫做“具体语法”(Particular Grammar,PG)。对普遍语法的本质特征及其与具体语法的关系的研究和确定,是解决关于语言知识的“柏拉图问题”的关键。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言机器学习是行之有效的,但是,这种技术依靠大规模的语言数据,根本不存在“刺激贫乏”的问题,与乔姆斯基对于语言知识来源的认识是大相径庭的。

乔姆斯基把语言知识的使用问题叫做“笛卡儿问题”(Cartesian problem)。基于机械论哲学的物质概念,法国哲学家和数学家笛卡儿(Descartes)认为,所有非生命物质世界的现象、动物的生理与行为、大部分的人类器官活动,都能够纳入物质科学(science of body)的范畴。但是。笛卡儿又指出,某些现象不能处于物质科学的范畴之内,其中最为显著的就是人类语言,特别是“语言使用的创造性方面”,更是超出了机械论的物质概念所能够解释的范围。所以,对于语言的正常使用,是人类与其他动物或机器的真正区别。为了寻求对于语言这一类现象的解释,笛卡儿设定了一种“第二实体”的存在,这种第二实体就是“思维实体’(thinking substance)。“思维实体”明显不同于物质实体,它与物质实体相分离,并通过某种方式与物质实体相互作用。这一种“思维实体”就是心灵或者心智。语言知识的使用是内在于心智/大脑的。因此,对于这样的问题是很难解决和回答的。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类自然语言的使用是行之有效的,但是,这种技术与“思维实体”没有关系,与乔姆斯基对于语言知识使用的认识是完全不同的。乔姆斯基主张,语言是语言机能或者语言器官所呈现的状态,说某个人具有语言L,就是说他的语言技能处于状态L。语言机能所获得的状态能够生成无限数目的语言表达式,每一个表达式都是语音、结构和语义特征的某种排列组合。这个语言机能所获得的状态是一个生成系统或者运算系统。

为了与一般人理解的外在语言相区别。乔姆斯基把这样的运算系统,叫做“I语言”。字母I代表内在的(internal)、个体的(individual)、内涵的(intensional)等概念。这意味着,I语言是心智的组成部分,最终表现于大脑的神经机制之中,因此,I语言是“内在的”。I语言直接与个体有关,与语言社团存在间接的联系。语言社团的存在取决于该社团的成员具有相似的I语言,因此,I语言是“个体的”。I语言是一个函数或者生成程序,它生成一系列内在地表现与心智/大脑中的结构描写,因此I语言是“内涵的”。根据这种对于I语言的认识。乔姆斯基指出,基于社会政治和规范目的论因素之上的关于语言的通常概念,与科学的语言学研究没有任何关系,这些概念都不适合用来进行科学的语言研究。

 生成语法对于语言的科学认识是内在主义(internalist)的,而GPT的大语言模型则是外在主义的(externalist)。GPT的方法是在广泛搜集语言材料的基础上,把离散的语言符号转化为词向量,通过机器学习来获取概率性的语言参数。这些参数存在于外部世界,处于人类的心智/大脑之外。GPT的方法是经验主义的方法,这种方法的基础是外在主义的语言观。乔姆斯基认为,根据外在主义的语言观,人们不能正确地认识和揭示人类语言的本质特征,不能解释人类语言知识获得的过程。只有内在主义的语言观才有可能正确地、全面地认识和解释人类语言知识的本质、来源和使用等问题。

乔姆斯基认为,生成语法的研究应当遵循自然科学研究中的“伽利略-牛顿风格”(Galilean-Newtonianstyle)。“伽利略风格”的核心内容是:人们正在构建的理论体系是确实的真理,由于存在过多的因素和各种各样的事物,现象序列往往是对于真理的某种歪曲。所以,在科学研究中,最有意义的不是考虑现象,而应寻求那些看起来确实能够给予人们深刻见解的原则。伽利略告诫人们,如果事实驳斥理论的话,那么事实可能是错误的。伽利略忽视或无视那些有悖于理论的事实。“牛顿风格”的核心内容是:在目前的科学水平下,世界本身还是不可解释的,科学研究所要做的最好的事情就是努力构建具有可解释性的理论,牛顿关注的是理论的可解释性,而不是世界本身的可解释性。科学理论不是为了满足常识理解而构建的,常识和直觉不足以理解科学的理论。牛顿摒弃那些无助于理论构建的常识和直觉。因此,“伽利略-牛顿风格”的核心内容是:人们应努力构建最好的理论,不要为干扰理论解释力的现象而分散精力,同时应认识到世界与常识直觉是不相一致的(吴刚,2006)。

生成语法的发展过程,处处体现着这种“伽利略-牛顿风格”。生成语法的目的是构建关于人类语言的理论,而不是描写语言的各种事实和现象(冯志伟,2009)。

语言学理论的构建需要语言事实作为其经验的明证。但是,采用经验明证的目的是为了更好地服务于理论的构建,生成语法所采用的经验明证一般是与理论的构建有关的那些经验明证。因此,生成语法研究的目的不是全面地、广泛地、客观地描写语言事实和现象,而是探索和发现那些在语言事实和现象后面掩藏着的本质和原则,从而构建具有可解释性的语言学理论。所以。在生成语法看来,收集和获得的语言客观事实材料越多,越不利于人们对于语言本质特征的抽象性的把握和洞察,而探索语言现象的可解释性,才是语言研究的目标之所在。GPT尽管功能强大,但是至今仍然是一个“黑箱”,不具有可解释性(Linzen,2019)。

乔姆斯基对于人类语言知识的本质、来源和使用问题的看法,与GPT对于非人类语言知识的本质、来源和使用问题的看法针锋相对,且GPT不具有可解释性,因此,乔姆斯基对于GPT持否定的态度,也就不足为奇了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31332.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何更换您的Gmail地址

在许多情况下,您可能需要更改您的 Gmail 地址:您换了工作、结婚并改了名字,或者您在 2003 年设置的电子邮件地址突然看起来有点累了。无论出于何种原因,以下是更改 Gmail 地址并确保您在此过程中不会丢失任何重要数据的方法。 创…

将163邮箱改为使用outlook软件登录的切换步骤

效果图: 实际操作步骤如下: 1. 登录163.邮箱,如下是使用网页版登录;按照下面要求,扫描二维码 2. 找个txt文件,保存此 一次性密码,后面步骤有用。 3.检查当前状态; 两个都是“已开…

Becky!客户端Hotmail/outlook邮箱设置方法

Becky!邮箱客户端是一款非常简洁好用的邮件接收发送软件。最近本软件菜单增加了对中的支持,感谢作者的不懈努力。 日语版本下载地址: http://www.rimarts.co.jp/becky-j.htm 中文菜单版本: http://www.zhcn.org/wp-content/plugins/download…

Gmail,qq,hotmail,163,sina等邮箱的Smtp设置

Gmail SMTP 服务器:smtp.gmail.com, SSL:是,服务器端口:587,见下图: Hotmail SMTP 服务器:smtp.live.com, SSL:是,服务器端口:587&…

凭实力破圈的狄耐克,究竟藏了多少惊喜?

你是否曾经想象这样一个场景: 进入社区时,自动识别业主身份,精准放行并联动家中智能场景模式。人未到,智先行,提前营造极度舒适便捷的人居环境。 进入单元楼时,联动电梯等候,无需触碰按键&…

点燃创作灵感:Prompt 实践指南揭秘!让 ChatGPT 更智能的六种策略(上)

在和 ChatGPT 对话中,Prompt 提示词的选择,如果遵循以下六种策略,我们将获得更好、更符合要求的回答。 这些策略,后几种更适合在编程调用 ChatGPT API 时使用,不过也适用直接和 ChatGPT 对话,让它更好的理解…

英伟达EditGAN:为高精度百变而生

点击上方“机器学习与生成对抗网络”,关注星标 获取有趣、好玩的前沿干货! 来源 机器之心报道 编辑 杜伟 在实现复杂且高精度图像编辑效果的同时,EditGAN 还能保持较高的图像质量和对象身份,英伟达在图像处理领域果然「出手不凡」…

英伟达把P图软件GAN了

晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI 英伟达的最新AI工具又让网友用户们激动了。 “我已经等不及了!” 一位网友在看完演示视频后表示。 对于“手残党”来说,英伟达的EditGAN简直就是零基础P图神器。 能够高质量、高精细度地对图像进行修改&…

英伟达NVIDIA GPU 架构介绍

一、NVIDIA GPU的架构演变历史和基本概念 截止2021年,发布时间离我们最近的8种NVIDIA GPU微架构是: Tesla (特斯拉) Fermi(费米) Kepler(开普勒) Maxwell(麦克斯韦) Pascal&#x…

英伟达 GPU 架构简史

英伟达 GPU 架构简史 尽管近年来 Nvidia GPU 确实更频繁地成为新闻,但它们绝不是新事物。事实上,多年来,Nvidia GPU 已经进行了多次迭代,GPU 架构也取得了进步。因此,让我们回顾一下最近的历史,以了解 GPU…

英伟达创始人CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好 | 英伟达:地球上最重要的公司之一

英伟达创始人&CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好 文章目录 英伟达创始人&CEO黄仁勋:一个事实是,拥有一个可以完美执行的简单想法,有时候比拥有一个你的公司无法执行的宏伟想法更好英伟达公司…

英伟达突破万亿美元市值,创始人黄仁勋分享创业心得

你知道全球第一家市值突破万亿美元的芯片公司是哪一家吗?它的创始人又是怎样的一个人呢?今天我们就来聊聊英伟达和黄仁勋的故事。 —————————————————————————————— 英伟达(NVIDIA Corporation)&a…

不愁失业!英伟达 CEO 黄仁勋:“AI 让每个人都能成为程序员”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 你是否想过,AI 可以帮你圆梦程序员? 早些年,大家或许对此存在疑惑,但近来 AI 编程工具的涌现和升级,这题的答案或许是——“y…

关于英伟达数字人文章的致歉和说明

大家好,昨天我们发布的一篇英伟达数字人新进展的文章,引发了较大范围的关注和讨论。经过我们的复核及英伟达官方最新确认,这篇文章存在不严谨和失当之处,特此进行说明和致歉。 一、说明一下我们的错误。 今日英伟达官方确认&#…

元宇宙大比拼:英伟达Nvidia,Facebook,iwemeta

还是那个熟悉的黄色厨房,还是那身立领的黑皮衣,在11月9日下午4点,黄仁勋带着他的元宇宙概念开启了英伟达GTC 2021大会。 在长达1小时30分钟的新品发布会中,黄仁勋重磅发布了英伟达最先进的Omniverse Avatar平台,这是一…

英伟达首席科学家:深度学习硬件的过去、现在和未来

作者|Bill Dally 翻译|胡燕君、沈佳丽、贾川 过去十年是深度学习的“黄金十年”,它彻底改变了人类的工作和娱乐方式,并且广泛应用到医疗、教育、产品设计等各行各业,而这一切离不开计算硬件的进步,特别是GP…

英伟达的这款GPU太强了!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 今年 3 月 21 日 - 24 日举办的 NVIDIA GTC 2022 大会可谓是亮点十足。NVIDIA 不仅一口气更新了 60 多个 SDK 应用程序,继续加大在 Omniverse、机器人平台、自动驾驶和量子计算等…

英伟达创始人出生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 2 月 17 日,在 1996 年的今天,IBM 的超级计算机“深蓝”首次挑战卡斯帕罗夫落败。“深蓝”首次挑战虽然最终败北,但却赢得了…

作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配

正在成为组织运营标配的流程挖掘,到底有哪些商业价值? 作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配 文/王吉伟 AIGC正在影响越来越多的行业,流程挖掘领域亦不例外。 Mindzie首先宣布集成生成式AI,使用户…

如何利用ChatGPT构建高效的思维导图

如何利用ChatGPT构建高效的思维导图 文章目录 如何利用ChatGPT构建高效的思维导图第一步输入指令,生成大纲指令内容GPT回答 第二步把得到的markdown格式保存为md文件第三步,导入到XMind生成思维导图思维图成品展示 第一步输入指令,生成大纲 …