语言主要是一种交流工具，而不是思维工具？GPT5何去何从？

引言

在人工智能领域，特别是大语言模型（LLM）的发展中，语言和思维的关系一直是一个备受关注的话题。近期，麻省理工学院（MIT）在《Nature》杂志上发表了一篇题为《Language is primarily a tool for communication rather than thought》的论文，提出了颠覆性观点：人类的大脑神经网络并不依赖语言进行形式化推理。这一发现不仅挑战了当前大语言模型的基础理论，还为未来的AI研究方向提供了新的思考。本篇文章将深入解读这篇论文，并探讨其对大语言模型和人工智能发展的潜在影响。

语言与思维的争论

心理学界的四种观点

在心理学界，语言与思维的关系有多种不同的理论。其中，行为主义心理学认为思维等同于语言，这一观点由约翰·布罗德斯·华生和伯尔赫斯·弗雷德里克·斯金纳提出，他们认为思维是无声的言语行为。

另一种观点是“语言决定思维”论，即萨丕尔-沃尔夫假说，认为语言不仅反映了我们对世界的认知，还会影响我们对世界的感知和思考方式。

与之相对的是“思维决定语言”论，这一观点可以追溯到亚里士多德，他认为逻辑运算的起源比语言更为深远。让·皮亚杰也持有类似观点，认为语言只是逻辑思维发展的一个工具，而不是其根源。

最后，杰瑞·福多提出了“语言和思维相互独立论”，他认为思维是一种独立的中枢加工系统，语言只是表达思维的一种工具。

MIT论文的观点

MIT的这篇论文支持福多的观点，认为语言主要是用于交流的工具，而不是思考的工具。作者通过功能性磁共振成像（fMRI）技术和大量病例研究，发现语言网络和推理脑区在活动时是独立的，这表明语言并不是思维所必需的。

实验和证据

fMRI技术的发现

论文作者使用fMRI技术观察了语言网络的活跃情况，发现执行推理任务时语言网络并不活跃，而语言网络活跃时负责推理的脑区也不活跃。这一发现提供了强有力的证据，表明参与多种形式的思考和推理并不需要语言网络。

病例研究

作者还通过对失语症患者和聋哑儿童的研究，进一步支持了这一观点。尽管这些个体在语言能力上有障碍，但他们仍然表现出完整的思考和推理能力。特别是失语症患者，虽然无法通过语言表达或理解他人的话语，但他们仍然能够解决数学问题、执行规划和进行各种形式的推理。

对大语言模型的影响

当前大语言模型的局限性

现有的大语言模型，如GPT-4和Claude 3.5，主要依赖于语言数据进行训练，并在一定程度上具备推理能力。然而，如果语言并不是思维的基础，那么仅仅通过语言数据训练的模型可能存在根本性的局限。

未来的发展方向

MIT的这篇论文提示我们，未来的AI研究可能需要超越语言，探索更多的非语言形式的数据和方法。Yann LeCun指出，问题不在于Transformer架构，而在于目前的大语言模型仍然是自回归的，需要固定数量的计算步骤来处理每个token。因此，未来的研究需要寻找新的方法，打破自回归模型的限制，提升AI的推理能力。