数智读书笔记系列015 探索思维黑箱:《心智社会:从细胞到人工智能,人类思维的优雅解读》读书笔记

在这里插入图片描述

引言

《The Society of Mind》(《心智社会》)的作者马文・明斯基(Marvin Minsky),是人工智能领域的先驱和奠基者之一 ,1969 年获得图灵奖,被广泛认为是对人工智能领域影响最大的科学家之一。他在麻省理工学院创建了人工智能实验室,提出了许多开创性的理论和概念,为人工智能的发展奠定了重要基础。

这本书于 1986 年首次出版,在人工智能和认知科学领域具有举足轻重的地位,是一部深入探讨人类思维和智能本质的经典著作。它打破了传统的单一智能体认知模式,提出了 “心智社会” 理论,认为人类的智能并非源于某个中心智能体,而是由大量相对简单、具有特定功能的 “智能体(agent)” 相互协作构成的社会。这种独特的视角为理解人类思维的复杂性和构建人工智能系统提供了全新的思路,启发了一代又一代的科学家和研究者在相关领域进行探索和创新,推动了多智能体系统、认知建模等研究方向的发展。

阅读这本书,对于我们技术人而言,有着深远的意义。它能帮助我们突破现有的技术认知局限,理解智能背后的底层逻辑,从而为解决复杂的技术问题提供更丰富的灵感和方法。无论是在机器学习、自然语言处理,还是计算机视觉等领域工作,书中关于智能体协作、知识表达和问题求解的思想,都能让我们从更高的层次去思考和设计系统。同时,它还能极大地拓展我们的思维边界,培养跨学科的思维方式,引导我们将计算机科学与心理学、神经科学等领域的知识相结合,为我们在技术创新的道路上提供源源不断的动力。

核心概念解读

心智社会的基本构成 —— 智能体(Agents)

智能体是构成心智社会的基本单元,它们类似于一个个微小的 “智能模块”,每个智能体负责执行特定的、相对简单的任务 ,就像建造高楼大厦的砖块,每一块都有其独特的位置和作用。当我们看到一个苹果时,视觉识别智能体就开始工作,它们分工明确,有的负责识别苹果的形状,有的负责识别颜色,还有的负责判断大小。这些智能体相互协作,将各自处理的信息进行整合,最终让我们能够识别出这是一个苹果。同样,在情绪处理方面,当我们遇到开心的事情时,负责快乐情绪的智能体被激活,它们与其他相关智能体协作,让我们体验到愉悦的感觉,并可能引发微笑、欢呼等行为反应。

知识线(K 线)与记忆

知识线,简称 K 线,从上层的单个符号智能体连接到下层难以描述的多个智能体 。当我们看到 “猫” 这个符号智能体时,与之相连的 K 线会激活下层的感性智能体,让我们回忆起猫的外貌、叫声、柔软的触感等感觉,仿佛猫就在眼前。随着知识的不断积累和扩展,符号智能体之间还可以建立层级链接 。我们对动物的认知,从最初简单的猫、狗等具体动物概念,逐渐建立起哺乳动物、爬行动物等更高级的概念层级。通过这种层级链接,我们能够更高效地组织和管理知识,降低认知复杂度,同时也便于在不同的情境中快速调用相关知识。

层级带(Level - Bands)与认知经济性

层级带体现了 K 线到其他智能体连接强度的差异 。以风筝为例,风筝与轻量菱形、线、天空、风等智能体的连接强度大,因为这些元素与风筝的关系紧密,是构成风筝飞行场景的关键因素;而风筝与木头、纸张、亚麻、红色等智能体的连接强度就小。连接强度大的智能体在我们的认知中更容易被激活,比如很难想象风筝在水里飞;而连接强度小的智能体则可以很容易地被替换,如将风筝的颜色从红色想象成绿色 。层级带的另一个重要意义在于可复用性,它体现了一种认知经济性 。在人脸识别中,只看基层信号,如像素点等,很难看出两个人脸的相似性;只看高层信号,将二者都看作人脸,完全等同,也无法区分彼此。只有关注中层信号,如脸部的粗略结构和粗略形状的识别,才能更高效地进行相似度判断,既避免了过度细节带来的复杂性,又能准确地区分不同个体,提高认知效率。

社会层级(Layers of societies)与思维循环

社会层级中,K - society 和 S - society 应该相互邻接,这样可以避免出现太长的反应弧,同时二者也应该互相连接 。这种互相连接带来了很多可能性,相似性的计算或许依赖于从 S 层到 K 层的反向连接,K 到 S 的连接或许是目前深度学习中缺失的自顶向下的那一环 。这种互相激活增强的循环也可能会导致一些问题,比如产生恐慌情绪,就像我们在极度紧张的情况下,思维可能会陷入一种混乱的循环,无法正常思考,这时就需要第三者的干预来打破这种不良循环 。这种社会层级和思维循环的机制,对于我们理解思维过程以及人工智能研究有着重要的启示,它提醒我们在构建人工智能系统时,要充分考虑到不同层次之间的交互和平衡,避免出现类似人类思维中可能出现的失控情况。

分阶段学习与思维发展

分阶段学习是指一个层在学会一些技能后会固化下来,然后将学习更复杂技能的任务交给新的层来完成 。新的层会利用旧层所学的技能,并且受到旧层的价值指导。就像我们学习语言,最初是学习基础的词汇和语法,这些基础技能在大脑中逐渐固化。随着学习的深入,我们开始学习更复杂的语言表达、修辞手法等,新的学习层会依赖之前掌握的词汇和语法知识,同时在表达内容和方式上会受到之前形成的语言思维模式的影响。在学习数学时,我们先掌握基本的运算规则,之后再学习更高级的数学概念和解题方法,新的知识学习建立在旧知识的基础之上,并且在学习过程中不断巩固和拓展旧知识,从而实现思维的逐步发展和提升。

书中观点对人工智能发展的启示

《心智社会》为人工智能的发展提供了丰富的启示,尤其是在多智能体系统的构建和模拟人类思维方面 。传统的人工智能研究往往侧重于单一智能体的能力提升,如通过深度学习让一个智能体在图像识别或自然语言处理任务中表现出色。但现实世界中的问题往往非常复杂,单一智能体难以应对。心智社会理论强调多个智能体之间的协作,这为解决复杂问题提供了新的思路 。在自动驾驶领域,环境感知智能体负责识别道路、车辆和行人等信息,路径规划智能体根据感知信息规划最优行驶路线,决策智能体则根据各种信息做出加速、减速或转向等决策。这些智能体相互协作,共同实现自动驾驶功能,这比依赖单一智能体来完成所有任务更加高效和可靠。

在自然语言处理中,也可以借鉴心智社会的模式。将语言理解任务分解为多个子任务,由不同的智能体负责。语义分析智能体负责理解句子的含义,语法分析智能体负责检查句子的语法结构,语用分析智能体负责考虑语言在实际语境中的使用。通过这些智能体的协作,可以更准确地处理自然语言,提高机器对语言的理解和生成能力 。目前,人工智能研究在模拟人类思维方面已经取得了一些进展 。深度学习在图像识别、语音识别等领域取得了显著成果,能够处理大量的数据并发现其中的模式 。一些基于强化学习的智能体能够在复杂的环境中学习和决策,如 AlphaGo 在围棋领域展现出了超越人类的实力 。但目前的人工智能系统仍然存在很大的局限性 。它们缺乏人类思维的灵活性和创造性,很难像人类一样进行抽象推理和理解复杂的语义关系 。在面对新的、未见过的问题时,人工智能系统往往表现不佳,缺乏举一反三的能力 。

结合实际案例分析

案例一:图像识别技术中的应用

在图像识别领域,心智社会理论的应用为解决复杂的图像分析问题提供了新的思路 。以人脸识别系统为例,它可以看作是一个由多个智能体组成的心智社会 。图像预处理智能体负责对输入的图像进行去噪、灰度化等操作,为后续的处理提供清晰、规范的图像数据 。特征提取智能体则专注于从图像中提取关键特征,如面部轮廓、眼睛、鼻子、嘴巴等部位的特征 。这些特征对于识别不同的人脸至关重要,就像人类在识别他人时,会关注这些关键部位的特征一样 。分类智能体根据提取的特征,将图像与已有的模板或样本进行匹配和分类,判断出图像中的人脸属于哪一个个体 。在这个过程中,不同的智能体相互协作,共同完成人脸识别任务 。

在实际应用中,这种多智能体协作的方式展现出了显著的优势 。在机场的安防监控系统中,人脸识别技术需要在大量的人群中快速、准确地识别出目标人员 。通过将图像识别任务分解为多个子任务,由不同的智能体分别负责,系统能够大大提高识别的效率和准确性 。图像预处理智能体能够快速去除图像中的噪声和干扰,为特征提取智能体提供高质量的图像数据,使得特征提取更加准确和高效 。分类智能体在处理大量的人脸数据时,能够快速进行匹配和分类,及时发现目标人员 。如果仅仅依靠单一的智能体来完成所有的任务,不仅计算量巨大,而且容易出现错误 。而多智能体协作的方式能够充分发挥每个智能体的优势,提高系统的整体性能 。

案例二:自然语言处理中的体现

在自然语言处理领域,心智社会理论同样有着广泛的应用 。以智能客服系统为例,它利用了多个智能体的协作来实现与用户的自然语言交互 。意图识别智能体负责分析用户输入的文本,理解用户的意图和需求 。当用户询问 “我想查询明天从北京到上海的航班信息” 时,意图识别智能体能够准确判断出用户的意图是查询航班信息 。知识检索智能体根据意图识别的结果,从知识库中检索相关的信息,如航班时刻表、票价等 。语言生成智能体将检索到的信息组织成自然语言,回复给用户 。在这个过程中,不同的智能体之间通过信息的传递和协作,完成了自然语言的理解和生成任务 。

智能客服系统在实际应用中,能够处理大量的用户咨询,快速准确地回答用户的问题 。在电商平台的客服场景中,每天都会有大量的用户咨询关于商品信息、订单状态、售后服务等问题 。智能客服系统通过多个智能体的协作,能够快速理解用户的问题,并从知识库中检索相关的信息,及时回复用户 。这不仅提高了客服的工作效率,还能为用户提供更好的服务体验 。如果没有多个智能体的协作,智能客服系统很难在短时间内处理如此大量的用户咨询,也难以准确理解用户的意图并提供有效的回答 。

个人思考与感悟

阅读《心智社会》的过程,就像是经历了一场思维的奇幻冒险,让我对人类思维的本质有了全新的认识 。在阅读之前,我对人类思维的理解相对较为单一,认为思维是一个整体的、连贯的过程 。但明斯基提出的 “心智社会” 理论彻底颠覆了我的认知 。我开始意识到,我们的思维并非是一个单一的、完美的准则在起作用,而是由无数个微小的智能体相互协作、相互竞争所构成的复杂社会 。这种观点让我对人类思维的复杂性和多样性有了更深的敬畏之情 。

书中的理论也让我开始反思自己的学习和工作方式 。在学习新知识时,我们往往试图一次性掌握所有内容,却忽略了将知识分解为多个小模块,逐步学习和理解 。就像书中提到的分阶段学习,我们应该先掌握基础知识和技能,将其固化为我们的底层智能体,然后再学习更复杂的内容 。在学习编程语言时,我们可以先掌握基本的语法和数据结构,然后再学习更高级的算法和框架 。在工作中,当我们面对复杂的问题时,可以借鉴心智社会中智能体协作的方式 。将问题分解为多个子问题,让不同的团队成员或模块分别负责解决,最后再将结果整合起来 。这样可以充分发挥每个人的优势,提高工作效率和质量 。

对于未来人工智能和认知科学的发展方向,我认为《心智社会》提供了重要的启示 。未来的人工智能研究应该更加注重模拟人类思维的多样性和复杂性,通过构建多智能体系统,让不同的智能体在相互协作中实现更高级的智能行为 。在认知科学领域,这本书也为我们深入研究人类思维和意识提供了新的视角和方法 。通过对心智社会中智能体的研究,我们可以更好地理解人类思维的形成和发展机制,从而为解决一些认知障碍和心理问题提供帮助 。

附:作者视频讲座:

MIT《心智社会论|MIT 6.868J The Society of Mind, Fall 2011》中英字幕(deepseek翻译)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31112.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

游戏引擎学习第148天

回顾并规划今天的工作 没有使用引擎,也没有任何库支持,只有我们自己,编写游戏的所有代码,不仅仅是小小的部分,而是从头到尾。现在,我们正处于一个我一直想做的任务中,虽然一切都需要按部就班&a…

bug-Ant中a-select的placeholder不生效(绑定默认值为undefined)

1.问题 Ant中使用a-select下拉框时,placeholder设置输入框显示默认值提示,vue2ant null与undefined在js中明确的区别: null:一个值被定义,定义为“空值” undefined:根本不存在定义 2.解决 2.1 a-select使…

DeepSeek教我写词典爬虫获取单词的音标和拼写

Python在爬虫领域展现出了卓越的功能性,不仅能够高效地抓取目标数据,还能便捷地将数据存储至本地。在众多Python爬虫应用中,词典数据的爬取尤为常见。接下来,我们将以dict.cn为例,详细演示如何编写一个用于爬取词典数据…

springboot-自定义注解

1.注解的概念 注解是一种能被添加到java代码中的【元数据,类、方法、变量、参数和包】都可以用注解来修饰。用来定义一个类、属性或一些方法,以便程序能被捕译处理。 相当于一个说明文件,告诉应用程序某个被注解的类或属性是什么&#xff0c…

低代码开发直聘管理系统

低代码 DeepSeek 组合的方式开发直聘管理系统,兼职是开挂的存在。整个管理后台系统 小程序端接口的输出,只花了两个星期不到。 一、技术栈 后端:SpringBoot mybatis MySQL Redis 前端:Vue elementui 二、整体效果 三、表结…

【面试】Kafka

Kafka 1、为什么要使用 kafka2、Kafka 的架构是怎么样的3、什么是 Kafka 的重平衡机制4、Kafka 几种选举过程5、Kafka 高水位了解过吗6、Kafka 如何保证消息不丢失7、Kafka 如何保证消息不重复消费8、Kafka 为什么这么快 1、为什么要使用 kafka 1. 解耦:在一个复杂…

文件操作详解(万字长文)

C语言文件操作 一、为什么使用文件?二、文件分类三、文件的打开和关闭四、文件的顺序读写4.1fputc4.2fgetc4.3fputs4.4fgets4.5 fprintf4.6 fscanf4.7 fwrite4.8 fread 五、文件的随机读写5.1 fseek5.2 ftell和rewind六、文件读取结束的判定七、文件缓冲区 一、为什…

突破极限!蓝耘通义万相2.1引爆AI多模态新纪元——性能与应用全方位革新

云边有个稻草人-CSDN博客 目录 一、 引言 二、 蓝耘通义万相2.1版本概述 三、 蓝耘通义万相2.1的核心技术改进 【多模态数据处理】 【语音识别与文本转化】 【自然语言处理(NLP)改进】 【跨平台兼容性】 四、 蓝耘注册 部署流程—新手也能轻松…

力扣-股票买入问题

dp dp元素代表最大利润 f[j][1] 代表第 j 次交易后持有股票的最大利润。在初始状态,持有股票意味着你花钱买入了股票,此时的利润应该是负数(扣除了买入股票的成本),而不是 0。所以,把 f[j][1] 初始化为负…

ubuntu22.04本地部署OpenWebUI

一、简介 Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 AI 平台,旨在完全离线运行。它支持各种 LLM 运行器,如 Ollama 和 OpenAI 兼容的 API,并内置了 RAG 推理引擎,使其成为强大的 AI 部署解决方案。 二、安装 方法 …

Unity开发——CanvasGroup组件介绍和应用

CanvasGroup是Unity中用于控制UI的透明度、交互性和渲染顺序的组件。 一、常用属性的解释 1、alpha:控制UI的透明度 类型:float,0.0 ~1.0, 其中 0.0 完全透明,1.0 完全不透明。 通过调整alpha值可以实现UI的淡入淡…

LVGL直接解码png图片的方法

通过把png文件解码为.C文件,再放到工程中的供使用,这种方式随时速度快(应为已经解码,代码中只要直接加载图片数据显示出来即可),但是不够灵活,适用于哪些简单又不经常需要更换UI的场景下使用。如…

【算法day5】最长回文子串——马拉车算法

最长回文子串 给你一个字符串 s,找到 s 中最长的 回文 子串。 https://leetcode.cn/problems/longest-palindromic-substring/description/ 算法思路: class Solution { public:string longestPalindrome(string s) {int s_len s.size();string tmp …

JavaWeb-HttpServletRequest请求域接口

文章目录 HttpServletRequest请求域接口HttpServletRequest请求域接口简介关于请求域和应用域的区别 请求域接口中的相关方法获取前端请求参数(getParameter系列方法)存储请求域名参数(Attribute系列方法)获取客户端的相关地址信息获取项目的根路径 关于转发和重定向的细致剖析…

Dify 本地部署教程

目录 一、下载安装包 二、修改配置 三、启动容器 四、访问 Dify 五、总结 本篇文章主要记录 Dify 本地部署过程,有问题欢迎交流~ 一、下载安装包 从 Github 仓库下载最新稳定版软件包,点击下载~,当然也可以克隆仓库或者从仓库里直接下载zip源码包。 目前最新版本是V…

css错峰布局/瀑布流样式(类似于快手样式)

当样式一侧比较高的时候会自动换行,尽量保持高度大概一致, 例: 一侧元素为5,另一侧元素为6 当为5的一侧过于高的时候,可能会变为4/7分部dom节点 如果不需要这样的话删除样式 flex-flow:column wrap; 设置父级dom样…

Docker入门篇1:搜索镜像、拉取镜像、查看本地镜像列表、删除本地镜像

大家好我是木木,在当今快速发展的云计算与云原生时代,容器化技术蓬勃兴起,Docker 作为实现容器化的主流工具之一,为开发者和运维人员带来了极大的便捷 。下面我们一起开始入门第一篇:搜索镜像、拉取镜像、查看本地镜像…

利用pdf.js+百度翻译实现PDF翻译,创建中文PDF

基于JavaScript的PDF文档解析与智能翻译系统开发实践 一、功能预览 1.1 PDF加载 1.2 PDF翻译 二、系统架构设计 2.1 PDF智能翻译系统架构设计 层级模块名称功能描述技术实现呈现层Canvas渲染器PDF文档可视化渲染PDF.js + 动态视口计算 + 矩阵变换

虚函数和虚表的原理是什么?

虚函数是一个使用virtual关键字声明的成员函数,在基类中声明虚函数,在子类中可以使用override重写该函数。虚函数根据指针或引用指向的实际对象调用,实现运行时的多态。 虚函数表(虚表)是一个用于存储虚函数地址的数组…

运行OpenManus项目(使用Conda)

部署本项目需要具备一定的基础:Linux基础、需要安装好Anaconda/Miniforge(Python可以不装好,直接新建虚拟环境的时候装好即可),如果不装Anaconda或者Miniforge,只装过Python,需要确保Python是3.…