1. 人工智能的标准模型
1.1. 机器优化人类提供的固定目标
1.1.1. 是一条死胡同
1.1.1.1. 当你走进死胡同时,你最好掉头返回,找出走错的地方
1.2. 问题不在于我们可能无法做好构建人工智能系统的工作,而在于我们可能太“成功”了
2. 智能
2.1. 我们称之为“大脑”的那一小堆几磅重的粉灰色胶状混合物是如何感知、理解、预测和操纵一个难以想象的浩瀚世界的?
2.1.1. 我们朝着解释大脑如何工作迈出的每一步,也同时是迈向在人工制品中创造大脑能力的一步,即迈向人工智能的一步
2.2. 智能是什么
2.2.1. 答案不在智商测试中,甚至不在图灵测试中,而是在我们的感知、我们的需求和我们所做的事情这三者之间的简单关系中
2.2.2. 如果一个实体是智能的,它就会根据它的感知来做事情,而它所做的事情是为了满足它的需求
3. 进化的起源
3.1. 大肠杆菌
3.1.1. 它的动作不会以任何方式依赖于它的环境
3.1.2. 它不会做任何决定,只是执行一种固定的行为,进化将这种行为植入了它的基因,但这并不是全部
3.1.3. 根据它感知到的情况(葡萄糖浓度不断升高),它所做的事情(游向葡萄糖)很可能满足它的需求(得到更多的葡萄糖)
3.1.4. 进化在大肠杆菌的基因中所建立的机制,就像在你的基因中所建立的机制一样
3.1.4.1. 通过这种机制,细菌的行为会随着它对环境的感知而变化
3.1.4.2. 进化事先不知道葡萄糖在哪里,也不知道你的钥匙在哪里,所以把找到葡萄糖和钥匙的能力放到生物体中,简直近乎完美
3.2. 动作电位
3.2.1. 这是一种电信号,大约10亿年前首次在单细胞生物体内进化出来
3.2.2. 后来,多细胞生物进化出一种叫作神经元的特殊细胞,这些细胞利用动作电位在生物体内快速传递信号,速度高达每秒120米(即每小时270英里)
3.2.3. 神经元之间的连接叫作突触
3.2.3.1. 突触连接的强度决定了有多少电刺激从一个神经元传递到另一个神经元
3.2.3.2. 动物通过改变突触连接的强度来学习
3.3. 最初,神经元形成了神经网络,这些神经网络分布在整个生物体中,用于协调各种活动
3.3.1. 水母之所以能优雅地推进是因为它们拥有神经网络,但水母根本没有大脑
3.4. 大脑中每个状态转换的“周期时间”只有几毫秒,虽然比电子电路速度慢,但是比大多数生物过程快得多
3.4.1. 我们对神经元和突触的生物化学知识以及大脑的解剖结构了解很多,但是认知水平的神经实现:学习、认知、记忆、推理、计划、决定等,对绝大多数人而言仍然是猜想
3.5. 在意识领域,我们确实一无所知
3.5.1. 人工智能领域没有人致力于让机器拥有意识,也没有人知道从哪里开始,而且没有任何行为是以意识为前提的
3.5.2. 所有关于机器神秘地变得有意识并憎恨人类的那些好莱坞电影情节其实都没有抓住要点
3.5.2.1. 重要的是能力,而不是意识
4. 奖励系统
4.1. reward system
4.2. 这是一个由多巴胺介导的内部信号系统,它将积极的和消极的刺激与行为联系起来
4.2.1. 它有内置的学习方法,因此随着时间的推移,我们的行为在获得奖励方面会变得更加高效
4.2.2. 它类似于人工智能领域开发的强化学习方法,对此我们有非常坚实的理论基础
4.3. 大脑的奖励系统就像大肠杆菌寻找葡萄糖的机制一样,是提高进化适应性的一种方式
4.3.1. 在寻求奖励方面更高效的生物体(例如寻找美味的食物、避免疼痛、进行Xin活动等)更有可能延续它们的基因
4.4. 某些获得奖励的方法可能会降低一个人基因延续的可能性
4.4.1. 如果直接用电流刺激你的奖励系统,你可能会不停地进行自我刺激,直到死去
4.5. 奖励信号和进化适应性之间的不一致并不只影响孤立的个体
4.5.1. 如果一个物种找到了一个生态位,但这个生态位满足其奖励系统的方式不利于进化适应性,那么这个物种就可能会灭绝
4.5.2. 除了这种意外的失败,生物体学习在自然环境中将奖励最大化,通常会提高它们延续自己的基因和在环境变化中生存下来的机会
5. 进化的加速器
5.1. 学习不仅对生存和繁衍有好处,还加速了进化
5.2. 学习不会改变一个人的DNA(脱氧核糖核酸),而进化则是一代又一代地改变DNA
5.3. 学习和进化之间的联系是由美国心理学家詹姆斯·鲍德温(James
Baldwin)和英国生态学家康威·劳埃德·摩根(Conwy Lloyd Morgan)在1896年分别提出的,但当时并未被人们普遍接受