目录
- 摘要
- 关键词:
- 正文
- 一.小说梗概
- (一)《三体》
- (二)《黑暗森林》
- (三)《死神永生》
- 二.自信息诠释剧情
- (一)邪乎到家必有鬼
- (二)梦中情人
- 三.蓝天的熵
- (一)从不确定性的角度来理解
- (二)用通信系统模型来理解
- 四.猜疑链中的互信息两面性
- 五.用平均互信息极值性诠释为什么人类最终惨败
- 六.总结
摘要
本文以信息论的视角为切入点去审视并解读科幻小说《三体》中的相关段落与情节。先后列举了:(1)根据自信息量的定义式和理解解释小说中的一句经典台词和一个故事情节。(2)从不确定性的角度和通信系统模型的方法分别去理解和诠释小说情节中对信息论知识具有直接描写的相关情节。(3)根据博弈论的理论方法将情节中的模型简化后加以演绎,用不同的演绎结果对小说中猜疑链的概念用互信息两面性进行辩证解读。(4)根据平均互信息极值性解释小说中的童话故事解读失误导致人类灭亡。
关键词:
《三体》;自信息量;通信系统模型;互信息;熵的不增原理
正文
《三体》是刘慈欣创作的系列长篇科幻小说,由《三体》、《三体Ⅱ·黑暗森林》、《三体Ⅲ·死神永生》组成,作品讲述了地球人类文明和三体文明的信息交流、生死搏杀及两个文明在宇宙中的兴衰历程。作为当今中国最火热的科幻IP,《三体》三部曲被普遍认为是中国科幻文学的里程碑之作,它将中国科幻推上了世界级高度。
我在二刷这部作品时恰逢在学习《信息论基础及应用》这门课程,发现小说中许多故事都蕴含了大量与信息论相关的情节,抑或可以用信息论的知识完美地解释书中讲述的设定。也许这和作者刘慈欣本人的职业有关,毕竟作为娘子关火电厂的一名计算机工程师,他不可能不会接触到信息论的相关知识。本文将以小说中的部分情节结合所学信息论知识对故事情节和科幻设定背后的秘密进行分析。
一.小说梗概
(一)《三体》
受到文革迫害的天文学家叶文洁被带到军方绝密计划“红岸工程” ,对人类丧失信心的她向四光年外的三体星系发出呼叫信号,请求三体人救赎人类。与此同时因为受到三个太阳做不规则三体运动 而一次次经历文明毁灭的三体人看到了希望,决定大举进攻地球。
数十年后第一部的男主人公汪淼眼中突然出现了神秘倒计时字样,就在这时他受到了来自军方的邀请,原来科学界最近出现了许多怪异的事情,在各国军队的协助下经过不断努力后发现了事情的真相,三体人派出“智子” 探测器封锁地球的科技并且监视人类的行踪,汪淼眼中的倒计时就是“智子”所为,同时地球人也衍生出一个叫ETO 的组织专门为三体人服务,专司破坏地球正常秩序。与此同时,庞大的三体舰队正在前往地球的路上。
后来各国军方通过“古筝计划” 杀死了ETO的一位领导人伊文斯获得了大量关于三体人的信息。[^1 ]
(二)《黑暗森林》
为了应对三体危机,人类在组建庞大太空舰队的同时也利用三体人思维的透明性 开展了“面壁计划”,旨在利用各种计谋打败三体人,而三体人借助ETO的力量挑选出破壁人对面壁者的计划进行破解。
亚洲太空军军官章北海借一场陨石雨杀死了支持飞船采用有工质推进的科学家后干涉飞船推进形式的研究方向。冬眠近二百年后,获选“增援未来”计划 的他在人类舰队被三体人发射的“水滴” 清除殆尽前,成功抢夺战舰逃离,但是在后来的黑暗战役 中牺牲。
最后“面壁计划”中的一位面壁者罗辑借助叶文洁生前的只言片语推断出了本部最核心的“黑暗森林” 法则,利用这一法则使得三体人的阴谋破产,使其与人类之间达成了恐怖的平衡。[^2 ]
(三)《死神永生》
身患绝症的云天明在死前送给大学时暗恋的同学程心一颗星星,但是程心却将其大脑当作探测器发射向三体舰队。数百年后冬眠苏醒的程心被选作掌握地球命运的执剑人 ,但是就在交接“执剑人”权力的那一刻三体人发动了对地球的打击。
与此同时在黑暗战役中存活下来的“蓝色空间”号飞船借助四维空间的力量打败了前来追击的“水滴”和“万有引力”号飞船 ,并向全宇宙广播了三体星系的坐标。
随后三体星系便遭到了“黑暗森林”的打击,同样的命运也将降临到人类头上。此时云天明通过三个童话故事向人类透露了躲避打击的方法,但是因人类的误判导致人类受到神级文明的“二向箔”打击,整个太阳系被二维化。程心和闺蜜借助人类唯一可用的光速飞船逃出生天 。[^3]
二.自信息诠释剧情
(一)邪乎到家必有鬼
在《三体》第一部中,有一个有趣的台词可以用信息论中的知识来解释,第一部的主人公汪淼突然眼前出现了神秘的倒计时,在经过了一系列的事件之后他甚至在全宇宙的尺度看到了倒计时,就在他不知所措时,它的好朋友警察史强来安慰他说:
邪乎到家必有鬼。
“邪乎到家必有鬼”这一句台词作为史强的经典语录在《三体》粉丝群体中也广为流传,现在学习过信息论相关知识以后,重新去回顾这句台词会给我们全新的认识。
离散随机变量 X X X 中事件 x x x, ( x ∈ X ) (x∈X) (x∈X)的自信息(或自信息量) I ( x ) I(x) I(x)定义为
I ( x ) = − l o g P ( x ) = l o g 1 P ( x ) [ 4 ] I(x)=-logP (x)=log\frac{{1}}{{P(x)}} [^4] I(x)=−logP(x)=logP(x)1[4]
可以这样理解:“邪乎”意味着这一事件发生的概率非常低,因为日常生活中发生概率较高的事件一定不会被定义为是“邪乎”,“邪乎到家”一方面可以理解为这种事件发生的概率已经小到了一定程度可以视作无穷小,另一方面“到家”可以理解为这一事件发生了。“鬼”我们可以理解作非常大的信息量,达到令人难以置信的程度所以可以称其为“鬼”,抑或将其看作一种不确定性,这样可以更让人容易接受,也与生活中所谓的“鬼”有几分相似,总是行踪不定,充满了不确定性。
把这样的理解带入信息量定义式进行验证,结果是完全吻合的,同时也可以取极限认为“邪乎”是不可能事件,即 P ( x ) → 0 P\left(x\right)\rightarrow0 P(x)→0,带入自信息的定义式,那么这一事件既然发生,说明信息量无穷大,即 I ( x ) → ∞ I\left(x\right)→∞ I(x)→∞,同样用信息论的知识证明了这句话的合理性。
在生活中我们同样可以利用这样的思路去理解许多问题,例如古时候人们在面对诸如日食、地震、月食等异常天象时创造出的各种神话传说也可以认为是为了诠释这种异常天象背后蕴含的信息量,毕竟很少会有民族为吃饭睡觉这种人们习以为常的事创造出一个神话来,而地震、日食、雷电这些现象总是被认为天神的震怒。
古人会怕“鬼”同样也可以理解为是对它带来的一种不确定性的惧怕。同样的,我们当前身边的许多现象用它来解释就非常合理了,比如今年的疫情相对于往常可以看作是一种反常,抑或“邪乎到家”,疫情的爆发提供了大量的信息量,而这就为各种阴谋论提供了市场,这些阴谋论就是像古人试图用神话诠释天象一样试图去诠释这些信息量,然而就像人们最终会知道天象背后的原理一样,疫情的真相最终也会大白于天下。
(二)梦中情人
在《三体Ⅱ·黑暗森林》中就在其他三位面壁者泰勒、雷迪亚兹和希恩思在忙于自己的面壁计划时,同样作为面壁者的罗辑在当选后并没有像其他三位面壁者一样去着手筹备针对三体人的“面壁计划”事宜,而是上演了一出出“面壁者迷惑行为”,虽然非常疑惑,但是人们也一直以为这是罗辑“计划的一部分”:继提出要一栋在人间仙境的豪宅 和竞拍沉船中的“美酒” 后,罗辑又提出希望大史能帮他找一位只在自己梦中见过的女孩。
惊奇的是这个女孩仅仅是罗辑自己臆想出来的,甚至都有可能不在这个世界上。于是罗辑开始描述这个女孩:
那好,帮我找一个人,一个二十岁左右的女孩儿,这是计划的一部分。
她是一个,嗯,东方女孩,就设定为中国人吧。
她来到这个世界上,就像垃圾堆里长出了一朵百合花,那么-那么的纯洁娇嫩,周围的一切都不可能污染她,但都是对她的伤害,是的,周围的一切都能伤害到她!你见到她的第一反应就是去保护她……啊不,呵护她,让她免受这粗陋野蛮的现实的伤害,你愿意为此付出一切代价!
她在图书馆中的第一次活现,讲述他与她在宿舍里那想象中的壁炉前的相逢,讲她在他课堂上的现身,描述那天晚上壁炉的火光透过那瓶像晚霞的眼睛的葡萄酒在她的脸庞上映出的美丽。他幸福地回忆他们的那次旅行,详细地描述每一个最微小的细节:那雪后的田野、蓝天下的小镇和村庄、像晒太阳的老人的山,还有山上的黄昏和篝火……
大史在听完罗辑的描述后开始推测这个女孩的基本情况:
“她的文化程度,应该是大学以上博士以下。
她应该出生在一个高级知识分子家庭,过的不是富豪的生活,但比一般人家要富裕得多。她从小到大享受着充分的父爱母爱,但与社会,特别是基层社会接触很少。
她喜欢穿那种,怎么说呢,素雅的衣服,在她这种年龄的女孩子来说,显得稍微素了些。”罗辑呆呆地连连点头,“但总有很洁白的部分,比如衬衣呀领子呀什么的,与其余深色的部分形成挺鲜明的对比。
最后一点:她个子不高,一米六左右吧,身材很……怎么形容来着,纤细,一阵风就能刮跑的那种,所以这个儿也不显得低……”
在前面自信息量定义式的基础上引入对自信息量 I ( x ) I(x) I(x)的理解:
(1) I ( x ) \ I(x) I(x)表示事件 x x x是否发生的不确定度的大小。一旦该事件发生,就消除了这种不确定度,带来了信息量。
(2) I ( x ) \ I(x) I(x)表示事件 x x x的发生所带来(或所提供)的信息量的大小。
(3) I ( x ) \ I(x) I(x)表示确定事件 x x x是否发生,所需要的信息量的大小。
这里再引入信息量强可加性和可加性的公式:
强可加性: I ( x , y ) = I ( x ) + I ( y ∣ x ) = I ( y ) + I ( x ∣ y ) I(x,y)=I(x)+I(y|x)=I(y)+I(x|y) I(x,y)=I(x)+I(y∣x)=I(y)+I(x∣y)
可加性:随机变量 与 相互独立时 I ( x , y ) = I ( x ) + I ( y ) I(x,y)=I(x)+I(y) I(x,y)=I(x)+I(y)
我们假设女孩为事件 x 1 x_1 x1, P ( x 1 ) = 1 / 2 P(x_1)=1/2 P(x1)=1/2 ,根据第一部分的自信息量的定义式可知 I ( x 1 ) = 1 b i t I(x_1)=1bit I(x1)=1bit,同理记二十岁左右为事件 x 2 x_2 x2, P ( x 2 ) = 1 / 8 P(x_2)=1/8 P(x2)=1/8 , I ( x 2 ) = 3 b i t I(x_2)=3bit I(x2)=3bit ,事件 x 1 x_1 x1与事件 x 2 x_2 x2统计独立,所以根据可加性 I ( x 1 , x 2 ) = I ( x 1 ) + I ( x 2 ) = 4 b i t I(x_1,x_2)=I(x_1)+I(x_2)=\mathrm{4bit} I(x1,x2)=I(x1)+I(x2)=4bit。以此类推,雪后的田野、蓝天下的小镇和村庄、像晒太阳的老人的山,还有山上的黄昏和篝火等等这些都分别记为事件 x 3 , x 4 , x 5 , x 6 x_3,x4,x5,x6 x3,x4,x5,x6……并且计算出它们发生的概率,重复前面的步骤,当最终获得的信息量 I ( x 1 x 2 … x n ) = 33 b i t I(x_1x_2\ldots x_n)=\mathrm{33bit} I(x1x2…xn)=33bit( 2 33 = 8589934592 2^{33}=8589934592 233=8589934592,基本接近地球人口,当最终的联合事件概率接近 1 / 2 33 1/2^{33} 1/233时,信息量就达到 33 b i t 33bit 33bit,此时要找的人就可以唯一确定。)时,大史就可以唯一确定罗辑要找的人了。
一段时间后,大史找到了罗辑的梦中情人——庄颜。
同样的在侦探小说或者现实生活中,侦探或者警察办案也是在不断地搜集各种线索,然后利用这些线索提供的信息量之和唯一地去确定犯罪嫌疑人,当然了警方断案肯定不会采用这样的定量计算,但是基本的思路时一致的。
三.蓝天的熵
汪淼在玩过《三体》游戏 以后感慨道:
记得在大三的一次信息课中,教授挂出了两幅大图片,一幅是画面庞杂精细的《清明上河图》,另一幅是一张空旷的天空照片,空荡荡的蓝天上只有一缕似有似无的白云。教授问这两幅画中哪一幅所包含的信息量更大,答案是后者要比前者大一至两个数量级!
在《三体》中这段情节是三本书中对信息论知识最直接的描写,对于这段话可以有多种不同的理解:
(一)从不确定性的角度来理解
清明上河图虽然是一幅场面非常宏大的图案,但是其上的各个要素,比如人物、舟车、建筑,对于它们来说都是作者张择端经过安排而确定的,相对而言更加地有序,而蓝天以及空中的云朵它们的位置、状态等等都充满了不确定性,更加地无序,同样是一张图片,在它们消除的不确定度上显然是后者要大于前者的。
(二)用通信系统模型来理解
接下来给出通信系统的模型:
在观赏画作的过程中,画作是信源,把画布反射光这一过程当作编码过程,将信源画作的信息编码为了光信号,信号经过空气这一信道,在这里把眼球也当作信道,因为除了感光细胞以外部分并没有将光信号转化为大脑能识别的电信号的能力,把感光细胞作为译码器翻译成大脑可以识别的电信号,大脑作为信宿。
在这个过程中,编码器、信道、译码器和信宿是一样的,不同的只有信源,可能说在经过这样一个过程后信宿接收到的关于两幅图的信息量可能是接近的,但是有可能编码器、信道和译码器自身的编码译码方式的限制,信源实际的熵值有可能差距会很大。
在这里进一步将该模型简化:
无失真信源编码定理和有噪信道编码定理告诉我们,无论何种信道,只要信息传输率小于信道容量,总能找到一种编码方法,使得在该信道上能以任意小的错误概率和任意接近于信道容量的信息传输率来传输信息。反之则不能使信息的传输差错概率任意小。
但是首先无失真的编码并非总是必要的。在实际应用中信宿的灵敏度和分辨能力都是有限的,没有必要无失真地传输信息。其次无失真的编码并非总是可能的,实际信源输出常常是连续的消息,所以信源的信息量无限大受到信道容量的限制,不能实现无失真的传输连续信源的消息。既然允许了一定的失真存在也就允许压缩信源输出的信息率。
对于蓝天的画像,蓝天的图案作为一个连续信源其信源熵是无穷大,所以必须对其进行压缩,比如图案在 1 m m 1mm 1mm上有10个像素点和10000个像素点,这两种压缩方式信源熵差距也会很大,比如在10个像素点的时候某个 1 m m 2 {1mm}^2 1mm2的小方块只是一个暗斑,而在10000个像素点时可以看清是一个飞鸟。当图案分辨率足够高信息传输率 R R R足够大的时候会超过信道的容量 C C C,也超出了信宿(人大脑)的灵敏度和分辨率,即无法也无需进行无失真的传输,这就使得信宿(人大脑)接收到的信息实际上是压缩过的。清明上河图由于其较高的确定性,信源熵比较低,信息传输率 R R R小于信道容量 C C C,信宿(人大脑)可以无失真地接收信息。
在这样的情况下对于两个信源(两幅图片)发送的信息来说可能信宿(人大脑)接收的信息量可能差距并不是很大,但是实际上这两个信源(两幅图片)实际的信息量可能差距不只是一两个数量级。
四.猜疑链中的互信息两面性
在《三体》第二部《黑暗森林》中,最重要的一个概念就是猜疑链的概念,书中的原文是这样的:
如果你认为我是善意的,这并不是你感到安全的理由,因为按照第一条公理(生存是文明的最根本需要),善意文明并不能预先把别的文明也想成善意的,所以,你现在还不知道我是怎么认为你的,你不知道我认为你是善意还是恶意;进一步,即使你知道我把你也想象成善意的,我也知道你把我想象成善意的,但是我不知道你是怎么想我怎么想你怎么想我的,挺绕的是不是?这才是第三层,这个逻辑可以一直向前延伸,没完没了。
这就像是一个套娃一样,总之到了最后双方都是无法判断对方是否是善意的以及对方如何判断我方是否是善意的。然后根据博弈论的理论,在这种情况下,我方会做出主动攻击对方的举动。
按照书中的理论我们将模型简化,假设文明甲发现了文明乙,这时它有三种不同的选择以及对应的收益(收益为负即为损失):
(1)攻击文明乙,收益为0;
(2)发出和平声明表示愿意合作,在这里我们假设两个事件:在文明甲发现文明乙以后向文明乙发出和平的声明记作事件 y y y,对应概率为 P ( y ) P\left(y\right) P(y),因为发送声明意味着甲的位置暴露,文明乙有可能攻击甲,把文明乙攻击文明甲记作事件 x x x,对应概率为 P ( x ) P\left(x\right) P(x)。事件y的出现给出关于事件 x x x的信息量为互信息,公式为:
I ( x ; y ) = l o g P ( x ∣ y ) P ( x ) I(x;{y})=log{\frac{P(x\left|y\right.)}{P(x)}} I(x;y)=logP(x)P(x∣y)
其含义是:由事件 y y y消除的关于事件 x x x的不确定度。
然而互信息有一条性质是:互信息可以为正,也可以为负。互信息为正,说明事件 y y y的出现消除了关于事件 x x x的不确定度,有利于事件 x x x的出现,即文明甲发出和平声明促进了文明乙对文明甲发动进攻;反之互信息为负,说明事件 y y y的出现增大了关于事件 x x x的不确定度,不利于事件 x x x的出现,即文明甲发出和平声明阻碍了文明乙对文明甲发动进攻。正是由于互信息具有可正可负的性质,使得文明甲在发出和平声明后既有可能增大了文明乙攻击甲的可能性,也有可能减小这种可能性,这就为猜疑链的形成提供了有力的支持。
在这种情况下,我们规定若乙发动攻击时甲的收益是-10,乙选择合作时甲的收益是10;
(3)保持沉默,考虑到黑暗森林理论中的另一重要结论:技术爆炸 ,文明乙有可能在短期内发生技术爆炸后发现文明甲面临同样的问题,若乙日后发动攻击,文明甲的收益就是-10,而发出和平声明同样要面临甲准备发出和平声明时遇到的情况。
显然双方选择合作能得到最大的总收益20,但是按照囚徒困境[^5]的理论每一方还是会选择与之相反的举动,即做出攻击对方的行为,况且在本案例中,是甲先发现了乙,在做出攻击决策的时候并不会有任何的损失,这会使得甲更容易做出攻击决定。
整部《三体》第二部《黑暗森林》里最重要的“黑暗森林”理论中最重要的概念是猜疑链,正是由于文明之间猜疑链的存在使得三体人大举进攻地球,也正是由于文明内部猜疑链的存在爆发了“黑暗战役”,从某种意义上来说,整本书都是围绕猜疑链而展开的,而猜疑链究其根源还是由于互信息可正可负的性质决定的,所以要是让信息论老师给《三体》第二部起名,那一定是《互信息两面性引发的星际惨案》。
同样的我们也可用互信息两面性的知识来解释我们当下的一些现象,抑或利用好互信息两面性来为我方博取更大的利益。就比如作战行动中的佯攻,我们就可以认为是一种利用互信息可正可负性质,给予我方不希望的敌军动向以负的互信息,给予我方希望的敌军动向以正的互信息,以达到作战目的。以及赛场上的假动作、人际交往中的尔虞我诈等等我们都可以用互信息的理论来解释。
五.用平均互信息极值性诠释为什么人类最终惨败
在《三体》第三部死神永生中最为网友们津津乐道的就是在小说中男主云天明给女主程心讲的三个童话故事了。“万有引力”号向宇宙广播三体星系坐标后不久,三体星系就遭到了高级文明的黑暗森林打击,这让人类惶惶不可终日,但是“茶道谈话”结束的时候“智子”对程心说云天明想见她。在智子的安排下,程心在拉格朗日点通过“智子”实时回传的画面见到了云天明,因为三体人不许云天明向人类透露任何关于黑暗森林打击的消息,于是见面中云天明向程心讲了三个童话故事:“王国的新画师 ” “饕餮海 ” “深水王子 ” ,这三个故事蕴含了人类遭到黑暗森林打击的方式和逃避打击的方法,只是由于三体人思想透明看不懂计谋,所以没有猜出来。
程心返回地球后人类马上开始了对这三个童话故事的解读工作,由于故事充满了各种隐喻,因此破解工作并不顺利,最终由于其中最重要的黑暗森林打击方式没有被人类解读出来,导致人类走上了错误的发展方向,最终整个太阳系被神级文明“歌者”的二向箔二维化。
在这个故事情节中,我们把云天明要传递的情报作为信源传输的信息,人类解读的情报作为信宿接收到的信息,信息传输率 R = I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) R=I(X;Y)=H(X)-H(X|Y) R=I(X;Y)=H(X)−H(X∣Y),根据平均互信息的性质之一——极值性:
平均互信息 分别小于等于 和 的熵,即
I ( X ; Y ) ≤ H ( X ) I(X;Y)\le H(X) I(X;Y)≤H(X) I ( X ; Y ) ≤ H ( Y ) I(X;Y)\le H(Y) I(X;Y)≤H(Y)
如下图所示,信源熵有部分成为了损失熵,而非常不幸的是“失真”的部分恰好是最重要的黑暗森林打击方式,正因为没有解读出这部分,导致人类在决策时即使掌握了光速飞船的制造技术依然选择禁止光速飞船的研发,转而根据之前三体星系遭到的光粒打击开始掩体计划,致使人类走上了一条死路。结果令人唏嘘不已,历史给人的唯一教训,就是人们从未在历史中吸取过任何教训。又印证了前部中的那句话:弱小和无知不是生存的障碍,傲慢才是。
六.总结
除了本文介绍的三个案例,《三体》中还有许多情节涉及信息论相关知识抑或剧情的理解上可以采用信息论的观点,比如《内部参考》红岸工程文件中提到的自解译系统;三体人使用一种强思维电波进行沟通,用思维直接进行展示,说明这种“通信”方式有着比人类对话高得多的信息传输率;刘慈欣在《三体》Ⅲ中描述了四维空间中观察三维物体的景象,借助数字传真编码的知识将其扩展到三维使我更加方便地理解了小说中的设定……
通过对信息论的学习,我对小说中一些情节产生了许多畅想:叶文洁向三体星系发送信息时编码方式是什么样的?云天明在编童话故事的时候能不能引入前向纠错的方式让人类知道自己漏译了信息从而改变人类的命运?也希望通过对后续课程的学习解答自己的这些疑问,同时也希望《三体》的作者刘慈欣能为读者们带来更多更加精彩的作品。
[^1] 刘慈欣.三体[M].重庆:重庆出版社,2008.1
[^2 ] 刘慈欣.三体Ⅱ·黑暗森林[M].重庆:重庆出版社,2008.5
[ ^3] 刘慈欣.三体III·死神永生[M].重庆:重庆出版社,2010.11
[^4 ] 赵晓群.信息论基础及应用[M].北京:机械工业出版社,2015.8
[^5] 范如国 韩民春.博弈论[M].武汉:武汉大学出版社,2004