其他分享
首页 > 其他分享> > 吴军,信息论40讲,19,信噪比:历史有真相吗

吴军,信息论40讲,19,信噪比:历史有真相吗

作者:互联网

从这一讲开始我们进入课程的

第二个模块:信息传播,

我们先介绍和信道有关的知识。

我们今天的课程从一个故事讲起。

著名收藏家马未都先生有一次在电视节目中和北大一个教授争论历史是否有真相。那一次马先生其实是有备而来,他一开始引导对方进入自己准备好的战场,然后引导对方讲出破绽,最后拿出自己的证据反击。

对方显然是没有准备,其实有几次自圆其说的机会都因为慌乱而抓不住。大家可以在网上找一下那段视频,那是一个很好的辩论和说服人的案例。今天我们不讲辩论的技巧,只是就他们讨论的话题谈论信息和噪音。

在那次电视节目中,马先生先讲出一个和大众看法不太一致的观点,即历史没有绝对的真相。我们在前面的课程中讲了,重复别人的话最没有信息量,如果讲出和别人视角不同的观点,就有信息量了。这是马先生的第一个策略,先抛出一个颠覆你认知的观点。

那么历史没有真相有什么呢?马先生认为有大势,比如“分久必合,合久必分”,但是细节的真相有七成都不准确。

同时他指出,

正确的历史观比历史细节更为重要。

这种讲话的方式也是非常值得学习的,因为我们不能一味地语出惊人,而要讲清楚自己的观点。

一看自己研究的领域被说成找不到真相,那位历史教授就急了,说历史当然有真相,而且言下之意,历史学家就是要找真相。人在任何场合,特别是和别人辩论时都不能急,一急就被对方拉入自己的主场了。这位教授就犯了这个错,着了道儿。

随后,马先生就抛出一个问题:司马光砸缸是不是历史真事?这对研究宋史的教授来说并不是困难的问题,因为从所接触的资料看,司马光砸缸一事属实,正史《宋史》中明明有记载。

马先生随后又问,“你确定砸的是缸,而不是什么别的容器?”那位教授很确定,而这其实是马先生的圈套。

问完几个问题后,马先生开始讲自己的证据,根据他对中国古代陶瓷的研究,以及对中国科技历史的了解,宋朝尚没有能力烧出可以淹没哪怕是孩子(直径超过半米,高一米左右)的大缸。

其实,那么大的陶瓮早就有了,唐朝就有请君入瓮的故事,而中国确实也出土过一些能装得下孩子的瓮。但是瓮不是缸,马先生显然先要将这个漏洞堵死,才拿出自己的证据。

如果你查一下《宋史》,里面确实写了司马光类似的故事,但是还真不是砸缸,而是瓮。那位教授显然是着了马先生的道儿,但如果她当时比较冷静,回一句:“您从考古证据和科技发展研究出来当时没有缸,只有瓮,正好还原了历史,说明历史还是有真相的。”

如果当时她这么讲,自己就能借坡下驴,全身而退。只不过由于没有准备,那时就慌了神,一定要辩解说你没发现缸,不等于没有缸。

我们不去评论两人的对错。单说说历史有无真相。要说有肯定是有一些真相的,我们对大量史实的了解是没有问题的。

比如我们前面讲到的长平之战,秦国胜,赵国败,这是一条准确的信息,而不可能反过来。这场战役使得后来六国无法逆转秦国的统一进程,也是没有争议的。

但是很多细节,今天其实不清楚,比如为什么赵国决定换将,赵国到底被坑杀多少人,等等。对此今天至少有四五种非常合情合理,但是却完全不同的解释,但那些都不能说是真相。事实上由于古代信息在传递的过程中,混入了大量的噪音,因此很多细节真相今天是无法得知的。

下面这张画是著名的超现实主义画家达利画的“林肯”。那里面呈现给我们的细节和林肯没有什么关系,但是你远远地看它还是能看出林肯的轮廓。也就是说这幅画中包含着信息,但是也有噪音。历史也是如此,很多时候近看不得。

中国上一代历史学家喜欢考据,了解真相,但是历史的很多真相是了解不清的。只要历史的信噪比足够高,就能还原出历史的大脉络。

于是,中国很多新的一代历史学家受到西方大历史(Macro History)的影响,开始从宏观的角度思考历史。比如施展老师讲的《中国史纲》课程,就是沿袭这种思路。

那么,信号和噪音的比例达到一个什么程度,就能恢复出有用的信息来呢?这件事没有一个绝对的阈值,超过那个阈值就能恢复信息,不到就恢复不了,而是根据信号和噪音的比例,也就是我们要说的信噪比,在不同程度上能够恢复一定的信息。

我们前面讲了信息的置信度,对于那些置信度不高的信息,并不值得相信,而相信了错误的信息是要付出代价的,代价的大小视自己心中的估计和真实结果的差异而定。

但是很多时候,我们要考察的不是一条信息的准确性,而是大量数据中,有多少是准确的信息,有多少是噪音。当信息量非常非常大时,即使单个信息的置信度不是很高,我们还是能够在信噪比允许的范围内,恢复出不少信息的。

要说信噪比,先说说什么是噪音。“噪音”这个词大家经常在生活中用到,对它并不陌生。在信息论中,噪音有特殊的含义,它可以是嘈杂的信号和声音,但又不完全相同,也可以是其他的干扰。它有下面三个特点:

未知,而且通常是随机的,也就是说难以预测。我们在生活中有这样的经验,如果你在房间里和别人谈话,有背景音乐让你觉得谈话听不清,你关了音乐即可,很确定。但是对于那些不知道来源,或者你关不掉的嗡嗡声,你就很烦。
不含有用信息。比如你在咖啡厅和朋友聊天,有一些轻柔的背景音乐,不影响你们的谈话,还让你觉得增加了两个人接近的程度,但是从信息论的角度讲它也是噪音,因为它其实影响到你们的语音通信。但是,如果你们在谈话,后面有两个人在悄悄议论你,被你无意间听到了,这时虽然它影响了你和朋友的说话,但对你来讲不仅不是噪音,甚至是很重要的信息。
噪音和信息不是绝对的,要看场景。你开车时发动机的声音就是噪音,但是在检查汽车工作状态时,那种嗡嗡声可能就是信息了。

噪音的出现使得信息的捕获、存储、传输和处理会受到影响。因此,我们要想准确获得信息,信息本身的幅度(也就是能量)相比噪音需要足够高。比如在吵闹的街道上,你可能听不清同伴的声音,这时你的同伴就不得不提高音量。

相反,如果是在夜深人静的时候,你们轻轻说话,彼此都能听清楚。也就是说,信号(能量)和噪音(能量)的比例,决定了我们是否能够有效地获取信息。这个比例在信息论上被称为信噪比。

信噪比要多高,获取的信息才准确呢?这取决于接收者捕获和处理信息的能力。比如有的人耳朵非常好,信噪比比较低的讲话都能听清楚,但是有些人你就要冲他们大声吼。很多电子设备,它们接收语音,过滤噪音的能力比人强,我们人分辨不了的语音,那些专门的机器能够做到。

类似的,识别图像也是如此。给我们一张相机拍下来的照片,我们很容易分辨出一个人。如果只给我们视频中的截屏,我们分辨起来就难了,因为后者的信噪比太低。

如果回顾一下我们第12讲的内容,由于视频压缩的比例极高,因此很多信息是丢掉了的,相比之下照相机拍的静态图片压缩掉的信息并不多。但是,今天具有智能识别功能的摄像头,识别视频中人的能力要超过我们人,也就是说,它们能够处理信噪比比较低的图像信息,而我们人类做不到。

关于信号和噪音的关系,你还需要知道两点,这两点可以帮你:

首先,它们是一对孪生子,总是相伴存在的。虽然我们在处理信息时总希望没有噪音,但是这就如同我们希望找到全是优点没有缺点的人一样,是不可能的。

因此,考察和判断一个人是否有处理问题的能力,不是考察他在纯粹无噪音的条件下的能力,而是要考察他能否在有噪音的情况下,依然把信息找出来,处理好。这就如同培养交友能力必须基于存在损友这个前提假设一样。

我们在生活中会发现这样的现象,张三这个人讲的事情大部分时候是靠谱的,但是有些时候很随意,这时候你信他还是不信他,这就是艺术了。

有的人爱轻信,结果经常把噪音当成有用信息,免不了作出错误的判断;有些人则完全相反,只要有噪音就不信,结果他就是一个怀疑一切的人,我个人觉得后一种人比前一种人还辛苦。至于怎么过滤噪音,这是我们下一讲要讲的内容。

其次,由于信号的能量和噪音的能量叠加了,因此具体到每一个信号点,它的准确性,或者说置信度,都是严重受到干扰的。

下面两张图是相同的语音,前面的一张是比较干净的,后面的一张是被噪音覆盖了的。你如果看细节,它们相差很大,但是你看整体的轮廓,还是能找到相似性的。事实上,如果你播放这两段语音,还是能够听出是同一个意思的。

讲回到历史这件事。历史的很多细节是不准确的,而且也无法准确,因为历史书上记录的内容犹如第二幅图中的语音,信号是被噪音所覆盖的。但是,历史的轮廓还是可以看清楚的。

很多人讲,

我写的历史是西方那种大历史,不追究细节,只讲大势。(搭架子,注重大方面,适当忽略小方面)

这里面有一个重要的原因,就是我无法搞清楚每一个细节,因此只能使用信得过的学者对细节的研究作为我再加工的基础,然后在很长的宏观维度,去诠释历史的规律。

也就是说,我看到的历史就如同达利画的林肯,亦或者是上面两张图中的第二张,重在轮廓和走势。而很多专业历史学家的工作,则是去除噪音,提高信噪比。

预告:至于如何去噪音,如何提高我们对信息准确性的判断力,准确把握信息,让我们的工作和生活变得更好,这是我们下一讲要谈论的话题。

思考题:请你说说自己在工作和学习中,抓大放小的经历。

标签:历史,真相,19,信噪比,信息,噪音,40,马先生
来源: https://blog.csdn.net/u013120862/article/details/120402461