出版社: 人民邮电出版社
出品方: 图灵新知 / 图灵教育
副标题: 一部历史 一个理论 一股洪流
原作名: The Information: A History, A Theory, A Flood
译者: 高博
出版年: 2013-10
页数: 476
定价: 69.00元
装帧: 平装
ISBN: 9787115331809
内容简介 · · · · · ·
人类与信息遭遇的历史由来已久。詹姆斯•格雷克笔下的这段历史出人意料地从非洲的鼓语讲起(第1章)。非洲土著部落在尚未直接跨越到移动电话之前,曾用鼓声来传递讯息,但他们是如何做到的呢?后续章节进而讲述了这段历史上几个影响深远的关键事件,包括文字的发明(第2章)、罗伯特•考德里的第一本英语词典(第3章)、查尔斯•巴贝奇的差分机与爱达•拜伦的程序(第4章)、沙普兄弟的信号塔与摩尔斯电码(第5章)。
但人类开始自觉地理解和利用信息始于克劳德•香农在1948年创立的信息论(第6、7章)。香农的信息论不仅推动了信息技术的发展,也引发了许多学科的信息转向(第8章),改变了人们对于诸如麦克斯韦妖(第9章)、生命的编码(第10章)、模因(第11章)、随机性(第12章)、量子信息论(第13章)等的理解。部分科学家甚至认为,构成世界的基础不是物质,不是能量,而是信息。正如物...
人类与信息遭遇的历史由来已久。詹姆斯•格雷克笔下的这段历史出人意料地从非洲的鼓语讲起(第1章)。非洲土著部落在尚未直接跨越到移动电话之前,曾用鼓声来传递讯息,但他们是如何做到的呢?后续章节进而讲述了这段历史上几个影响深远的关键事件,包括文字的发明(第2章)、罗伯特•考德里的第一本英语词典(第3章)、查尔斯•巴贝奇的差分机与爱达•拜伦的程序(第4章)、沙普兄弟的信号塔与摩尔斯电码(第5章)。
但人类开始自觉地理解和利用信息始于克劳德•香农在1948年创立的信息论(第6、7章)。香农的信息论不仅推动了信息技术的发展,也引发了许多学科的信息转向(第8章),改变了人们对于诸如麦克斯韦妖(第9章)、生命的编码(第10章)、模因(第11章)、随机性(第12章)、量子信息论(第13章)等的理解。部分科学家甚至认为,构成世界的基础不是物质,不是能量,而是信息。正如物理学家约翰•惠勒所说,“万物源自比特”。
现如今,信息如洪流般淹没了我们,使我们深陷信息焦虑、信息过载、信息疲劳的困扰。但回顾历史,这并不是件新鲜事,人们也总是能想出应对手段。维基百科(第14章)、Google(第15章)便是我们的应对之一。无论对于信息的未来持何态度,有一点是确定无疑的,即我们人类是信息的造物。
作为《混沌》、《费曼传》、《越来越快》、《牛顿传》等畅销书的作者,格雷克不仅在书中细致还原了历史细节,通俗解释了各种理论,还生动刻画了几位不为大众所知的人物:可编程计算机先驱、超越时代的查尔斯•巴贝奇,第一位程序员、诗人拜伦之女爱达•拜伦,计算机科学之父、天妒英才的阿兰•图灵,以及全书的主人公、信息论之父克劳德•香农。
作者简介 · · · · · ·
詹姆斯•格雷克(James Gleick),生于1954年,本科毕业于哈佛学院,曾长期在《纽约时报》担任记者和编辑,并多年为《时代》周刊撰写技术专栏。1987年,他的首部作品《混沌:开创新科学》入围了美国国家图书奖和普利策奖的决赛,并成为畅销书,使得“混沌”、“蝴蝶效应”的说法家喻户晓,现已销售超过百万册。其后他又陆续出版了《费曼传:1000年才出一个的科学鬼才》(1992)、《越来越快:飞奔的时代飞奔的一切》(1999)、《牛顿传》(2003)等书,相继被翻译成了二十多种语言。
他是最早一批投入Internet创业热潮的人。1993年11月,他与合作者联合推出了Pipeline互联网接入服务,率先提供了用户友好的图形界面。十四个月后,Pipeline以一千万美元股票的价格出售。
目录 · · · · · ·
推荐序二
推荐序三
更多推荐
引子
第1章会说话的鼓(似是而非的编码)
第2章持久的文字(心智中并无词典)
第3章两本词典(我们文字的不确定性以及我们拼写的随意性)
第4章将思想的力量注入齿轮机械(喔,欣喜若狂的算术家啊!)
第5章地球的神经系统(就那么几根破电线,我们能指望它什么呢?)
第6章新电线,新逻辑(没有别的什么东西比它更严密地为未知所包裹)
第7章信息论(我想要的不过只是一颗寻常的大脑)
第8章信息转向(形成心智的基本要素)
第9章熵及其妖(你无法通过搅拌将果酱和布丁区分开来)
第10章生命的编码(关于生物体的完整描述都已写在了卵里)
第11章跃入模因池(它其实就是寄生在了我的大脑里)
第12章认识随机性(僭越之罪)
第13章信息是物理的(万物源自比特)
第14章洪流过后(一本宏大的巴别相册)
第15章每天都有新消息(或者诸如此类)
尾声(意义的回归)
参考文献
致谢
图片版权
译后记
· · · · · · (收起)
"信息简史"试读 · · · · · ·
投身信息产业的怀抱快三十年了,我有时也在想:信息何以会具备如此强大的力量?它的力量来自哪里?我们又该如何驾驭这一力量?在这三十年间,信息极大地释放了人类的能量,它所创造的价值超过了之前五千年的财富总和,但“信息”依然是个大家耳熟能详却又含义模糊的词。在这三十年间,产业化的信息就像一部两百迈的汽车行驶在未来之路上,但我们并不知道它要开往何方。也许詹姆斯•格雷...
原文摘录 · · · · · · ( 全部 )
-
如果把基因视为生存大师,那它们就不太可能是一些核酸片段,毕竟这些东西无法长久。而说一个复制子成功地延续了亿万年时间,也就意味是将其所有副本视而为一,以此定义这个复制子。因此,道金斯宣称,基因不会“衰老”。 它在一百万岁时死亡的概率,不会比只有一百岁时更大。它在一代代的身体当中迁徙,为自己的目的、以自己的方式操控着这一具具身体,并在这些终有一死的身体衰老和死亡前抛弃了它们。 纸面上的那些四分音符和八分音符并不是音乐。音乐不是空气中的一系列声波,也不是唱片上的纹路或光盘上的凹坑,甚至也不是在听众脑中激活的神经元交响曲。音乐就是信息。同样地,DNA的碱基对也不是基因,它们只是编码了基因。基因本身是由比特构成的。 (查看原文) —— 引自第319页 -
他写道:“模因通过一个广义上可称为模仿的过程在一个个大脑间跳跃,从而在模因池里传播开来。“各个模因会相互竞争,以争夺有限的资源,如大脑的运算时间或带宽,或者说大脑的注意。 在从我们的大脑和文化中争夺生存空间的战斗中,有效的作战单位是讯息。而我们对于基因和模因的新视角,虽然可能不好理解,却给了我们有益的启示,也给了我们更多可以写在莫比乌斯带上的悖论。比如,大卫·米切尔曾写道:“构成人类世界的是故事,而不是人。那些被故事用来讲述自己的人,不应该受到责备。”玛格丽特·阿特伍德也写道:“就跟所有知识一样,一旦你知道了这一点,你就再也无法想象要是当初你没有知道它又会是番什么情景。这又像舞台魔术,在你还不知道时,即便知识就站在你眼前,你也会视若无睹,看向别的地方。”约翰·厄普代克则在暮年反思自己的写作生涯时写道: 一生倾注于文字——但它显然徒劳 在保存逝去的事物。 因为在我死后不能想象的未来 谁还会去读? 1981年,研究心智和知识的哲学家弗雷德·德雷特斯科写道:“太初有信息,而后才有的道(word)。这种转换的实现有赖于生物体发展出选择性利用这些信息从而让自己的物种生存和延续下去的能力。”而现在,在道金斯的启示下,我们或许可以再补充一句:这种转换的实现也有赖于信息自身,它们寻求生存和延续并选择性地利用这些生物体。 (查看原文) —— 引自第319页
> 全部原文摘录
喜欢读"信息简史"的人也喜欢的电子书 · · · · · ·
信息简史的书评 · · · · · · ( 全部 95 条 )

The Information中文版年内出版
> 更多书评 95篇
-
cp4 (唯有未知不可摇撼)
P34:一旦一个人能够把字词写下来,对它们进行仔细考察,每天从全新的视角对它们加以审视,并追索它们的含义,他就成了一名哲学家。在亚里士多德看来,最基本的概念不仅值得定义,而且需要加以定义,比如: “起始指不必跟从任何它者,但排在第二位的某物自然存在或出现于它之后。相反,结尾指本身自然地跟从某个它者,或者处于必然或者是大多数情况下如此,但不但有任何它者跟随其后了。” (——纠结于数学是主观的还是客观的...2014-06-29 10:23:18 3人喜欢
P34:一旦一个人能够把字词写下来,对它们进行仔细考察,每天从全新的视角对它们加以审视,并追索它们的含义,他就成了一名哲学家。在亚里士多德看来,最基本的概念不仅值得定义,而且需要加以定义,比如: “起始指不必跟从任何它者,但排在第二位的某物自然存在或出现于它之后。相反,结尾指本身自然地跟从某个它者,或者处于必然或者是大多数情况下如此,但不但有任何它者跟随其后了。” (——纠结于数学是主观的还是客观的人可以从这里开始:“起始”的概念是人造的还是客观的?) 这些表述与经验无关,它们是在运用语言来组织经验。(——不敢苟同前半句,语言和思维的关系是个鸡和蛋问题,在我看来,它们是共同演化的。) …… P35:逻辑是书面文字的产物,这一点在各自独立发展出逻辑学的古希腊、古印度或古中国都概莫能外。反面论点见:John Halversion,“Goody and the Implosion of the Literacy Thesis," Man 27, no.2(1992):301-317 …… P155:John Wilkins(Mercur: Or the Secret and Swift Messenger):”因为我们必须意识到,一般说来,任何能够创造出有效的差异,可为某种感官所感知的东西,都足以作为表达思想的手段。“在这里,这份1641年不为人知的匿名专著中,信息论的核心思想浮出了人类思维的表面,却像土拨鼠一样看见了自己的影子,于是又沉没下去,消失长达三百多年。 …… P160:1873廿,《哈泼斯》的一位随笔作家写到:”电报将给人类思维带来的最广泛也最重要的影响恐怕来自于它对于语言的影响……类似于达尔文提出的自然选择原理,在语言使用中,短词将逐渐对长词占有优势,直接表达形式将逐渐对间接表达形式占有优势,含义清晰的字词将逐渐对模棱两可的字词占有优势,而地方性的习语都将处于劣势。“ (——一个在1873年写出上面文字的作家,其洞察力简直令人震惊。) P161:到了19、20世纪之交,罗特兰·罗素给与了乔治·布尔非同寻常的赞颂:”纯数学是由布尔在其《思维的规律》中发现的。“但人们却很少引用其后的批评:”他错误地以为自己在讨论思维的规律……要是他的著作真的包含思维的规律,那么很奇怪为什么此前没有一个人用这样的方式思考呢?“ …… P170:Vannevar Bush写到:”数学家并不是那种能够轻易摆布数字的人,他们常常做不到这一点。数学家的主要技能是擅长在一个高层次上运用符号逻辑,尤其他们有着优秀的直觉判断力。“ …… P212:在香农看来,模式等同于冗余。 P251:在美国,威廉·詹姆斯几乎凭一己之力创建了心理学这门学科,在他花十二年时间完成了这部巨著时,他却心生弃意。他在给出版商的信中写到,这在自己看来是”一堆令人生厌、冗长、累赘、臃肿的文字,只表明了两个事实:其一,根本不存在一门称为心理学的科学;其二,威廉·詹姆斯无能。“ …… P267:麦克斯韦指出:”由此可以得出的一个结论是,能量耗散的概念取决于我们的知识水平。……耗散掉的能量是而我们无法掌控或按意志加以引导的能量。“ ”混乱,如同与之相关的术语秩序一样,并不是物质本身的属性,而是与观察他们的心智息息相关。耗散掉的能量的概念,对于不能自主利用任何自然界能量的存在物,或是能够跟踪每个分子的运动并在恰当时机俘获它们的存在物而言,都是没有意义的。“ P273:莱奥·齐拉特,日后提出了电子显微镜、核连锁反应、直线加速器、回旋加速器等设想,完成了通往香农”信息是熵“的构想的最后一环。Leo Szilard, ”On the Decrease of Entropy in a Thermodynamic System by the Intervention of Intelligent Beings“ …… P277:一种流行观点是生物体以来与周围环境交换物质或能量而存活,薛定谔视为扯淡,相反他指出:生物体以负熵为食。”新陈代谢的本质是,生物体成功地使自己摆脱在其存活期内必然产生的所有熵。“ …… P297:塞缪尔·巴特勒:”凭什么说是鸡生蛋而不是蛋生鸡?这些无法用哲学解释的问题,或许从另一个角度就可以解答,那就是考虑到人类的自负以及长久以来的、忽略一切不像自己的事物的习惯。“(Samuel Butler, Life and Habit) 丹尼尔·丹尼特:”学者不过是一座图书馆用来制造另一座图书馆的工具。“(Daniel C. Dannett, Darwin's Dangerous Idea: Evolution and the Meaning of Life) P303: 同样地,DNA的碱基对也不是基因,它们只是编码了的基因。基因本身由比特构成。 …… P308: 莫诺:”思想保留了生物体的某些属性。思想也倾向于维持其结构并繁衍生息;它们也可以融合、重组或分离其内容;事实上,它们还可以进化,而在这个过程中,选择淘汰必定扮演着重要角色。“ P310 就像单个核苷酸不是基因一样,模因是复杂单元。呼啦圈不是模因,它是数个模因的产物和实物化身。呼啦圈本身是模因的载具,玩呼啦圈的人也是。 P313 人们不可避免地开始用疾病来类比模因,比如某种情绪蔓延开来,某段旋律具有感染力,某个习惯具有传染性。病毒式教育,病毒式营销,病毒式电子邮件。 P317 基因起码还有物质实体作为基础,模因确实抽象、无形、不可度量的。基因的复制有着近乎完美的保真度,这也正式进化所依赖的。模因却很少精确的复制。
回应 2014-06-29 10:23:18 -
韩偏偏 (您多虑了。)
第10章,作者根据人类对于“基因”这一事物循序渐进的认识与理解,为我们归纳推导出了“基因本身是由比特构成的”这一结论。 如果把基因视为生存大师,那它们就不太可能是一些核酸片段,毕竟这些东西无法长久。而说一个复制子成功地延续了亿万年时间,也就意味是将其所有副本视而为一,以此定义这个复制子。因此,道金斯宣称,基因不会“衰老”。 它在一百万岁时死亡的概率,不会比只有一百岁时更大。它在一代代的身体当中迁徙...2017-09-25 10:57:51 2人喜欢
第10章,作者根据人类对于“基因”这一事物循序渐进的认识与理解,为我们归纳推导出了“基因本身是由比特构成的”这一结论。
如果把基因视为生存大师,那它们就不太可能是一些核酸片段,毕竟这些东西无法长久。而说一个复制子成功地延续了亿万年时间,也就意味是将其所有副本视而为一,以此定义这个复制子。因此,道金斯宣称,基因不会“衰老”。 它在一百万岁时死亡的概率,不会比只有一百岁时更大。它在一代代的身体当中迁徙,为自己的目的、以自己的方式操控着这一具具身体,并在这些终有一死的身体衰老和死亡前抛弃了它们。 纸面上的那些四分音符和八分音符并不是音乐。音乐不是空气中的一系列声波,也不是唱片上的纹路或光盘上的凹坑,甚至也不是在听众脑中激活的神经元交响曲。音乐就是信息。同样地,DNA的碱基对也不是基因,它们只是编码了基因。基因本身是由比特构成的。 引自 第11章 跃入模因池 道金斯的视角在我看来是一种极致的冷静,仿佛是一种站在宇宙的高度才能得到的观点。倒是让我想到了漫威《银河护卫队2》里Ego的行为。永生的基因便是天神,为了使自己的“生命”延续扩展开来,使用的方法是侵占生命。
而之后道金斯继续提出的模因的概念,也确实让人产生了一种科幻般的内心恐惧感。
他写道:“模因通过一个广义上可称为模仿的过程在一个个大脑间跳跃,从而在模因池里传播开来。“各个模因会相互竞争,以争夺有限的资源,如大脑的运算时间或带宽,或者说大脑的注意。 在从我们的大脑和文化中争夺生存空间的战斗中,有效的作战单位是讯息。而我们对于基因和模因的新视角,虽然可能不好理解,却给了我们有益的启示,也给了我们更多可以写在莫比乌斯带上的悖论。比如,大卫·米切尔曾写道:“构成人类世界的是故事,而不是人。那些被故事用来讲述自己的人,不应该受到责备。”玛格丽特·阿特伍德也写道:“就跟所有知识一样,一旦你知道了这一点,你就再也无法想象要是当初你没有知道它又会是番什么情景。这又像舞台魔术,在你还不知道时,即便知识就站在你眼前,你也会视若无睹,看向别的地方。”约翰·厄普代克则在暮年反思自己的写作生涯时写道: 一生倾注于文字——但它显然徒劳 在保存逝去的事物。 因为在我死后不能想象的未来 谁还会去读? 1981年,研究心智和知识的哲学家弗雷德·德雷特斯科写道:“太初有信息,而后才有的道(word)。这种转换的实现有赖于生物体发展出选择性利用这些信息从而让自己的物种生存和延续下去的能力。”而现在,在道金斯的启示下,我们或许可以再补充一句:这种转换的实现也有赖于信息自身,它们寻求生存和延续并选择性地利用这些生物体。 引自 第11章 跃入模因池 不管怎么说,道金斯的视角新颖独特,在我眼中就像个无敌的脑洞可以无限扩展,也想一部可以带来无限感慨的科幻大片。由书中举出的例子,“模因”这个概念似乎特别适合现在三天两头蹦新词的微博世界,也可能正是这种身处其中的相似感,会减弱这个概念的超越性,也会让我这种对网络世界无感,且在信息爆炸中疲惫不堪的人无法打起精神来深究“模因”更深层次的更有现实意义的非功利意义。
但谁又能说,我这样的状态让“模因”们看到,不会造成一种黄雀伺蝉的局面呢?
回应 2017-09-25 10:57:51 -
Cambrian (而昔日的梦悄然爬上我身)
第8章 信息转向 (形成心智的基本要素) 将信息论应用于超出其原本意图的领域,很可能是件危险的事情,但 我想危险恐怕也阻止不了人们这样做的热情。 ——J. C. R. 利克里德(1950)[1] 大部分数学理论都是慢慢成形的,香农的信息论却如雅典娜一样,甫一问世 便已成熟。不过,香农和韦弗的小书在 1949 年出版时,并没有引起公众足够的关 注。第一篇书评来自数学家约瑟夫·利奥·杜布。他抱怨,整个讨论“暗示”的 意味多于数学推导... (2回应)2021-06-24 22:45:53 1人喜欢
第8章 信息转向
(形成心智的基本要素)
将信息论应用于超出其原本意图的领域,很可能是件危险的事情,但 我想危险恐怕也阻止不了人们这样做的热情。
——J. C. R. 利克里德(1950)[1]
大部分数学理论都是慢慢成形的,香农的信息论却如雅典娜一样,甫一问世 便已成熟。不过,香农和韦弗的小书在 1949 年出版时,并没有引起公众足够的关 注。第一篇书评来自数学家约瑟夫·利奥·杜布。他抱怨,整个讨论“暗示”的 意味多于数学推导,并且“作者运用数学的动机并不总是那么正大光明”。[2]一份 生物学期刊评论道:“乍看之下,这主要是本工程学专著,对于解决人类实际问 题用处不大,或甚至根本没用。但事实上,该理论具有许多相当令人振奋的意 涵。”[3]《哲学评论》称,哲学家不应忽视这本书:“香农提出了一个‘信息’的 概念,并且令人惊讶的是,这个概念竟然是热力学中‘熵’概念的延伸。”[4]而 其中最奇怪的评论来自 1950 年 9 月的《今日物理》(Physics Today),文章作者 是麻省理工学院的诺伯特·维纳。这篇只有五段话的文章很难称得上是一份书评。
一开篇,维纳讲述了一则略带倚老卖老意味的轶事:
大约十五年前,一名非常聪明的年轻学生向麻省理工学院的教授提
230 | 信息简史 出了自己的一个设想,试图建立一种基于逻辑代数的电动开关理论。这
名学生就是克劳德·香农。
维纳接着说,在这本书中,香农(与韦弗一起)“总结了他对于通信工程的见解”。 维纳认为,香农提出的基本思想是“把信息量视为负熵”,并随即补充道,他
本人(“本书评作者”)也几乎在同一时间产生了相同的见解。 维纳声称,虽然香农的研究“独立于我的研究,但它从一开始就与我的研究 紧密联系,并有着相互影响”。他还提到,通信理论与统计力学之间的类比初看上 去有点牵强,但对于“我们当中那些已经试图将这个类比延伸至麦克斯韦妖研究
的人来说”,它是个物理事实。但对此,他补充道,相关研究还任重道远。 维纳进而指出,香农对于语言的讨论没有给予语言在人类神经系统内的通信
过程(“神经接收并传递语言到大脑”)以更多重视。不过,他也强调:“我这样说, 并不是为了吹毛求疵。”
最后,维纳用一整段文字介绍了另一本新书:“我自己的《控制论》”。他认为, 这两本书是一个必将迅猛发展的领域中最早的两声欢迎礼炮。
而在我的书中,作为作者,我有幸能从更思辨的角度,讨论比香农 和韦弗博士所选的更广阔的话题。我希望重申,在一个新领域......不仅 有空间,而且也确实需要种种在现实性或思辨性上各具特色的著作。
他之所以向这两位同人致以了敬意,恰是因为他们独立且精彩的工作殊途同归, 归到了自己的控制论上。
其实,香农此前已经在《无线电工程师学会学报》上针对维纳的书写过一篇 短评,虽是赞赏,但程度可谓轻淡:这是一本“出色的导论”。[5]两人的关系有点 紧张,这从《通信的数学理论》中韦弗文章开头的一个大段脚注中就能感觉得到:
香农博士强调,他的通信理论在基础哲学原理方面颇多受益于诺伯 特·维纳教授。另一方面,维纳教授也指出,香农在开关和数理逻辑方 面的许多早期研究是在他对该领域产生兴趣之前,并且他大度地补充道,
第8章 信息转向|231 引入熵的思想,将之作为该理论的基本思想,确实是香农一个人的功劳。
香农的同事约翰·罗宾逊·皮尔斯后来写道:“维纳当时满脑子里都是他自己的研 究......一些有识之士曾告诉我,维纳误以为自己早已得出了香农所得到的结论, 但其实他从来都没得出过。”[6]
控制论(cybernetics),作为一个新创词、一个日后的热门词、一块全新的研 究领域、一场将来的哲学运动,是由维纳这位聪明过人又锋芒毕露的思想家凭一 己之力所构想出来的。维纳借用的是希腊语中的“舵手”(κυβερνήτης,kubernites) 一词[英语中的 govern(治理)一词也源自于此,显然这并非巧合]。[7]维纳的控 制论意在整合通信和控制的研究,乃至人类和机器的研究。在他身为哈佛教授的 父亲培养和宣扬下,诺伯特·维纳年少成名,享有神童之誉。年仅十四岁时,他 就登上了《纽约时报》的头版:“一个被他的朋友们自豪地誉为世界上最聪明男孩 的小伙子,下个月就将从塔夫茨学院毕业......除了学习能力过人之外,诺伯特·维 纳与其他男孩一般无二......他那双深邃的黑色眼睛是他最引人注目的特征。”[8] 而在撰写自己的回忆录时,维纳也总是会在书名中加上神童两字,如《昔日神童: 我的童年与青年时代》和《我是数学家:一个神童后来的生活》。
从塔夫茨学院(数学专业)本科毕业后,维纳先后到了哈佛大学研究生院(动 物学专业)和康奈尔大学(哲学专业)深造。然后在回到哈佛取得博士学位后, 他又动身前往英国剑桥大学,师从罗素本人,研究符号逻辑和《数学原理》。不过, 罗素对维纳并不是全然欣赏,他曾在给友人的信中写道:“我这来了个名叫维纳的 神童,十八岁,哈佛大学博士......这孩子被惯坏了,以为自己是全能的上帝—— 我俩之间总是在暗暗较劲究竟谁该教谁。”[9]而维纳对罗素也不无反感:“他冷酷 如冰山。他的思维给人感觉就像一部敏锐、冷酷而狭隘的逻辑机器,这部机器会 将宇宙切成整齐划一的小块,比如长宽高正好三英寸。”[10]回到美国后,维纳从 1919 年开始在麻省理工学院执教,与万内瓦尔·布什恰在同一年。1936 年,香农 到麻省理工学院深造时,还上过维纳的数学课。随着战争阴影的逼近,维纳是最 早一批加入了机密的高射炮火控系统研究的人。
232 | 信息简史
诺伯特·维纳(1956 年)
他身材矮胖,留着山羊胡,头戴厚厚的眼镜。相较于香农的火控研究是深入 到研究噪声中的信号,维纳则是一直专注于研究噪声,比如雷达接收器上密集的 波动、飞行路线变幻莫测的偏差等。按他的理解,这些噪声在统计上与布朗运动 相似。布朗运动是一种“极其活跃而又完全杂乱无章的运动”,最早在 17 世纪由 列文虎克通过显微镜观察到。在 20 世纪 20 年代,维纳曾对布朗运动有过深入的 数学分析。当时他被这种不连续性所吸引,因为不仅是微粒轨迹,而且数学函数 也表现异常。他把这称作“离散混乱”(discrete chaos),chaos 这个术语则还要再 过几代人的时间才会被人们很好地理解。*在火控系统的研究中,相较于香农在贝 尔实验室研究组中所做的不太大的贡献,维纳与其同事朱利安·比奇洛(Julian Bigelow)则一起完成了一份极为知名的 120 页专著。它一度被列为机密,并被数
——————————
* 这里的 chaos 与 20 世纪 70 年代兴起的混沌理论(chaos theory)中的 chaos 并不完全相同。后者指 的是对初始条件极其敏感的动力系统的行为,最早由詹姆斯·艾伦·约克和李天岩在 1975 年提出。 前者则描述的是一种随机、混乱的状态。——译者注
十个有权查阅该书的人称为“黄祸”,这不仅是由于它有一个黄色封面,还由于它
的内容艰深难懂。在这份正式标题为《平稳时间序列的外推、内插与平滑化》 (Extrapolation, Interpolation, and Smoothing of Stationary Time Series)的研究中, 维纳发展了一种统计方法,用以根据有噪声、不确定和有失真的历史数据预测未 来。这种方法超出了当时武器的能力范围,但维纳还是在布什的微分分析机上进 行了测试。在他的设想中,高射炮及其炮手、目标飞机及其驾驶员,双方都是人
和机器的混合体,相互要预测对方的行为。 香农是沉默寡言,维纳则老于世故。他游历广博,通晓多国语言,雄心勃勃
且关注社会。他对科学的热情完全是发自内心,这从他对热力学第二定律的表述 中就可见一斑:
我们所做的是在奔向无序的巨流中努力逆流而上,否则它将使一切 最终陷于热力学第二定律所描绘的平衡和同质的热寂当中......这种物理 学上的热寂在克尔凯郭尔的伦理学中有个对应物,也就是我们所生活的 混乱的道德宇宙。在其中,我们的主要使命就是建立起一块块具有秩序 和体系的独立领地。但这些领地在我们建立起来后并不会就一直延续下 去。正如《爱丽丝镜中奇遇》里的红皇后所说的,我们只有全力奔跑, 才能留在原地。[11]
维纳很关心自己在人类思想史上的地位,并且志存高远。他在回忆录中写道,控 制论是“一种对人类,对人类关于宇宙和社会的知识的全新阐释”。[12]香农把自 己视为数学家和工程师,维纳则认为自己首先是个哲学家,甚至从火控系统的研 究中,他也能得出关于目的和行为的哲学结论。如果把“行为”的定义巧加改动
(“实体针对环境所做的任何变化”[13]),那么除了动物,这个词也能拿来描述机 器。为实现某个目标而采取的行为具有目的性,而目的有时是出自机器本身,而 非机器的人类操作员:比如,一种配备目标搜寻机制的鱼雷。“‘伺服机制’一词 正是用来称呼那些能实行具有内在目的性行为的机器。”其中的关键是控制,或自 我调节。
第8章 信息转向|233
234 | 信息简史
为了对此进行有效分析,维纳从电气工程中借用了一个不常用的概念:“反 馈”,即使能量从电路的输出端返回至其输入端。在正反馈的情形中,比如把扩音 器输出的声音通过麦克风再次放大,它最终会使系统失去控制。但在负反馈的情 形中,比如用于控制蒸汽机的早期机械离心式调速器(詹姆斯·克拉克·麦克斯 韦最早对此进行了分析),它却能将系统导向均衡,这时它起到了维持稳态的作用。 反馈可以是机械的:离心式调速器旋转得越快,其悬臂就伸展得越宽;反过来, 悬臂伸展得越宽,其旋转就势必越慢。反馈也可以是电气的。但无论是哪种方式, 信息都是整个过程中的关键。比如,高射炮火控系统的关键是,有关飞机坐标以 及有关高射炮自身上一个位置的信息。正如维纳的朋友比奇洛所强调的,对于上 一个行动的结果,重要的“不是如能量、长度或电压之类的具体物理量,而是信 息(无论其以何种途径传递)”。[14]
维纳意识到,负反馈肯定无所不在。比如在手眼协调中,负反馈引导着神经 系统,才能让人完成普通如拾起一支铅笔的动作。因此,他特别关注影响肢体协 调或语言表达的神经失调,认为这正是信息反馈机制出错的具体情形:比如各种 运动性共济失调,就是由于感官讯息或在脊髓处被阻断,或在小脑处被误读所致。 维纳对此的分析深入细致,也很数学化,甚至列出了方程,而这在神经学领域几 乎是前所未闻的。与此同时,反馈控制系统也被逐渐引入工厂装配线,毕竟机械 系统也同样能修正自身行为。反馈成了名副其实的治理者、舵手。
就这样,“控制论”成了维纳首部著作的主书名,副书名则是“或关于在动物 和机器中控制和通信的科学”。该书在 1948 年秋在美国和法国出版,而令出版社 吃惊的是,这样一部充斥着概念和分析的作品竟然出人意料地成了当年的畅销书, 连美国的大众新闻杂志《时代》周刊和《新闻周刊》都对它进行了专题报道。事 实上,维纳的控制论适逢其时,因为当时一样新事物正开始进入公众的视线,那 就是计算机器。随着战争的结束,首批为战争上马的电子计算工程也揭去了神秘 面纱,尤其是在宾夕法尼亚大学电气工程学院的埃尼阿克(ENIAC)。这是个重近 三十吨、长近三十米的庞然大物,由众多真空管、继电器和手焊线路组成,能够 对最多二十个十进制数进行存储和乘法操作,曾被美军用来计算火炮射表。国际
商用机器公司(IBM)除了为军事工程提供打孔卡片制表机外,也在哈佛大学建 造了一部巨型计算机器——马克一号(Mark I)。而在英国的布莱切利庄园,密码 破解者们建造了多部称为巨像(Colossus)的真空管计算机器,但它们在战后多 年依然是高度机密。阿兰·图灵在曼彻斯特大学也在建造类似的机器。所以当公 众得知这些机器的情况后,他们自然而然会将它们想象成“大脑”。所有人都在问 同一个问题:这些机器能思考吗?
“它们正以令人恐惧的速度成长,起初只是以快如闪电的速度求解数学方程, 现如今却已经开始像真正的机械大脑那样运作。”[15]而维纳的研究进一步鼓励了 这种遐想,《时代》周刊在当年的年终版中继续说道:
在维纳博士看来,没有理由认为机器不能从经验中学习,就像许多 大个早熟的孩童在文法学校中成绩会突飞猛进一样。一个这样的机械大 脑,一旦通过存储经验而变得成熟,它就可能足以经营一整个产业,不 仅会取代机械师和职员,甚至还会取代许多管理人员......
维纳解释道,随着人类建造出性能更优越的计算机器,随着他们对 自己大脑的探索更为深入,这两者看上去会越来越相似。他认为,人类 是在依照自己的形象来重建一个新的自己,只不过这次是把体积放大了 很多倍。
维纳的著作,尽管曲奥难读,但仍取得了巨大的成功,而这很大一方面要归功于,
他总是使自己的关注点最终落回人类身上,而非机器身上。相较于计算兴起本身 (毕竟他的研究与此关联不多),维纳对于计算对人类的可能影响更感兴趣。他深 切关注如精神失调、机械假体,以及智能机器兴起可能引致的社会失序等问题。 他担忧,智能机器将使人的大脑贬值,就像工业机器已经使人的双手贬值一样。 在“计算机器与神经系统”一章中,维纳深入探讨了人与机器的相似处。首
先,他区分了两种类型的计算机器:模拟与数字(不过他并没有使用这样的用语)。
前者(比如布什的微分分析机)使用连续尺上的度量来表示数,他称之为模拟 (analogy)机器。后者,他称之为数值(numerical)机器,则使用直接、精确的
第8章 信息转向|235
236 | 信息简史
方式来表示数,就像机械计算器里的情形。在理想状况下,为简单起见,数值机 器可以采用二进制数字系统。而如果要进行更复杂计算的话,它们还要用到某种 形式的逻辑。何种形式的逻辑呢?香农早在 1937 年的硕士论文中就已经回答了这 个问题,而现在维纳也给出了相同的答案:
逻辑代数,又称布尔代数。与二进制算术一样,这种算法也是基于 二分法,即是或否的选择,属于某类或不属于某类的选择。[16]
维纳认为,人的大脑至少部分可以被视为一部逻辑机器。计算机有继电器(无论 是机械的、机电的,还是完全电动的),大脑则有神经元。这些神经细胞在任意给 定时刻都处在以下两种状态之一:动作(点火)或静息(休止)。因此,它们可以 被视为双稳态继电器。神经元彼此连接,形成大型阵列,其接触点称为突触。讯 息就在神经网络中传递。为了储存讯息,大脑有记忆功能,而计算机器也同样需 要被称为记忆体的物理存储器。(维纳很清楚,这只是对该复杂系统的一种简化描 述。还有其他类型的讯息,它们更多的是模拟而非数字讯息,似乎是通过激素以 化学方式传递的。)他还提出,像“神经崩溃”这样的功能失调在电子学中也可能 找到对应物,比如对应于“神经系统中交通拥堵和过载问题”[17]的数据过载。因 此,计算机器的设计师可能需要为不合时宜的数据过载预先准备应对方案。
此外,大脑和电子计算机在执行逻辑运算时都需要大量能量。这些能量“被 消耗、转化成了热量”,并被血液或通风和冷却设施带走。但这其实都无关紧要, 维纳指出:“机械大脑并不会像过去的唯物论者所主张的‘如同肝脏分泌胆汁’那 样分泌出思想,也不会像肌肉发出动作那样以能量的形式发出思想。信息就是信 息,既不是物质也不是能量。不承认这一点,唯物主义在今天就站不住脚。”
接下来是一段群情激昂的时期。 “我们再度进入了一个科学进步的黄金时代——就像当初的前苏格拉底时
代。”[18]美国神经生理学家沃伦·麦卡洛克在一次会议上对与会的英国哲学家们 这样宣称道。他还告诉他们,聆听维纳和冯·诺伊曼等人就现代计算机器诸问题
进行的讨论,使人恍惚置身于古代先贤的辩论当中。他认为,一种关于通信的新 物理学已经诞生,形而上学也将因此发生根本的改观:“科学史上头一回,我们明 白了自己是如何进行认知的,因而我们能够清楚地将其表述出来。”不过,他所指 明的道路在当时无异于离经叛道,因为他所设想的这个明白人是一部计算机器, 其大脑由多达上百亿个继电器组成,其中每一个都从其他继电器那里接收信号并 将其传递出去。信号会被加以量化:它们或者发生,或者未发生。因此,世界的 构成材料再一次被证明是德谟克利特的原子:“在虚空中随意晃荡的不可分之物、 最小之物。”
它所在的是一个赫拉克利特的世界,永远“在变动”。我并不仅仅是 指每一个继电器本身都在永恒的活火中时刻消亡又再生,我也是指,每 一个继电器的工作都与信息相关——信息通过许多渠道进入它,在其中 穿行流转,最后再次回到世界中。
而这样的思想之所以有机会进行跨学科的交流,这在很大程度上要归功于麦 卡洛克,他就像一部推动交流、融合的发电机。战争刚结束不久,他就在位于纽 约公园大道的比克曼酒店筹办了一系列会议(1946 年至 1953 年)。会议得到了小 乔赛亚·梅西基金会的资助,该基金会由这位 19 世纪来自楠塔基特岛的捕鲸船长 的后代所创立。当时,一大批科学几乎在同时进入了成熟阶段:其中有些是所谓 社会科学,如人类学和心理学,它们正试图为自己寻找新的数学基础;有些是有 着混合名称的医学分支,如神经生理学;还有一些则还不完全称得上是科学,如 精神分析。麦卡洛克邀请了所有这些领域的专家,当然还有数学家和电气工程学 专家。他创立了一种诺亚方舟原则,即从每个领域邀请两名专家,这么一来,主 讲者的行话就总有在场的人能完全领会。[19]会议的核心成员包括,著名的人类学 家玛格丽特·米德(Margaret Mead)和当时还是她丈夫的格雷戈里·贝特森
(Gregory Bateson),心理学家劳伦斯·弗兰克(Lawrence K.Frank)和海因里 希·克吕弗(Heinrich Klüver),以及一对受人尊敬、但有时相互也会针锋相对的 数学家——维纳和冯·诺伊曼。
第8章 信息转向|237
238 | 信息简史
米德在会上使用别人看不懂的速记符号做纪要,而在首场会议上,她甚至在 激烈的讨论中咬碎了一颗牙齿而不自知,直到会后才发觉。维纳则在会上宣称, 所有这些科学,尤其是社会科学,说到底研究的都是通信,因而它们共有的一个概 念就是讯息。[20]会议一开始有个冗长的名称:“生物和社会系统中的循环因果和反 馈机制会议”。后来,出于对维纳的敬意,也是为了借助他当时的盛名,会议名称 改为了“控制论会议”。在各次会议上,“信息论”这个新潮、拗口、又有些可疑的 术语被人们反复使用。在有些学科中,这个术语用起来比较契合,有些就差一点。 但对于信息在各自世界观中应处于怎样的位置,人们当时还没有清晰的概念。
情况在 1950 年 3 月 22 日至 23 日举办的那次会议上有了转机。第一位主讲人 是来自芝加哥大学医学院的神经科学家拉尔夫·杰勒德(Ralph Gerard)。他首先 称赞了历次会议的成功:“会议主题和与会阵容引发了外界的极大兴趣,几乎成了 一次席卷全国的热潮。许多知名的科学杂志,如《时代》周刊、《新闻周刊》和《生 活》杂志,都对此有连篇累牍的报道。”[21]在众多报道中,他可能特别指的是《时 代》周刊年初一篇关于维纳的封面报道,题为《思考机器》,其中写道:
维纳教授是一只翱翔在数学及其邻近领域的矫健的海燕(不过他看 上去倒更像只粗壮矮小的海鹦)......在书中,维纳夹杂着警告和喜悦呐 喊道,这些伟大的新型计算机......昭告了一门全新的通信和控制科学的 诞生,并且他及时地将之命名为“控制论”。维纳指出,最新的一批机器 无论从结构或功能上看,都已经与人脑十分相似了。虽然目前它们还不 具备感官或“效应器”(如四肢),但为什么不给它们加上呢?
杰勒德承认,自己从事的领域正深刻地受到来自通信工程的新思维方式的影 响,比如由此将神经冲动不仅视为一个“物理–化学事件”,而且视为一个符号或 信号。向“计算机器和通信系统”取经很有用,但这样做无疑也存在危险性:
如果像大众媒体所说,这些机器就是大脑,而我们的大脑也不过是 计算机器,这种说法未免草率。倘若这样的话,我们也可以说,望远镜
就是眼睛,而推土机就是肌肉了。[22]
对此,维纳觉得有必要作出回应:“我无力阻止这些报道的面世,但我确曾尝 试要求这些报道在表述上保持克制。不过,对于他们在报道中使用的‘思考’一 词,我还是觉得不应该全盘否定。*”[23]
杰勒德的讲演主旨是讨论人的大脑(其中神经元之间的架构错综复杂,树突 的分支盘根错节,而且相互的复杂交互在“化学汤”中此起彼伏)能否被恰当地 界定为模拟的或数字的。[24]格雷戈里·贝特森立即打断了主讲人,表示不太明白 数字的与模拟的之间的区别。这可是个根本性的问题。杰勒德强调,他本人对此 的理解要归功于“先前在这块场地上得到的专家指教,尤其是来自约翰·冯·诺 伊曼的”(当时,冯·诺伊曼本人就坐在下面听讲),不过他还是决定班门弄斧, 尝试进行一下区分。模拟的就像计算尺,数用间距来表示;而数字的则像算盘, 算珠要么被计数,要么不被计数,没有介于两者之间的状态。同样,用来调节光 线的变阻器是模拟的,而墙上的开关则是数字的。杰勒德认为,神经系统的化学 活动和电活动都是模拟的。
讨论变得越来越热烈。冯·诺伊曼对此也有话要说。当时他正忙于发展“博 弈论”,一门他实际上视为研究不完全信息的数学。同时,他也在为新型电子计算 机考虑一种新的体系结构。借着杰勒德的话头,他希望说服与会者当中那些更习 惯于从模拟的角度看待问题的人能更加抽象地进行思考,从而认识到数字过程存 在于这个纷繁复杂、连续的世界当中。比如,当神经细胞在两种可能状态(“神经 细胞内没有讯息的状态,以及有讯息的状态”[25])中来回切换时,这种切换的化 学活动中可能具有中间的细微变化,但在理论上,这些细微变化可以被忽略。冯·诺 伊曼指出,不论是在大脑中,还是在真空管计算机中,尽管“这些‘离散的切换 动作’实际上是在连续过程的刺激下完成的”,但这些刺激的有限变化对于动作的 大局来说无关紧要。其实在不久前的一篇论文《论名叫大脑的数字计算机》中,
——————————
* 对此,让-皮埃尔·迪皮伊后来评论道:“说到底,这其实是一种极常见的情境,即科学家责备非科 学家对于他们所说的过于望文生义。控制论者一方面给公众灌输了思考机器即将变成现实的观念, 另一方面又迫不及待地与那些轻信此事的人撇清关系。”[26]
第8章 信息转向|239
240 | 信息简史
麦卡洛克已经将这种观点表述得很清晰:“在这个世界上,即使是表面看上去连续 的东西,似乎也最好将其视为由若干较小的步骤组成。”[27]在听众当中,会议新 人克劳德·香农,对此未置一词。
下一位主讲者是来自哈佛大学心理声学实验室的 J. C. R. 利克里德,人们都叫 他利克。他是一位涉足心理学和电气工程两个不同领域的年轻科学家,在语音和 声音处理方面颇有造诣。在这一年晚些时候,他加入了麻省理工学院,教授心理 学,并致力于组建一个独立的心理学系(心理学在当时还是经济学系的一部分)。 当时他正在研究语音量化的种种可能性,比如将语音的声波简化成可被一种“触 发器电路”再现的最小量。[28]这种触发器电路其实是一个他用真空管、电阻和电 容自制而成的设备,成本不过约二十五美元。但实验结果表明,即便对那些已经 习惯于在电话噪声干扰下进行通话的人来说,语音能被简化而不至于无法分辨的 程度还是令人惊讶。香农很用心地听了这场演讲,不仅因为他了解相关的电话工 程原理,也因为他在战争期间曾参与过语音加密的机密项目。维纳也听得兴趣盎 然,部分原因是他对于助听器有着特殊兴趣。
当利克里德说到,有某些失真既不是线性的,也不是对数的,而是“居于两 者中间”时,维纳打断了他。
“请问‘中间’是什么意思? X 加 S 再除以 N 吗?” 利克里德叹了口气:“数学家总是这样,对别人不精确的表述紧抓不放。”[29]
不过,利克里德对于数学并无问题,随后他就给出了一个估算,看在一条带宽为 5000 赫兹、信噪比为 33 分贝的传输线路上(这些数值与商用无线电广播的情况 接近),可以传送多少信息(这里用的则是香农提出的新术语)。“我认为,这样一 条信道可以传送 100 000 比特的信息。”当然,这里他指的是比特每秒。这是个让 人惊讶的巨大数目。作为对比,利克里德计算了日常人类语音的信息传输速率: 如果每秒传输 10 个音素,并假设可能音素的数目为 64(“为方便起见”取 26 ,这 样可能音素数目的对数值就是 6),那么信息传输速率就是每秒 60 比特。利克里 德补充道:“前提是,各个音素的出现概率都相等——”
“对!”维纳又插话。
“——但当然,各个音素的出现概率并不相等。”[30] 维纳被激起了兴趣,他还想知道,是否有人用类似的算法计算过“视觉压缩”,
比如电视的情形,而要想达到可分辨的程度,其中所需的“真实信息”又起码要 有多少。说到这,他顺口补充道:“我常弄不明白,人们为什么想要看电视。”
玛格丽特·米德则提出了另一个议题。她希望与会者不要忘记,意义有时可 以与音素和字典上的定义不完全相关。她说道:“如果谈到另一种信息,比如你试 图传递某人正在生气这一事实,那么在保持一条讯息原话不变的前提下,需要引 入多大程度的失真才能去除该讯息中的‘生气’意义呢?”[31]
第三场讲演在晚上举行,主讲人是克劳德·香农。他一上来就开宗明义:根 本不要去管什么意义。即便他讲的主题是书面英语的冗余,他也对意义毫无兴趣。 他所谈论的信息,是某种从一点被传递至另一点的东西,可能根本不含意义: “比如,它可以是一个随机数字串,也可以是一枚导弹或一个电视信号里的信息。” [32]重要的是,他打算把信源表示成一种随机过程,通过利用不同的概率生成讯息。
他展示了在《通信的数学理论》(下面听众中几乎没人读过这本书)中用过的字符 串样本,并描述了他的“预测实验”,即让受试者逐个字母地猜测文本内容。他告 诉听众,书面英语有一个特定的熵,这个值与冗余度相关,而他能根据这些实验 算出该值。听众被深深吸引住了,尤其是维纳,他也想到了自己的“预测理论”。
“我的方法与此有些相似之处。抱歉打断了你的话。”维纳插话说道。 香农和维纳的侧重点有所不同。维纳用熵来度量无序程度,而香农用熵度量 的则是不确定性。不过,正如他们所意识到的,两者从根本上说是一回事。一个 书面英语样本中的内在有序性越强(有序性表现为为语言使用者有意识或下意识 所知悉的统计特征),其可预测性也就越高,换用香农的话来说,也就是后续字母 所传递的信息量越少。如果受试者对下一个字母是什么信心十足,那么这个字母
就是冗余的,它的出现没有贡献新的信息。信息是出人意料。 其他听众也纷纷提出了各种问题,比如不同语言、不同文体、表意文字或音
第8章 信息转向|241
242 | 信息简史
素文字之间的统计分布是否都遵循齐普夫定律。*麦卡洛克就问道,新闻报道与詹 姆斯·乔伊斯的作品是否都遵循这个定律?(有人认为是的。)冯·诺伊曼的同 事、统计学家伦纳德·萨维奇(Leonard Savage)则问香农当初如何选的实验用书: 随机的吗?
“我走到书架前,随便拿了一本。”
“那不能称为随机吧,不是吗?”萨维奇反问道,“可能你会挑到一本工程学 专著。”[33]但香农没告诉萨维奇,其实他挑到的是本侦探小说集。
还有人问香农,婴儿的咿呀学语是比大人的说话更容易预测,还是更难? “我认为是更容易,”香农答道,“如果你与那个婴儿很熟的话。”
英语其实是很多种不同的语言,也许有多少人说英语,就有多少种不同的语 言,而每一种都有各自不同的统计特征。英语中还衍生出了许多人造方言,例如 字母表有限且精确的符号逻辑语言,以及一名提问者提到的所谓“飞机语”,即指 挥塔台和飞行员所使用的语言。此外,语言也是在一直变动的。因此,出生于维 也纳、也是维特根斯坦早期追随者的年轻物理学家海因茨·冯·弗尔斯特(Heinz von Foerster)就想知道,语言的冗余度随着语言的演化将发生怎样的变迁,尤其 是在从口语文化过渡到书面文化的阶段。
与玛格丽特·米德等人一样,冯·弗尔斯特也对不含意义的信息的概念感到 难以接受。冯·弗尔斯特后来回忆道:“当时我打算把他们所谓的信息论改称为信 号论,因为在其中信息还没有产生。那里只有‘哔哔声’,仅此而已,没有信息。 只有当这组信号被转换成我们大脑可理解的其他信号之后,信息才算诞生——总 之,信息不在‘哔哔声’里。”[34]尽管如此,他还是发现自己已经开始从新的角 度思考语言的本质以及它在人类心智和文化中的历史。他指出,一开始,没有人 意识到字母或音素是语言的基本单位。
——————————
* 齐普夫定律由语言学家乔治·齐普夫(George Zipf)在 1949 年提出。这是一条经验定律,描述的 是,在自然语言的语料库里,最常见单词的出现次数是次常见单词的两倍,是第三常见单词的三倍, 依此类推。——译者注
我想到的有古代玛雅文字、埃及的象形文字和早期的苏美尔泥板。 然后在文字的发展历程中,人们花了相当长的时间(或是出于偶然)才 发现语言可以拆分成比单词更小的单位,如音节或字母。
我有种感觉,那就是文字和口语之间存在着某种反馈机制......换句 话说,我相信,一种语言以单词统计的冗余度与以字母统计的冗余度之 间应该存在某种关联。[35]
会议上的讨论改变了他原先的认知,他开始承认信息占据着举足轻重的地位。在
编辑次年的第八次会议的会刊时,他在编者注中写了这样一句带有警句意味的话: “信息可被认为是从无序中夺得的有序。”[36]
尽管香农努力试图让听众集中注意在他对信息所下的不含意义的定义上,但 这群与会者可不会轻易就这样对其中的语义纠缠置之不顾。他们迅速把握了香农 的核心思想,然后就开始了大胆的发挥。社会心理学家亚历克斯·巴弗拉斯(Alex Bavelas)就评论道:“如果我们同意把信息定义为任何能改变概率或降低不确定 性的东西,那么很容易从这个角度来看待比如情绪安全感的变化。情绪安全感的 变化可被定义为个体对于自己属不属于某类人或自己被爱或不被爱的主观概率的 变化。”同样,手势或脸部表情、拍拍背或隔桌对你眨眼睛,如果这减少了你对自 身状态或在陌生群体中的地位的不确定性,那么这也是信息。随着心理学家吸收 了这种考虑信号和大脑的新视角,心理学的整个面貌即将发生急剧的转变。
说到群体中的陌生人,神经科学家拉尔夫·杰勒德想起了一个故事。在一个 派对里,人们彼此都很熟,这时来个了新人。他看到,有个人说“72”,所有人都 大笑。又有个人说“29”,全场沸腾。他就问这是怎么回事。
他旁边的人回答说:“我们讲过很多笑话,而且讲得次数太多了,所 以现在干脆直接讲号码算了。”这个客人也想尝试一下。他说了几个词, 然后说“63”。结果人们反应冷淡。“怎么回事,难道这数不是个笑话吗?”
“喔,是笑话,而且还是其中最好笑的之一,只可惜你没讲好。”[37]
第8章 信息转向|243
244 | 信息简史
在次年的会议上,香农带来了一个机器人。尽管它并不很聪明,外表也不像 人,但它给与会者留下了深刻印象,因为它能走迷宫。他们称它为“香农的老鼠”。
香农推出了一个柜子,柜面上是一个五乘五的网格。在二十五个方格之间可 以任意放置隔板,从而构造出不同的迷宫。迷宫的终点则以放置在任意一个方格 里的一个徽章来标记。在迷宫中走来走去的是一个感应触头,它在两个小马达的 驱动下可分别在东西和南北方向上移动。而在柜面下面有一个由约七十五个继电 器相互连接组成的阵列,它们各自的开开关关形成了机器人的“记忆体”。此外, 还有一个总开关,控制着机器人的启动和关闭。
香农边演示边讲解道:“机器关闭后,继电器就会忘记它已知的一切。因此现 在启动时,它们又是从头开始,对迷宫毫无了解。”[38]听众们都听得入了迷。“你 看,触头正在探索迷宫,找寻终点所在。每当它来到一个方格的中央时,机器就 会决定接下来要尝试的方向。”一旦感应触头碰到隔板,马达就会反转,使触头回 复到中央位置,而继电器则会将该事件记录下来。如此这般,机器会根据此前的
“知识”(这里免不了要用到这些心理学词汇)以及香农预先设定的策略来做每一 个“决策”。触头在迷宫里不断试错,有时会走进死胡同,有时会碰壁。但最终, 在众人瞩目之下,触头走到了终点。这时触头上的灯泡亮起,同时铃声响起,马 达停止了转动。
然后香农将触头移回起点,重新运行一次。这回,它直抵终点,没有转错弯, 也没有撞到隔板。它已经“学会”了如何走这个迷宫。如果把它放到先前走过的 方格中,它也能直接抵达终点。但如果把它放入先前未探索过的区域,那么它需 要重新开始试错,直到最终,“它建立起了完整的信息模式,可以直接从任何位置 抵达终点”。[39]
为了执行预先设定的搜寻策略和直抵目标策略,这台机器必须每访问一个方 格,就存储下一点信息:具体而言,也就是它上一次离开该方格时的方向。香农 解释道,由于只有东西南北四种可能,所以每个方格都被分配了两个继电器作为 记忆体。两个继电器,意味着两比特信息,但这对四选一来说已经足够了,因为 两个继电器可以有四种组合状态:关–关、关–开、开–关、开–开。
第8章 信息转向|245
香农和他的迷宫
下一步,香农重新布置了隔板,这样之前的路线就失效了。机器只好“瞎打 转”,直到找出新的路线为止。不过,碰得不巧的话,当旧记忆遇上新迷宫时,机 器可能会陷入无尽的循环。香农演示道:“当它到达 A 时,它记得旧的路线是往 B 走,结果它就陷入了 A-B-C-D-A-B-C-D 的循环当中。这是一个恶性循环,或者说, 它是在把这几个音符来回唱个不停。”[40]
“真是一种神经症!”拉尔夫·杰勒德说道。 不过,香农早有准备,他设计了一种“抗神经症电路”:一个计数器,用来在
机器重复同样的序列六次时跳出循环。伦纳德·萨维奇认为,这不免有作弊之嫌。 “它没有办法意识到自己‘发疯’了,只是意识到自己走得距离太长了?”萨维奇
问道。“是的。”香农也承认这一点。 如果迷宫里没有放置终点,它又会怎样做呢?香农解释道,那它会尝试走遍
每一个方格,碰遍每一块壁,并持续重复这个路径。 “这也太像人了。”劳伦斯·弗兰克不由叹道。
“乔治·奥威尔,已故的《1984》作者,大概应该见过这个东西。”精神病学
246 | 信息简史
家亨利·布罗辛(Henry Brosin)则这样表示。 香农使单个方向与每个方格相关联的组织机器记忆体的方式,具有一个特别
之处,即路线是不可逆的。当触头抵达终点时,它并不“知道”怎样返回到出发 点。机器所了解的所谓“知识”,其实是得自由这二十五个向量组成的向量场。他 解释道:“沿着这些向量所示,你会走到终点。但反转这个过程的话,你可能会遇 到分岔点,面对许多可能的方向。你无法通过研究记忆体确定,感应触头是来自 哪个方向的。”
麦卡洛克补充道:“这就像一个熟悉某小镇的人,他可以从任意一个地方走到 另一个地方,但他不一定都记得是怎么走到的。”[41]
香农的老鼠与巴贝奇的白银舞女、梅兰的机械博物馆里的白银天鹅和金属鱼 是同类,即它们都是模拟生命体的自动机械,总是会带给人惊喜和欢乐。而随着 信息时代的来临,出现了新一代的人工老鼠、人工甲壳虫和人工乌龟之类。它们 由真空管或稍后由晶体管制成,不过即便对比仅仅几年后的标准,它们也还显得 粗糙,甚至不值一提。比如,香农的老鼠的记忆体容量就只不过七十五比特。然 而,香农可以当之无愧地说,他的机器能通过试错解决问题,能记住解法并正确 无误地加以重复,能从经验中吸取和整合信息,还能在情况发生变化时“忘掉” 旧的解法。这部机器不只是在模仿生命体的行为,它也是在完成一些原本只有大 脑才能完成的功能。
匈牙利电气工程师丹尼斯·伽柏(他后来因发明全息摄影而获得诺贝尔物理 学奖)就批评道:“它看上去能从经验中学习,但实际上,记忆经验的是迷宫,而 非那只老鼠。”[42]这种说法有一定道理。毕竟说到底,里面并没有真正的老鼠。 而继电器无论被放置到哪里,它们都仍然保持着对于迷宫的记忆。事实上,这些 继电器成为了迷宫的一种心智模式,或者说,成为了关于该迷宫的一个理论。
并不是只有在战后的美国,才出现生物学家和神经科学家忽然间开始与数学 家和电机工程师相互协作的情况,尽管有时美国人说得仿佛就是这样。比如,维 纳在《控制论》的引论中用了相当篇幅谈及自己在别国的游历,在其中他就有点
不屑地写道,虽然英国研究者在控制论方面的兴趣几乎同样“浓厚且消息灵通”, 但在“整合该主题的研究,捏合不同研究思路”方面却比不上在美国所取得的进 展。[43]不过到了 1949 年,英国科学家当中形成了新的一批研究信息论和控制论的 核心团体。他们大多数都是年轻人,有着密码破解、雷达或火控方面的崭新经验。 脑电图研究的先驱之一约翰·贝茨建议,有必要为此成立一个英式的晚餐俱乐部
(“有限会员制,活动主要在用餐后进行”,对于俱乐部名称和徽章、会员守则、聚 会地点等也会有细致规定)。贝茨希望邀请有涉足电学的生物学家以及有涉足生物 学的工程师,并想到了一些可能的人选,“大概有十五个人,他们在维纳的著作出 版之前,就产生了与他类似的思想”。[44]在位于伦敦布卢姆斯伯里的英国精神疾 病医院(National Hospital for Nervous Diseases)的地下室,他们进行了首次聚会, 并决定自称“计算俱乐部”(Ratio Club)——Ratio 这个词具有多种含义可供会员 选取。*(菲利普·赫斯本兹和欧文·霍兰后来在撰写该团体的历史时,曾彩访过 许多当时还健在的会员,发现他们当中一半将 Ratio 读作 RAY-she-oh,另一半则 读作 RAT-ee-oh)。[45]在首次聚会上,他们还邀请到了沃伦·麦卡洛克。
他们讨论的话题不仅包括理解大脑,也包括“设计”大脑。精神病学家威廉·罗 斯·阿什比(W. Ross Ashby)就表示自己正在研究这样一种可能性,即“由随机 连接的、可塑的突触构成的大脑,通过经验的积累,将可以达到任意水平的有序 性”——换句话说,心智是一个自组织的动力系统。[46]另外一些人则在讨论模式 识别、神经系统中的噪声、能下国际象棋的机器人,以及机械产生自我意识的可 能性。用麦卡洛克的话来说:“可以把大脑想成电报中继器,它在一个信号激发下, 便发射出另一个信号。”中继器的历史则可追溯至摩尔斯的时代。“从大脑的分子 事件上看,这些信号由原子构成。每个信号或发出,或不发出。”大脑的基本单位 是一个选择,并且是一个二元选择。“这是或为真、或为假的最小的事件。”[47]
他们还成功地在 1950 年吸引了阿兰·图灵的加入。图灵在当年发表了一篇著
——————————
* Ratio 由艾伯特·厄特利(Albert Uttley)提议,取自莱布尼茨的“calculus ratiocinator”(计算机器), 意指“计算或与计算、计划和推理相关联的心智功能”。Ratio 也是 rationarium(统计数据)、 ratiocinatius(论证的)的词根。作为一个源自拉丁语的名字,Ratio 按理应读为 RAT-ee-oh。——译者注
第8章 信息转向|247
248 | 信息简史
名的论文,其中一开头便令人兴奋:“我想请大家考虑这样一个问题:‘机器能思 考吗?’”[48]而对于机器和思考这两个含义模糊的词,他认为即便对此不加定义, 也可以讨论这个问题。他的做法是,用一个测试来代替这个问题,他称之为“模 仿博弈”,也就是后来鼎鼎有名的“图灵测试”。模仿博弈最初的形式需要三个人 参与:一个男人、一个女人和一个提问者。提问者坐在一个隔开的房间里提问(在 理想状况下,图灵建议,问答双方所在的两个房间通过“电传打字机通信”)。提 问者的目标是判断另两个人中哪个是男人,哪个是女人。其中一个人,比如那个 男人,目标是误导提问者;而另一个人的目标则是帮助揭露真相。图灵认为:“对 于那个女人来说,最好的策略很可能就是如实作答。她可以补充这样一些话,比 如‘我才是女人,别听他瞎说’。不过这么做并不会有所帮助,因为那个男人也可 以说出类似的话。”
但如果问题并非问性别是男还是女,而是问种族是人还是机器呢?
通常认为人类的本质在于其“智能”,因此这个博弈被设计成了,通过在两个 房间之间传递的看不见摸不着的讯息进行判断。图灵平淡地说道:“我们不希望机 器由于在选美比赛中无法胜出而失分,同样我们也不希望一个人由于跑不过飞机 而失分。”此外,人也不应该由于做算术运算很慢而失分。图灵给出了一些适当的 问题和答案的例子,比如:
问:请以福斯桥为题,给我做一首十四行诗。 答:这种事就不要找我啦,我从来都不会写诗的。
不过,在继续深入之前,图灵觉得有必要解释一下自己所讨论的机器属于哪一类。 他指出:“当前大家对于‘思考机器’的兴趣,其实是由一类特殊的机器所引发的, 它们通常被称为‘电子计算机’或‘数字计算机’。”[49]这些设备从事的是人类计 算员的工作,但要比人类更快速,也更可靠。图灵清晰地阐明了数字计算机的本 质和特性,而这一点是香农没有做到的。冯·诺伊曼在建造埃尼阿克的后续机型 时,同样也做到了这一点。图灵认为,数字计算机包括三个部分:一个“信息仓 库”,相当于人类计算员的记忆或纸张;一个“执行单元”,负责完成一个个操作;
以及一个“控制器”,管理一个指令列表,以确保各指令按照正确顺序被执行。这 些指令被编码成数,它们有时被称为一个“程序”,而构建这样一个列表的工作通 常被称为“编程”。
图灵认为,数字计算机的设想早已有之,并将它归功于查尔斯·巴贝奇,他 曾在 1828 年到 1839 年间担任剑桥大学的卢卡斯数学教授——在当时可是鼎鼎有 名,但现在却几乎被人遗忘。图灵解释道,巴贝奇“已经产生了所有核心的思想”, 并且还“设计了这么一部机器,名叫分析机,但可惜始终没有完成”。分析机本来 要用到的是齿轮和打孔卡片——这与电可一点关系都没有。这种机器存在(或者 虽说不存在,但已经接近存在)的事实,让图灵得以驳斥他在 20 年纪 50 年代的 时代精神当中觉察到的一丝迷信。当时的人们似乎认为,数字计算机的魔力本质 上来源于电,并且神经系统的本质也是电。然而,图灵所努力要做的是,从最一 般的抽象角度来思考计算的本质。他知道,这与电毫不相干:
由于巴贝奇的机器没有用到电,并且所有的数字计算机在某种意义 上又都是等价的,我们可以得出,电的这种使用并没有什么理论上的重 要性......因此,数字计算机和神经系统都使用电这一特征,其实只是非 常肤浅的相似性而已。[50]
著名的图灵机是一部通过逻辑构建的机器,有着想象的纸带、任意的符号。它拥 有无尽的时间和无限的记忆体,能完成任何可表示成一系列步骤或运算的工作, 甚至能判断《数学原理》体系中的证明是否成立。“当遇到既不能被证实、也不能 被证伪的公式时,这部机器的行为显然不能尽如人意,因为它会无休止地运行下 去,却不会产生任何结果。不过,这与数学家的反应其实也相差不了多少,比如 他们就花费了数百年时间研究费马大定理是否成立。”[51]因此,图灵认为这部机 器应该能够玩模仿博弈。
当然,图灵无法装作能证明这一点。他的主旨其实是试图澄清在这场他看来 略显愚蠢的论辩(“机器能思考吗?”)中所使用的一些术语,比如数字计算机。 他还对未来半个世纪作出了一些预测:计算机的存储容量将达到109 比特(在他
第8章 信息转向|249
250 | 信息简史
的想象中,未来只需少量巨型计算机;他没有预见到,现如今小型计算设备会无 所不在,而且它们的存储容量都要比109 大上很多个数量级),并且计算机在经过 编程后可以较好地玩模仿博弈,至少能在几分钟内愚弄一些提问者(就目前所见, 这一点倒是不假)。
我相信,“机器能思考吗?”这个原始问题含义模糊,不值得讨论。 不过我也相信,到本世纪末,字词的使用以及普通公众的认识将会发生 很大改变,到时人们说到“机器能思考”时,将不会遭到什么质疑。[52]
但可惜图灵无法亲眼见证自己的预言是如何准确地得到了应验。1952 年,他因同 性恋行为被逮捕,随后遭受审判,并被定罪和取消参与涉密项目的资格。当局对 图灵实施了侮辱性的雌激素注射。1954 年,图灵自杀身亡。
在很长一段时间内,很少有人知道图灵在布莱切利庄园为破解恩尼格玛所从 事的秘密工作,了解他为国家所作出的卓越贡献。他有关思考机器的思想,在大 西洋两岸倒是吸引了不少关注。有些人觉得图灵的想法很荒唐,甚至很恐怖。当 他们征求香农的意见时,香农则坚定地站在了图灵这一边。他曾对一位工程师写 道:“对于我们所有人来说,机器能思考的思想丝毫没有什么令人不悦之处。事实 上,如果反过来说,人的大脑可能本身是一部机器,能够通过无生命的物体复制 其功能,我觉得这个思想相当吸引人。”[53]毕竟这比“用看不见摸不着的‘生命 力’、‘灵魂’或诸如此类来解释”要有用得多。
在 20 世纪中叶,计算机科学家想了解计算机究竟能做什么事,心理学家也想 了解大脑是不是计算机,或者说,大脑是不是仅仅是计算机。在当时,计算机科 学还是门新兴学科,而心理学作为一门科学也同样非常年轻。
心理学在 20 世纪中叶几乎陷入了停滞。在所有的科学门类当中,心理学一直 以来都最难以说清自己的研究对象究竟为何物。一开始,它的研究对象是灵魂, 以区分于人体学所研究的身体和血液学所研究的血液。17 世纪的荷兰医生詹姆 斯·德巴克(James de Back)最早提出“心理学”的说法:“心理学(psychologie)
是一门探究人类灵魂及其效应的学问。没有灵魂,人将不人。”[54]然而在本质上, 灵魂是不可言喻的,因而也几乎不可能被了解。而观察者与被观察对象共存一体、 相互纠缠(这只见于心理学),更使得问题难上加难。1854 年,当时心理学还更 多地被称为“心灵哲学”,大卫·布儒斯特就曾哀叹,没有一门其他学问像“心智 科学,如果它能算一门科学的话”那样进展寥寥。
人的心智,一些人认为是物质的,另一些人认为是精神的,还有些 人认为是由两者神秘混合而成的,但它始终不为人的感官和理性所理解。 它有如一块在北风恣虐下的荒原,每位路过的思想者都在上面撒下自己 的心灵杂草种子,生生扼杀了那些原本可能萌发成熟的好种子。[55]
当时这些路过的思想者,主要是通过内省的方法研究心理学,但这种方法的局限 性也很明显。到了 19、20 世纪之交时,为了使研究变得严谨、可验证,甚至是数 学化,许多心理学研究者开始转向多个大不相同的方向。弗洛伊德的思路只是其 中之一。在美国,威廉·詹姆斯几乎凭一己之力创建了心理学这门学科:他开设 了首个心理学课程,撰写了第一本综合性的心理学教科书《心理学原理》。但就在 他花十二年时间完成了这部巨著时,他却心生弃意。他在给出版商的信中写道, 这在自己看来是“一堆令人生厌、冗长、累赘、臃肿的文字,只表明了两个事实: 其一,根本不存在一门称为心理学的科学;其二,威廉·詹姆斯无能”。[56]
在俄罗斯,生理学家伊万·彼得罗维奇·巴甫洛夫,他曾因对于消化过程的 研究而赢得诺贝尔奖,开辟了心理学的一种新思路。詹姆斯在心情好的时候,还 会把心理学称为研究心智生活的科学,但巴甫洛夫对于“心理学”一词及其所有 相关术语都不以为然。在他看来,根本不存在什么心智,有的只是行为。所谓心 理状态、思想、情绪、目标、目的等,全是无形的、主观的、不可把握的东西, 不可避免地会沾染到宗教和迷信。詹姆斯视为心理学核心课题的东西,比如“思 想流”、“自我意识”、对时空的感知、想象力、推理能力以及意志等,在巴甫洛夫 的实验室里都不见踪影。科学家能观察到的只有行为,并且行为至少能够被记录 和测量。行为主义者,以美国的约翰·华生和后来非常知名的 B. F. 斯金纳为代表,
基于刺激(如铃铛、食丸、电击)和反应(如唾液分泌、按操作杆、走出迷宫) 建立了整个的科学体系。华生认为,心理学的全部目的在于预测某个特定的刺激 会引发怎样的反应,以及某个特定的行为要源自怎样的刺激。在刺激与反应之间 是一个黑箱,人们只知道它由感官、神经通道和运动机能组成,却无法通过科学 方法对其进行分析。事实上,行为主义者无非是又说了一遍“灵魂是不可言喻的”。 由于在条件反射和控制行为方面取得的成果,行为主义兴盛了约半个世纪的时间。
用心理学家乔治·米勒的话讲,行为主义者大概会说:“你们说什么记忆,说 什么期待,说什么感觉,说了那么多心智方面的东西。这些都是虚的,否则秀一 个给我看,指一个给我瞧。”[57]而他们则甚至能教鸽子打乒乓球或是教老鼠走迷 宫。然而到了 20 世纪中叶,不满的情绪开始显露出来。行为主义只研究可观察对 象的前提变成了教条,它对心理状态的一概排斥成了束缚自身发展的牢笼,而心 理学家依然渴望理解心智到底是什么。
信息论给了心理学家一条进入黑箱的入口。科学家分析了信息处理过程,并 建造机器来实现这样的过程。这些机器能记忆,还能模拟学习和目标搜索的行为。 对于老鼠走迷宫,行为主义者会讨论其中刺激和反应之间的关联,却会完全拒绝 讨论老鼠的心智;但现在,工程师只用少量电子继电器就建造出了老鼠的心智模 型。因此,工程师不只是在努力打开黑箱,他们甚至还试图自己做黑箱。在这些 黑箱中,信号不断被传输、编码、存储和提取,对于外部世界的内部模型也被创 建和持续更新。心理学家密切关注了这些进展,并从信息论和控制论当中借鉴了 一套有用的隐喻乃至一个有效的概念框架。比如,香农的老鼠就不仅可以被视为 大脑的一个粗略模型,也可以被视为一个行为理论。于是突然之间,心理学家也 开始谈论起了计划、算法、句法规则等东西。他们不仅研究生物如何对外部世界 作出反应,也开始考察生物如何将外部世界呈现给自己。
在不同研究者手中,香农的信息论被引向了他当初始料未及的方向。香农曾 说:“通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。” 心理学家则不难看出,可以把外部世界视为信源,而把心智视为接收器。
既然耳朵和眼睛可以被视为信道,那么为什么不像对麦克风和相机那样也对
它们进行测试和度量呢?纽约市立大学亨特学院的化学家霍默·雅各布森就说 道:“对于信息的本质和度量的众多新概念,使得度量人类耳朵的信息容量成为可 能。”[58]他这样说,也这样做了。后来他又对眼睛进行了同样的度量,得出的估 值要比耳朵的信息容量(以比特每秒计)大上四百多倍。就这样,许多更精致的 类似实验突然间变得有了意义,其中一些更是直接受到了香农在噪声和冗余方面 研究的启发。1951 年,一个研究小组就做了一项实验,测量受试者在不同情况下 听对单词的可能性:一种情况是他们被告知单词要从少量可选单词中选出,另一 种情况则是要从大量可选单词中选出。[59]结果似乎显而易见,但这样的实验之前 却从来没人做过。还有实验者研究了如果试图同时理解两个对话,会有什么效果。 也有人开始研究,人在面对一组数字、字母或字词时能够理解或记住多少,而它 们又包含多少信息。在一些标准实验中(比如,受试者可能需要在蜂鸣声中识别 出语音,并在接受视觉刺激时,通过手按键和跺下脚作出反应),刺激和反应这样 的用语逐渐被信息的传输和接收所取代了。
曾有一段短暂的时期,心理学研究者之间还对这种转变争执不休。但过了不 久,讨论便平息了下来。1958 年,主要研究选择性注意和短期记忆的英国实验心 理学家唐纳德·布罗德本特就写道:“当比较需要作出两个反应的情况与只需作 出一个反应的情况时,是用刺激和反应来解释实验结果,还是用信息论的术语来 解释,两者之间的差异变得最为明显......毫无疑问,用刺激和反应也能对结果作 出合适的解释......但相较于信息论的解释,这样的解释就显得繁复了。”[60]也是 在这一年,布罗德本特开始执掌英国医学研究理事会下的应用心理学研究部门。 人们在那里及其他地方都进行了大量实验,涉及人类处理信息的各种方式,比如 噪声对表现的影响、选择性注意和感知的过滤、短期和长期记忆、模式识别,以 及问题解决等。那么其中逻辑又该归入哪门学科呢?是心理学,还是计算机科学? 但有一点已可以肯定,它已不仅仅只属于哲学的范畴了。
在英国有唐纳德·布罗德本特,在美国则有同样影响深远的乔治·米勒,他 在 1960 年共同发起成立了哈佛大学认知研究中心。而早在 1956 年,他便已经因 一篇论文而声名鹊起。论文的标题略显古怪:《神奇之数: 7 2 ——我们处理信息能力的某些局限》。[61]论文提出,大多数人每次在工作记忆内储存的最大单位 数目大致是七个,比如七个数字(这是当时美国典型的电话号码长度)、七个单词 或实验心理学家展示的七件物品。米勒声称,在其他类型的实验中也会不断发现 这个数。比如受试者会被要求辨别盐度不同的盐水滴、音高或响度不同的声音, 以及计算屏幕上随机显示的亮点数目(如果亮点数目在七个以下,他们几乎总能 准确说出来;而如果超过七个,人们就几乎总是要靠估算)。无论实验怎么做,七 总会是反复出现的那个阈值。米勒写道:“这个数会以各种不同的形式出现,有时 略大一点,有时略小一点,但从来都不会变到无法辨认的程度。”
显然,这是某种类型的粗略简化;米勒也承认,人类具备从数千人脸或单词 中进行辨识的能力,也能够记下很长的符号序列。为了说明这是种什么类型的简 化,米勒借助了信息论,尤其是香农将信息理解为在多个可能选择中作出一个选 择的观点。他首先提出,“观察者可以被视为一个信道”(这种说法想必会让当时 还占据主流的行为主义者大吃一惊),他接受输入信息,传递并输出信息(关于响 度、咸度或数字的信息)。米勒还简要解释了一下比特:
一比特信息,就是我们在两个出现概率相等的可能选择中做出决策 时所需的信息量。如果我们想要判断某人身高是低于六英尺,还是高于 六英尺,并且已知两种情况出现的可能性相等,那么我们只需一比特信 息......
两比特信息使得我们能在四个出现概率相等的可能选择中做出决 策,三比特使得我们能在八个出现概率相等的可能选择中做出决策...... 依此类推。换言之,假如存在三十二个出现概率相等的可能选择,我们 就要依次做出五次二元决策,每次决策一比特信息,这样才能知道哪个 选择是正确的。因此,基本规则很简单:可能选择的数目每翻一番,所 需信息量的比特数就加一。
这样算来,神奇之数七是略小于三比特。米勒接着分析了,在单维刺激和多维刺激(比如结合了大小、明度和色相)的情况下,随着可能刺激的数目增加,观察者的反应会开始出现混淆,而混淆出现的这一点可以被称为其信道容量。米勒还 注意到,人们还会借助信息理论家所谓的“再编码”(recoding),将信息拼凑成越 来越大的组块,比如使电报的点和划凑成字母,字母又凑成单词,单词再凑成短 语。米勒最后的总结颇有点宣言的性质。他宣称:“这种语言的再编码,在我看来, 正是思考过程的核心命脉。”
来自信息论的各种概念和度量方法,使得我们能够对其中一些问题 加以量化。该理论给我们提供了一把量尺,借此我们可以校准刺激材料, 并度量受试者的表现......
信息论相关概念的价值已经在辨别和语言的研究中得到了证实,并 在学习和记忆的研究方面表现出了巨大的潜力,近来甚至还有人建议它 在概念形成的研究中也可以有用武之地。许多在二三十年前看来不会取 得什么成果的问题,或许现在值得重新审视一番了。
这就是在心理学史上被称为认知革命的开始,一门结合了心理学、计算机科 学和哲学的认知科学也由此发端。事后回想起来,一些哲学家也将这一时刻称为 信息转向(informational turn)。弗雷德里克·亚当斯就写道:“在那些接受信息转 向的人看来,信息是形成心智的基本要素,信息必然促成了心智的起源。”[62]也 正如米勒本人所喜欢说的,心智借着机器重新进入了视野。[63]
香农在当时不是个家喻户晓的名字(他的名声从不曾传到普通公众当中),不 过在自己的学术圈内,他却享有偶像级的声望。有时他也会到大学和博物馆就“信 息”发表通俗演讲。在其中他会解释基本思想,比如调皮地引用《新约·马太福 音》第 5 章第 37 节的话,“你们的话,是,就说是;不是,就说不是;若再多说, 就是出于那恶者”,以此作为比特和冗余编码概念的范本。他还会预测计算机和自 动机械的未来前景,比如他在宾夕法尼亚大学的一次演讲中就说道:“总而言之, 我认为,这一整个信息产业将在本世纪快速崛起和发展,其中包括信息的采集、 信息从一点到另一点的传输,以及恐怕是最为重要的,信息的处理。”[64]
第8章 信息转向|255
256 | 信息简史
克劳德·香农(1963)
面对心理学家、人类学家、语言学家、经济学家及其他各类社会科学家纷纷 学时髦搭车信息论的做法,一些数学家和工程师不免感到不悦。香农本人便把信 息论称为一种科学“时尚”(bandwagon),并以此为题在 1956 年写了一篇仅有四 段话的短文,特意进行提醒:“许多不同领域的科学家同人,为其浩大声势及其开 辟的科学分析新思路所吸引,正纷纷将这些思想应用到自己研究的问题上去...... 尽管对于我们这些从事这个领域研究的人来说,这一波流行热潮固然让人欣喜和 兴奋,但同时它其中也带有危险的元素。”[65]香农提醒人们,信息论的核心是数 学。尽管他个人确实认为信息论的许多概念会对其他领域有所帮助,但它不是万 金油,也无法被简单照搬:“这样的应用,并不是简单地将术语翻译到一个新领域, 而是需要经过缓慢而艰辛的假设和实验检验的过程。”并且香农感到,类似的艰苦 工作在“我们自家院里”都还没怎么开展,因此当务之急是研究,而非阐释。
至于控制论,这个词则开始淡出人们的视线。1953 年,最后一次控制论会议 在普林斯顿的拿骚旅馆举办,但维纳并不在场,因为他早已与一些与会者闹翻,
第8章 信息转向|257 包括麦卡洛克。在最后进行总结发言时,对于会议所取得的成就,麦卡洛克说道:
“我们从未达成过一致的共识。但就算是达成了,我也看不出上帝有什么理由会赞 同我们。”[66]
在整个 20 世纪 50 年代,香农始终是这个自己创立的领域里的学术领导者。 他写出了大量艰深、充满各种定理的论文,其中很多都蕴涵着进一步发展的可能, 为扩展该领域的研究奠定了基础。香农研究的主题之一是信道,麦克卢汉后来也 将之称为“媒介”。他对信道进行了严谨的数学分析,研究很快得到了应用并取得 了丰硕的成果:广播信道和窃听信道、有噪信道和无噪信道、高斯信道、有约束信 道、反馈信道、有记忆信道、多用户信道和多址接入信道,等等。(当麦克卢汉宣 称媒介即讯息时,他是在开玩笑。事实上,媒介既独立于讯息,又与它密不可分。)
香农取得的重要成果之一是有噪信道编码定理,它指出利用纠错编码可以有 效地抵消噪声和失真的影响。一开始,这个成果所预示的前景可望而不可即,因 为纠错编码需要用到大量计算,而计算在当时并不便宜。但到了 20 世纪 50 年代, 在纠错编码上的进展开始逐渐将香农预示的前景变成了现实,对此的需求也日渐 明显。其中一个应用是,在使用火箭和人造卫星进行太空探索时,它们需要借助 有限的能量将讯息送出遥远的距离。随着纠错编码和数据压缩技术的齐头并进, 编码理论也成为了计算机科学的关键组成。没有编码理论,就不可能有调制解调 器、光盘和数字电视等。而对于研究随机过程的数学家来说,编码定理也可以用 来度量信息熵。
与此同时,香农还取得了其他许多为今后的计算机设计奠定基础的理论进展。 其中一个发现给出了在一个具有多个分支的网络中,如何使流量最大化的方法, 这里的网络可以是通信网、铁路网、电网或水网。*还有一篇论文则有一个直截了 当的题目,《采用劣质继电器构建可靠的电路》[不过在发表时,题目被改为了《采 用不甚可靠的继电器构建可靠的电路》(“Reliable Circuits Using Less Reliable Relays”)[67]]。香农还研究过开关函数、率失真理论和微分熵等。虽然公众对于 ——————————
* P. Elias, A. Feinstein, and C. E. Shannon, “A Note on the Maximum Flow Through a Network,” IRE Transactions on Information Theory 2, no. 4 (1956): 117–119.——译者注
258 | 信息简史
这些研究一无所知,但他们却能广泛感觉到计算时代到来的震撼,而这其中香农 与有力焉。
1948 年,香农在一篇论文中探讨了一个他自称“本身无关紧要”的问题:如 何给机器编程,来让它下国际象棋。[68]人们早在 18 和 19 世纪就做过此类尝试, 但这些在欧洲各地巡演的自动下棋机器偶尔会被人拆穿是里面藏着小人。到了 1914 年,西班牙数学家、工程师莱昂纳多·托雷斯克韦多(Leonardo Torres y Quevedo)公开展示了一部真正的、纯机械的下棋机器,名字就叫棋手。它会下 一种简单的三子残局:单车杀王。
现在香农指出,执行数字运算的计算机经过设计之后,能够下完整的棋局。 他解释道,这些“包含数千个真空管、继电器和其他零件”的设备,能够在“记 忆体”内存储许多数,而经过一个巧妙的翻译过程后,这些数可以用来表示棋盘 上的方格和棋子。香农提出的基本原理一直被所有国际象棋程序沿用至今。当时 计算尚还处于青涩年代,很多人很快就设想,计算机能够计算出所有可能的走法 和子力组合,从而完美解决国际象棋问题。他们认为运算快速的电子计算机能完 美地下棋,就好像他们当时也认为它能做出可靠的长期天气预报一样。然而,香 农经过粗略计算后指出,一盘典型的国际象棋棋局涉及的可能组合数目超过了 10120 ——这个数要远大于以纳秒计的宇宙年龄。因此,在香农看来,计算机不能 靠蛮力搜索来下国际象棋,而是要像人下棋那样进行推理。
香农甚至还登门拜访了美国国际象棋冠军爱德华·拉斯克,而拉斯克也给了 他一些改进建议。[69]1950 年,香农为《科学美国人》杂志撰写了一篇介绍先前论 文的通俗文章,在其中他提出了那个浮现在所有人脑海中的疑问:“这种下棋机器
‘思考’吗?”
答案完全取决于我们如何定义思考......从行为主义的观点来看,这 部机器表现得它似乎在思考。我们总是认为,要下好国际象棋需要推理 能力。因此,如果我们把思考视为是外部行为而非内部方法的一种属性, 那么这种机器显然在思考。
不过,根据香农在 1952 年的估算,大概需要三名程序员花费六个月的时间, 才只能让一台大型计算机的下棋水平勉强达到马马虎虎的业余水准。“而比起预 先编好程序的棋手,能自主学习的计算机棋手的问题恐怕要留待更远的将来来解 决。目前提出的各种方法显然都太过缓慢,想必还没等赢下一盘棋,机器就已经 报废了。”[70]但重要的是,要探索通用计算机尽可能多的潜在用途。
香农也不忘施展自己的奇思异想。他设计并建造了一台机器,用来做罗马数 字的算术运算,比如 IV(4)乘以 XII(12)等于 XLVIII(48)。他将这台机器命 名为 THROBAC 一号,取自“简型罗马数字守旧计算机”(THrifty ROman-numeral BAckward-looking Computer)的首字母缩写。他还建造过一台“读心机”,用来玩 小孩猜奇偶的游戏。所有这些奇思异想之举都有一个共同点,那就是将算法应用 到了新领域中去,即将思想抽象映射到数学对象上去。香农退休后还写过一篇数 千字的长文,分析抛球的科学原理,其中提出了一系列定理和推论,并凭借记忆 引用了诗人 E. E. 卡明斯的诗句:“某个混账会发明出测量春天的机器。”[71]
在 20 世纪 50 年代,香农还尝试设计一种能自行修复的机器。[72]如果其中某 个继电器坏了,机器能自动找到并替换它。他甚至考虑过这样一种可能性,一种 机器通过从环境中收集零件并加以组装,从而实现自我复制。虽然贝尔实验室乐 于让香农出去谈论这些话题,演示他那能学会走迷宫的机器,但并不是每个听众 都感到满意。“弗兰肯斯坦”之类的说法开始出现,怀俄明州的一名报纸专栏作家 就写道:“我很纳闷,你这年轻人是否意识到自己在摆弄的是些什么东西。”
要是你启动了一部这样的机械计算机,却忘了在出去吃午餐时关掉 它,那会发生什么事呢?我来告诉你。它在美国就会像野兔在澳大利亚 一样。在你算出 701 945 240 乘以 879 030 546 等于多少之前,这个国家 的每个家庭就都有了一台自己的小计算机......
香农先生,我无意批评你的这些实验,但坦率地讲,我对哪怕是一 台计算机都丝毫没有兴趣。更别提要是有一堆计算机挤到我周围,又是 乘又是除,又做其他什么它们擅长的事,那我一定会相当生气。[73]
第8章 信息转向|259
260 | 信息简史
在香农对信息论的“时尚”提出警示两年后,一位年轻的信息理论家彼得·伊 莱亚斯在一份学术期刊上发表了一篇社论,其中对一篇题为《信息论、光合作用 和宗教》的论文提出了批评。[74]当然,这篇论文是杜撰的。但在当时确实有过一 批论文,讨论诸如信息论、生命和拓扑学,信息论与组织损伤物理学,信息论与 文职系统,信息论与心理药理学,信息论与地球物理学资料解释,信息论与晶体 结构,信息论与旋律,如此等等。伊莱亚斯的父亲曾作为工程师在爱迪生的实验 室工作,而他本人则是位严肃的专业研究者——他就对编码理论作出了重要贡献。 对于这些堆砌概念、投机取巧而又毫无新意的所谓“跨学科”研究,他十分警惕:
“这篇论文讨论了信息论与心理学(或遗传学、语言学、精神病学、商业组织)在 用语和概念框架上出人意料密切的关系......诸如结构、模式、熵、噪声、发送器、 接收器以及编码等概念(只要适当加以阐释)都对双方至关重要。在首次为心理 学奠定了稳固的科学基础之后,论文作者谦虚地将填充自己所提出的框架的工作 留给了心理学家。”伊莱亚斯把这称为偷窃,并呼吁这些同人放弃偷窃,开始诚实 的劳作。
香农和伊莱亚斯的警告都发表在一份知名的信息论学术期刊上,而这份期刊 只是当时为数众多且在不断增加的专门研究信息论的新期刊之一。
有一个流行词在各个学术圈里业已名声不好,那就是熵。另一位学者科林·彻 里就抱怨道:“我们见到‘熵’被用在了语言、社会系统、经济系统以及各种苦于 缺乏新方法的研究当中。它具有某种笼统性,因而成为一些人的救命稻草。”[75] 他没有说到,毕竟当时还看不出端倪,信息论正开始改变理论物理学和生命科学 的研究轨迹,而熵正是促成了这种改变的原因之一。
虽然当时信息理论家对于许多社会科学学科的直接影响已经过了巅峰,他们 所用的数学也越来越适用于计算机科学而非心理学,但他们曾经的贡献是实实在 在的。他们催化了许多社会科学学科的发展,为其迎接即将到来的新时代作好了 准备。在这些学科中,信息转向的痕迹无法被消除。
2回应 2021-06-24 22:45:53
-
cp4 (唯有未知不可摇撼)
P34:一旦一个人能够把字词写下来,对它们进行仔细考察,每天从全新的视角对它们加以审视,并追索它们的含义,他就成了一名哲学家。在亚里士多德看来,最基本的概念不仅值得定义,而且需要加以定义,比如: “起始指不必跟从任何它者,但排在第二位的某物自然存在或出现于它之后。相反,结尾指本身自然地跟从某个它者,或者处于必然或者是大多数情况下如此,但不但有任何它者跟随其后了。” (——纠结于数学是主观的还是客观的...2014-06-29 10:23:18 3人喜欢
P34:一旦一个人能够把字词写下来,对它们进行仔细考察,每天从全新的视角对它们加以审视,并追索它们的含义,他就成了一名哲学家。在亚里士多德看来,最基本的概念不仅值得定义,而且需要加以定义,比如: “起始指不必跟从任何它者,但排在第二位的某物自然存在或出现于它之后。相反,结尾指本身自然地跟从某个它者,或者处于必然或者是大多数情况下如此,但不但有任何它者跟随其后了。” (——纠结于数学是主观的还是客观的人可以从这里开始:“起始”的概念是人造的还是客观的?) 这些表述与经验无关,它们是在运用语言来组织经验。(——不敢苟同前半句,语言和思维的关系是个鸡和蛋问题,在我看来,它们是共同演化的。) …… P35:逻辑是书面文字的产物,这一点在各自独立发展出逻辑学的古希腊、古印度或古中国都概莫能外。反面论点见:John Halversion,“Goody and the Implosion of the Literacy Thesis," Man 27, no.2(1992):301-317 …… P155:John Wilkins(Mercur: Or the Secret and Swift Messenger):”因为我们必须意识到,一般说来,任何能够创造出有效的差异,可为某种感官所感知的东西,都足以作为表达思想的手段。“在这里,这份1641年不为人知的匿名专著中,信息论的核心思想浮出了人类思维的表面,却像土拨鼠一样看见了自己的影子,于是又沉没下去,消失长达三百多年。 …… P160:1873廿,《哈泼斯》的一位随笔作家写到:”电报将给人类思维带来的最广泛也最重要的影响恐怕来自于它对于语言的影响……类似于达尔文提出的自然选择原理,在语言使用中,短词将逐渐对长词占有优势,直接表达形式将逐渐对间接表达形式占有优势,含义清晰的字词将逐渐对模棱两可的字词占有优势,而地方性的习语都将处于劣势。“ (——一个在1873年写出上面文字的作家,其洞察力简直令人震惊。) P161:到了19、20世纪之交,罗特兰·罗素给与了乔治·布尔非同寻常的赞颂:”纯数学是由布尔在其《思维的规律》中发现的。“但人们却很少引用其后的批评:”他错误地以为自己在讨论思维的规律……要是他的著作真的包含思维的规律,那么很奇怪为什么此前没有一个人用这样的方式思考呢?“ …… P170:Vannevar Bush写到:”数学家并不是那种能够轻易摆布数字的人,他们常常做不到这一点。数学家的主要技能是擅长在一个高层次上运用符号逻辑,尤其他们有着优秀的直觉判断力。“ …… P212:在香农看来,模式等同于冗余。 P251:在美国,威廉·詹姆斯几乎凭一己之力创建了心理学这门学科,在他花十二年时间完成了这部巨著时,他却心生弃意。他在给出版商的信中写到,这在自己看来是”一堆令人生厌、冗长、累赘、臃肿的文字,只表明了两个事实:其一,根本不存在一门称为心理学的科学;其二,威廉·詹姆斯无能。“ …… P267:麦克斯韦指出:”由此可以得出的一个结论是,能量耗散的概念取决于我们的知识水平。……耗散掉的能量是而我们无法掌控或按意志加以引导的能量。“ ”混乱,如同与之相关的术语秩序一样,并不是物质本身的属性,而是与观察他们的心智息息相关。耗散掉的能量的概念,对于不能自主利用任何自然界能量的存在物,或是能够跟踪每个分子的运动并在恰当时机俘获它们的存在物而言,都是没有意义的。“ P273:莱奥·齐拉特,日后提出了电子显微镜、核连锁反应、直线加速器、回旋加速器等设想,完成了通往香农”信息是熵“的构想的最后一环。Leo Szilard, ”On the Decrease of Entropy in a Thermodynamic System by the Intervention of Intelligent Beings“ …… P277:一种流行观点是生物体以来与周围环境交换物质或能量而存活,薛定谔视为扯淡,相反他指出:生物体以负熵为食。”新陈代谢的本质是,生物体成功地使自己摆脱在其存活期内必然产生的所有熵。“ …… P297:塞缪尔·巴特勒:”凭什么说是鸡生蛋而不是蛋生鸡?这些无法用哲学解释的问题,或许从另一个角度就可以解答,那就是考虑到人类的自负以及长久以来的、忽略一切不像自己的事物的习惯。“(Samuel Butler, Life and Habit) 丹尼尔·丹尼特:”学者不过是一座图书馆用来制造另一座图书馆的工具。“(Daniel C. Dannett, Darwin's Dangerous Idea: Evolution and the Meaning of Life) P303: 同样地,DNA的碱基对也不是基因,它们只是编码了的基因。基因本身由比特构成。 …… P308: 莫诺:”思想保留了生物体的某些属性。思想也倾向于维持其结构并繁衍生息;它们也可以融合、重组或分离其内容;事实上,它们还可以进化,而在这个过程中,选择淘汰必定扮演着重要角色。“ P310 就像单个核苷酸不是基因一样,模因是复杂单元。呼啦圈不是模因,它是数个模因的产物和实物化身。呼啦圈本身是模因的载具,玩呼啦圈的人也是。 P313 人们不可避免地开始用疾病来类比模因,比如某种情绪蔓延开来,某段旋律具有感染力,某个习惯具有传染性。病毒式教育,病毒式营销,病毒式电子邮件。 P317 基因起码还有物质实体作为基础,模因确实抽象、无形、不可度量的。基因的复制有着近乎完美的保真度,这也正式进化所依赖的。模因却很少精确的复制。
回应 2014-06-29 10:23:18 -
雨果僧 (好奇心万岁~)
信息简史【美】詹姆斯·格雷克 2012-09-01 21:22:44 他又有机会与数学家、逻辑学家赫尔曼·外尔合作,后者教给他什么是理论:“理论允许意识‘跳出自身的影子’,超越经验而把握超验,但这只能借助抽象符号实现(这一点是不证自明的)。” 2014-07-13 00:47:41 人类曾经以采集食物为生,而如今他们重新要以采集信息为生,尽管这看上去有点不和谐。” 第4章 将思想的力量注入齿轮机械(喔,欣喜若狂的算术家啊!) 2014-08-23 09...2014-09-08 10:18:02
信息简史【美】詹姆斯·格雷克 2012-09-01 21:22:44 他又有机会与数学家、逻辑学家赫尔曼·外尔合作,后者教给他什么是理论:“理论允许意识‘跳出自身的影子’,超越经验而把握超验,但这只能借助抽象符号实现(这一点是不证自明的)。” 2014-07-13 00:47:41 人类曾经以采集食物为生,而如今他们重新要以采集信息为生,尽管这看上去有点不和谐。” 第4章 将思想的力量注入齿轮机械(喔,欣喜若狂的算术家啊!) 2014-08-23 09:48:31 他曾执著于两项不同寻常又明显不属于哲学思辨的挑战,两项他自己意识到彼此有着深层联系的活动:开锁和破解密码。 2014-08-23 09:49:05 而从树木年轮上,巴贝奇看到的是自然将历史进行编码:一棵树以自己的实体记录下了一套完整的信息。“每一场雨,每一阵风,每一次温度变化,都在植物界留下了痕迹;它们对我们而言,的确细微而难以察觉,但不论如何,它们在那些木质纤维深处却留下了永恒的记录。” 2014-08-23 10:00:40 巴贝奇的机器的初衷是生成数表,但到头来,其现代形式反而导致数表被废弃。 2014-08-23 09:45:50 ,认为知识“本身是物理作用力的发生器”。科学给世界带来了蒸汽,他猜想,不久以后科学将转向不那么有形的电力,“它几乎已经可以控制这种以太流体”。 2014-08-23 10:01:22 她在给母亲的信中写道:“人们常说‘将来之事会提前投下其阴影’,可是它们有时不也会提前投下其光芒吗?” 2014-08-23 10:01:45 同样,爱达对于未来也有一个最后的梦想:“我以我自己的方式迟早会成为一名独裁者。”在她面前将集结起一个个军团,对此即便是地上的铁腕统治者们也只能乖乖让路。那么她的军团由什么材料构成呢?“我现在可不会说。但我希望,它们将是纪律严明、异常和谐的军队——由大量的数构成,伴着军乐以势不可挡的力量行进 第5章 地球的神经系统(就那么几根破电线,我们能指望它什么呢?) 2014-08-23 10:04:32 ,还为它们突如其来、全面的衰亡。 2014-08-27 13:30:32 语言至此被视作服务于两种独立的功能,既是表达的工具,也是思维的工具。 第6章 新电线,新逻辑(没有别的什么东西比它更严密地为未知所包裹) 2014-08-27 13:33:33 电报、电话和无线电广播,三股巨大的电信浪潮依次汹涌而来。 2014-08-27 13:38:13 “使用继电电路进行复杂的数学运算是可能的。事实上,任何可以用如果、或、与等字词在有限步内加以完整描述的操作,都可以用继电器自动完成。” 2014-08-28 12:13:17 文字的发明一度催化了逻辑学的发展,因为文字使得对于逻辑推理的分析成为可能——借助文字,成串的思维过程将呈现在人们眼前,供人审视。 2014-08-29 12:14:38 通过融合逻辑学和数学,创建出一个由公理、符号、公式和证明构成的体系,哲学家们似乎可以企及某种完美——达到一种严格的、形式上的确定性。 2012-09-03 02:34:34 人类长久以来孜孜以求的通用语言,也就是莱布尼茨宣称自己接近完成的通用表意文字,其实一直就那里,就隐藏在数当中。数可以用来编码任何形式的推理,表示任何形式的知识。 2012-09-03 02:47:42 而之所以会出现这些错误判断,原因之一是人们在面对一种全新技术时通常会遭遇的想象力失灵。 2012-09-03 02:48:49 显然,必须向人们解释清楚这项新发明,而这通常是从比较电话与电报开始的。 2012-09-03 02:49:18 但这些只是对技术进行抽象分析所得出的结论。而一旦人们有机会亲手拿起电话,他们马上就想出了该怎么用它——他们要在上面交谈。 第7章 信息论(我想要的不过只是一颗寻常的大脑) 2012-09-03 03:30:02 从巴贝奇的差分机到图灵的通用机,一个是笨重的庞然大物,一个是优雅的抽象虚构,两者相隔了一个世纪。 2012-09-03 03:35:46 在香农看来,模式就等同于冗余。在日常语言中,冗余可以辅助理解。
回应 2014-09-08 10:18:02 -
asasas (梦里不知身是客)
用鼓说话时,没人会说得直截了当。鼓手们不会说“回家吧”,而会说: 让你的脚沿它去时的路返回, 让你的腿沿它去时的路返回, 让你的腿脚驻立于此, 在这属于我们的村庄。 他们不会简单说“尸首”,而会展开详述成“仰面躺在土堆中的人”。如果想表达“别害怕”的意思,他们会说“把你的心从嗓子眼放回原处,你的心提到了嗓子眼,现在把它放回原处”。这些鼓说得叠床架屋,似乎表达效率相当成问题。这到底是卖弄辞藻,还是另有...2015-04-30 15:48:10
-
当对话取代听讲,当个性取代共性,当封闭转向开放,人的思想力得到了空前的释放,信息成为了社会的第一生产力 互联网所打破的实际是以纸书为代表的知识凝聚与传播方式。 现在,甚至连生物学也成为了一门研究讯息、指令和编码的信息科学。基因封装信息,并允许信息的读取和转录;生命通过网络扩散;人体本身是一台信息处理器;记忆不仅存储在大脑里,也存储在每一个细胞中;如此等等。 因为所谓历史,正是有了文字才成其为历史。...
2022-02-28 09:43:15
当对话取代听讲,当个性取代共性,当封闭转向开放,人的思想力得到了空前的释放,信息成为了社会的第一生产力
互联网所打破的实际是以纸书为代表的知识凝聚与传播方式。
现在,甚至连生物学也成为了一门研究讯息、指令和编码的信息科学。基因封装信息,并允许信息的读取和转录;生命通过网络扩散;人体本身是一台信息处理器;记忆不仅存储在大脑里,也存储在每一个细胞中;如此等等。
因为所谓历史,正是有了文字才成其为历史。过去之所以能够称为过去,全靠文字来记录轨迹。
逻辑是书面文字的产物,[19]这一点在各自独立发展出逻辑学的古希腊、古印度或古中国都概莫能外。
与之前的印刷术、电报和电话相比,互联网正在以完全不同的方式改变着语言。这种不同之处在于,它不带偏见地涵盖了从最大到最小的尺度:既能向百万之众广播,也能向小组窄播,还能收发一对一的即时讯息。
电报引发的“同步”概念虽然没有“消弭”时间,但其影响却越来越广。同步概念本身,以及意识到这个概念是全新的,不禁使人惊呼。
讯息在过去一直被视为指一种有形之物,但这其实从来都是一种假象。现在,人们需要有意识地将讯息的概念与承载讯息的纸区分开来。
任何能够创造出有效的差异,可为某种感官所感知的东西,都足以作为表达思想的手段。
而之所以会出现这些错误判断,原因之一是人们在面对一种全新技术时通常会遭遇的想象力失灵。
借助即时的电话通信,文明世界中散居各地的成员将被紧密地联系起来,就如同身体的不同器官被神经系统联结起来一样。这样的时刻已经指日可待。
信号作为一种抽象实体,与作为其载体的电流并不是一回事。
通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。
香农避免这个问题的办法是,把信号视为一串离散符号。这时,讯息发送者可以不通过增大信源的输出功率,而是通过使用额外的符号用于纠错,以此来克服噪声的干扰。这就像非洲的鼓手在进行远距离沟通时,他并不是更用力地去击鼓,而是为自己的言语增加额外的字词。香农认为,离散的情形在数学上更为基本。此外,他还考虑到了一点:把讯息视为离散的,这不仅可以应用在传统通信领域,还可以应用于另一个新兴的小众的领域,计算机器理论。
“在不同研究者手中,香农的信息论被引向了他当初始料未及的方向。香农曾说:“通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。”心理学家则不难看出,可以把外部世界视为信源,而把心智视为接收器。”
一个重大转变已然在进行:从考虑能量变成考虑信息。
复制DNA,就是复制信息;制造蛋白质,就是转移信息,发送讯息。生物学家之所以现在能够清晰地认识到这一点,是因为讯息已经有了明确的定义,并脱离了任何特定的载体。如果讯息能够加载在声波或电脉冲上,那为什么不会是通过化学过程呢?
自然选择的基本单位不是生物体,而是基因。
自然选择偏爱那些与其他基因一起能胜出,同时反过来其他基因与它们一起也能胜出的基因。
“在从我们的大脑和文化中争夺生存空间的战斗中,有效的作战单位是讯息。而我们对于基因和模因的新视角,虽然可能不好理解,却给了我们有益的启示,也给了我们更多可以写在莫比乌斯带上的悖论。”
一种更简单的理论,既可以解释大量已知的现象,也能预测尚未发生的事件。这就是著名的奥卡姆剃刀原理,
摘录来自: 史蒂芬·霍金;比尔·布莱森;尤瓦尔·赫拉利;詹姆斯·格雷克. “简史系列丛书。” Apple Books.
回应 2022-02-28 09:43:15 -
-
1、香农逻辑与非门,噪音还原信号窗户图形电脑贝尔。2、图灵机(#111+11# #11111# A右A#左B,B1替换#。)通用图灵,停机问题(不可判定的命题,不可判定的数)3、罗素悖论,哥德尔元数学论证命题会通过变换变成悖论(逻辑空间基于悖论),皮亚杰结构主义,系统基石/认知本体悖论。4、映射,共耦,可计算可控制。 5、信息论:密码,英文的百分之50冗余。信息是不确定性,是出人意料,是困难程度,是熵。 5.1不通过增大信源的输出...
2021-10-09 18:48:58
1、香农逻辑与非门,噪音还原信号窗户图形电脑贝尔。2、图灵机(#111+11# #11111# A右A#左B,B1替换#。)通用图灵,停机问题(不可判定的命题,不可判定的数)3、罗素悖论,哥德尔元数学论证命题会通过变换变成悖论(逻辑空间基于悖论),皮亚杰结构主义,系统基石/认知本体悖论。4、映射,共耦,可计算可控制。
5、信息论:密码,英文的百分之50冗余。信息是不确定性,是出人意料,是困难程度,是熵。
5.1不通过增大信源的输出功率,而是通过使用额外的符号用于纠错。汉明距离 (纠错复制双重检测)。5.2在二阶的情形中,每个符号的出现概率仅依赖于前一个符号。(打字员内在统计结构化)。5.3从100到1013。他将这条坐标轴命名为“比特存储容量”。 [37]然后,他开始列举一些可用来“储存”信息的东西。机械加法机上的数轮,只能储存十个十进制数字,也就是3比特多一点。在103下方,香农写上了“打孔卡片(所有可能配置)”。在104处,他安放的是“单行距打字的页面(32种可能符号)”。而在105附近,他写下了不同寻常的东西:“人类的基因构成”。一小时的电视节目大约有1011比特信息,而一小时的“彩色电影”就要超过1012比特。
5.5 H=(32选1用5比特,2对数,硬币,通道容量,纠错)
6、熵,信息量视为负熵。控制论,反馈。正反馈放大。负反馈维持稳态。比如用于控制蒸汽机的早期机械离心式调速器。大脑基于差异的认识,信息就是信息,既不是物质也不是能量,不会直接对应。(信息符号主观短路)。6.2、模拟的(差异、大脑)数字的(10计数)预测与概率连续性。((5000赫兹,信噪比为33分贝(2的20次,W log2(1+S/N) b/s)=10万比特。相当于-每秒10音素,64种音素(2的6次)=60比特。))6.3、心理学行为主义进化成黑箱神经元理论,机器人老鼠迷宫,次数跳出循环,神经症。6.4大脑数字处理极限7个。混淆。信道容量再编码。6.5、信道,媒介,冗余,噪声,概率。(随着纠错编码和数据压缩技术的齐头并进,火箭信号)
7、第一定律:宇宙的能量守恒。
第二定律:宇宙的熵恒增。(麦克斯韦:能量耗散的概念取决于我们的知识水平,不可避免地要涉及行为者或观察者心智。泼出去的水要用更大的能量收回来。)H公式类似。
7.2、麦克斯韦妖:每处理一个粒子,就是做了一次信息与能量的转换。,每获取一单位的信息、熵会增加klog2个单位。是集合大小一定时确定性增加的负熵,是随着集合增大确定性不变的正熵。
8、生命的本质。新陈代谢的本质是,生物体成功地使自己摆脱在其存活期内所必然产生的所有熵。信息。
8.1 、DNA分子携带信息:1、储存信息一维链条。2、转录信息,RNA, 蛋白质。(驱动小妖-酶。)3、有些密码子是冗余的,有些则用作起始或终止信号。正如信息理论家所预想的,冗余提供了容错能力。生物学中的讯息同样会受到噪声影响,DNA中的错误(误植)就是所谓的突变。4、一旦“信息”传入了蛋白质,它就无法再传出。具体而言,信息可以从核酸传到核酸,或从核酸传到蛋白质,但不可能从蛋白质传到蛋白质,或从蛋白质传到核酸。这里的“信息”,是指序列的精确次序。 因此,遗传讯息是独立、刺不透的:没有来自外部事件的信息可以改变它。5、基因上的差异可能导致表现型(即生物体实际性状)上的差异。制造一条腿需要涉及许许多多的基因,其中每个都会以合成蛋白质的方式下达指令。
9、模因,思想传播,语言图像,模仿复制,基因复制,韵和节奏,算法函数本体,活着的结构,环境表现,病毒重复行为回路,计算机网络自身也成为了宿主。。(道金斯基因永生,复制子,阅读基因基于环境表现。遗传学家定义的自私,指的是提升自身相对于竞争者的存活几率的倾向。)9.2、信息人类(可被描述)。
10.、随机程度如何与含有多少信息其实是同一个问题。它们的答案也是同一个。10.1、π不是随机的,蔡廷给出了一个明确的回答:一个数只要是可计算的,即它能够被一个可定义的计算机程序生成,那它就不是随机的。因此,可计算性是随机性的一种量度。10.2、基于组合、基于概率、基于算法。一个对象越简单,其传递的信息就越少;相反,复杂度越高,其含有的信息就越多。10.3、无论是哪一种计算机语言,它们其实都是等价的,都能归约到通用图灵机的语言。信息、随机性和复杂度,这三者本质上是等价。10.4 数论学家定义了各种类别的有意思的数:素数、完全数、平方数、立方数、斐波那契数、阶乘数,如此等等。593 这个数看似平常无奇,但它其实是九的二次方与二的九次方的和,所以是个莱兰数(即可以表达成xy+yx的数)。1729 这个数“相当无趣”。但拉马努金回应说,恰恰相反,1729是能用两种方式写成两个立方数之和的最小数。10.5、随机数:数的位数正好等于不确定程度,没有其他简化表述来产生冗余。(信息压缩)。一个混沌的信息流中可能隐含着一个简单算法,但要想从混沌中逆推出该算法也许是不可能的。
10.6、柯尔莫哥洛夫–蔡廷复杂性之于数学,就如同熵之于热力学:它打破了企图追求完美的幻想。一如永动机不存在,完全的形式公理体系也不存在。10.7、科学是一种数据压缩。确定中包含不确定性(比如圆周率,π在本质上并不随机,看上去却像个随机数。)电报员可以在讯息里只发送一个“π”,便会省下许多次击键——其实是省下了无穷次击键。 一条讯息就是一种算法。接收方则是一部机器。 10.8、信息压缩和传送后,需要使用则对应做功(本给出了月球及行星在一百年间每天位置的星历,其信息量并不比据以算出这些位置的运动方程及初始条件含有的信息更多,但它为使用者节省了自己算出这些位置的大量麻烦)
11、量子化的物理世界,如同比特或者等效于比特,量子概率与信息不确定性。信息等效于相相互作用的流变。话语与空气振动。蝴蝶效应与动态决定论。惠勒:信息与理念世界。兰道尔:遗忘需要功。
信息守恒:黑洞与平行世界信息交换。灰洞有毛时空拓扑比特外界信息交换。
隐形传超距:一、测量3与1的关系X。1和2纠缠坍塌。把关系X通过经典世界传给坍塌的2,还原3。 二、就算1和2组成阵列,观察2阵列依然会全部坍塌,无法分辨是哪个3导致的坍塌。
量子计算机:通过指数描述的信息可以通过指数组成的量子计算机通过线性方式覆盖。/量子计算机本身具有信息特征,二阶的信息(自动寻找最小压缩)。
其他:1、将Internet想象成了一个图,包含众多节点和连接——截至1998年初,节点有约一亿五千万个,连接有近二十亿个。他们将每一个链接视为一次价值的表达,一次推荐。他们还意识到,并非所有链接的价值都相等。于是他们发明了一种递归的价值计算法:一个网页的排名取决于其链入链接的价值,而一个链接的价值取决于其指向网页的排名。并且他们不只发明了这种算法,还公之于众。不过,让Internet知道Google是怎样运作的并没有损害到Google利用Internet知识的能力。2、后现代失去意义与实践带来的意义回归。
回应 2021-10-09 18:48:58 -
Cambrian (而昔日的梦悄然爬上我身)
第8章 信息转向 (形成心智的基本要素) 将信息论应用于超出其原本意图的领域,很可能是件危险的事情,但 我想危险恐怕也阻止不了人们这样做的热情。 ——J. C. R. 利克里德(1950)[1] 大部分数学理论都是慢慢成形的,香农的信息论却如雅典娜一样,甫一问世 便已成熟。不过,香农和韦弗的小书在 1949 年出版时,并没有引起公众足够的关 注。第一篇书评来自数学家约瑟夫·利奥·杜布。他抱怨,整个讨论“暗示”的 意味多于数学推导... (2回应)2021-06-24 22:45:53 1人喜欢
第8章 信息转向
(形成心智的基本要素)
将信息论应用于超出其原本意图的领域,很可能是件危险的事情,但 我想危险恐怕也阻止不了人们这样做的热情。
——J. C. R. 利克里德(1950)[1]
大部分数学理论都是慢慢成形的,香农的信息论却如雅典娜一样,甫一问世 便已成熟。不过,香农和韦弗的小书在 1949 年出版时,并没有引起公众足够的关 注。第一篇书评来自数学家约瑟夫·利奥·杜布。他抱怨,整个讨论“暗示”的 意味多于数学推导,并且“作者运用数学的动机并不总是那么正大光明”。[2]一份 生物学期刊评论道:“乍看之下,这主要是本工程学专著,对于解决人类实际问 题用处不大,或甚至根本没用。但事实上,该理论具有许多相当令人振奋的意 涵。”[3]《哲学评论》称,哲学家不应忽视这本书:“香农提出了一个‘信息’的 概念,并且令人惊讶的是,这个概念竟然是热力学中‘熵’概念的延伸。”[4]而 其中最奇怪的评论来自 1950 年 9 月的《今日物理》(Physics Today),文章作者 是麻省理工学院的诺伯特·维纳。这篇只有五段话的文章很难称得上是一份书评。
一开篇,维纳讲述了一则略带倚老卖老意味的轶事:
大约十五年前,一名非常聪明的年轻学生向麻省理工学院的教授提
230 | 信息简史 出了自己的一个设想,试图建立一种基于逻辑代数的电动开关理论。这
名学生就是克劳德·香农。
维纳接着说,在这本书中,香农(与韦弗一起)“总结了他对于通信工程的见解”。 维纳认为,香农提出的基本思想是“把信息量视为负熵”,并随即补充道,他
本人(“本书评作者”)也几乎在同一时间产生了相同的见解。 维纳声称,虽然香农的研究“独立于我的研究,但它从一开始就与我的研究 紧密联系,并有着相互影响”。他还提到,通信理论与统计力学之间的类比初看上 去有点牵强,但对于“我们当中那些已经试图将这个类比延伸至麦克斯韦妖研究
的人来说”,它是个物理事实。但对此,他补充道,相关研究还任重道远。 维纳进而指出,香农对于语言的讨论没有给予语言在人类神经系统内的通信
过程(“神经接收并传递语言到大脑”)以更多重视。不过,他也强调:“我这样说, 并不是为了吹毛求疵。”
最后,维纳用一整段文字介绍了另一本新书:“我自己的《控制论》”。他认为, 这两本书是一个必将迅猛发展的领域中最早的两声欢迎礼炮。
而在我的书中,作为作者,我有幸能从更思辨的角度,讨论比香农 和韦弗博士所选的更广阔的话题。我希望重申,在一个新领域......不仅 有空间,而且也确实需要种种在现实性或思辨性上各具特色的著作。
他之所以向这两位同人致以了敬意,恰是因为他们独立且精彩的工作殊途同归, 归到了自己的控制论上。
其实,香农此前已经在《无线电工程师学会学报》上针对维纳的书写过一篇 短评,虽是赞赏,但程度可谓轻淡:这是一本“出色的导论”。[5]两人的关系有点 紧张,这从《通信的数学理论》中韦弗文章开头的一个大段脚注中就能感觉得到:
香农博士强调,他的通信理论在基础哲学原理方面颇多受益于诺伯 特·维纳教授。另一方面,维纳教授也指出,香农在开关和数理逻辑方 面的许多早期研究是在他对该领域产生兴趣之前,并且他大度地补充道,
第8章 信息转向|231 引入熵的思想,将之作为该理论的基本思想,确实是香农一个人的功劳。
香农的同事约翰·罗宾逊·皮尔斯后来写道:“维纳当时满脑子里都是他自己的研 究......一些有识之士曾告诉我,维纳误以为自己早已得出了香农所得到的结论, 但其实他从来都没得出过。”[6]
控制论(cybernetics),作为一个新创词、一个日后的热门词、一块全新的研 究领域、一场将来的哲学运动,是由维纳这位聪明过人又锋芒毕露的思想家凭一 己之力所构想出来的。维纳借用的是希腊语中的“舵手”(κυβερνήτης,kubernites) 一词[英语中的 govern(治理)一词也源自于此,显然这并非巧合]。[7]维纳的控 制论意在整合通信和控制的研究,乃至人类和机器的研究。在他身为哈佛教授的 父亲培养和宣扬下,诺伯特·维纳年少成名,享有神童之誉。年仅十四岁时,他 就登上了《纽约时报》的头版:“一个被他的朋友们自豪地誉为世界上最聪明男孩 的小伙子,下个月就将从塔夫茨学院毕业......除了学习能力过人之外,诺伯特·维 纳与其他男孩一般无二......他那双深邃的黑色眼睛是他最引人注目的特征。”[8] 而在撰写自己的回忆录时,维纳也总是会在书名中加上神童两字,如《昔日神童: 我的童年与青年时代》和《我是数学家:一个神童后来的生活》。
从塔夫茨学院(数学专业)本科毕业后,维纳先后到了哈佛大学研究生院(动 物学专业)和康奈尔大学(哲学专业)深造。然后在回到哈佛取得博士学位后, 他又动身前往英国剑桥大学,师从罗素本人,研究符号逻辑和《数学原理》。不过, 罗素对维纳并不是全然欣赏,他曾在给友人的信中写道:“我这来了个名叫维纳的 神童,十八岁,哈佛大学博士......这孩子被惯坏了,以为自己是全能的上帝—— 我俩之间总是在暗暗较劲究竟谁该教谁。”[9]而维纳对罗素也不无反感:“他冷酷 如冰山。他的思维给人感觉就像一部敏锐、冷酷而狭隘的逻辑机器,这部机器会 将宇宙切成整齐划一的小块,比如长宽高正好三英寸。”[10]回到美国后,维纳从 1919 年开始在麻省理工学院执教,与万内瓦尔·布什恰在同一年。1936 年,香农 到麻省理工学院深造时,还上过维纳的数学课。随着战争阴影的逼近,维纳是最 早一批加入了机密的高射炮火控系统研究的人。
232 | 信息简史
诺伯特·维纳(1956 年)
他身材矮胖,留着山羊胡,头戴厚厚的眼镜。相较于香农的火控研究是深入 到研究噪声中的信号,维纳则是一直专注于研究噪声,比如雷达接收器上密集的 波动、飞行路线变幻莫测的偏差等。按他的理解,这些噪声在统计上与布朗运动 相似。布朗运动是一种“极其活跃而又完全杂乱无章的运动”,最早在 17 世纪由 列文虎克通过显微镜观察到。在 20 世纪 20 年代,维纳曾对布朗运动有过深入的 数学分析。当时他被这种不连续性所吸引,因为不仅是微粒轨迹,而且数学函数 也表现异常。他把这称作“离散混乱”(discrete chaos),chaos 这个术语则还要再 过几代人的时间才会被人们很好地理解。*在火控系统的研究中,相较于香农在贝 尔实验室研究组中所做的不太大的贡献,维纳与其同事朱利安·比奇洛(Julian Bigelow)则一起完成了一份极为知名的 120 页专著。它一度被列为机密,并被数
——————————
* 这里的 chaos 与 20 世纪 70 年代兴起的混沌理论(chaos theory)中的 chaos 并不完全相同。后者指 的是对初始条件极其敏感的动力系统的行为,最早由詹姆斯·艾伦·约克和李天岩在 1975 年提出。 前者则描述的是一种随机、混乱的状态。——译者注
十个有权查阅该书的人称为“黄祸”,这不仅是由于它有一个黄色封面,还由于它
的内容艰深难懂。在这份正式标题为《平稳时间序列的外推、内插与平滑化》 (Extrapolation, Interpolation, and Smoothing of Stationary Time Series)的研究中, 维纳发展了一种统计方法,用以根据有噪声、不确定和有失真的历史数据预测未 来。这种方法超出了当时武器的能力范围,但维纳还是在布什的微分分析机上进 行了测试。在他的设想中,高射炮及其炮手、目标飞机及其驾驶员,双方都是人
和机器的混合体,相互要预测对方的行为。 香农是沉默寡言,维纳则老于世故。他游历广博,通晓多国语言,雄心勃勃
且关注社会。他对科学的热情完全是发自内心,这从他对热力学第二定律的表述 中就可见一斑:
我们所做的是在奔向无序的巨流中努力逆流而上,否则它将使一切 最终陷于热力学第二定律所描绘的平衡和同质的热寂当中......这种物理 学上的热寂在克尔凯郭尔的伦理学中有个对应物,也就是我们所生活的 混乱的道德宇宙。在其中,我们的主要使命就是建立起一块块具有秩序 和体系的独立领地。但这些领地在我们建立起来后并不会就一直延续下 去。正如《爱丽丝镜中奇遇》里的红皇后所说的,我们只有全力奔跑, 才能留在原地。[11]
维纳很关心自己在人类思想史上的地位,并且志存高远。他在回忆录中写道,控 制论是“一种对人类,对人类关于宇宙和社会的知识的全新阐释”。[12]香农把自 己视为数学家和工程师,维纳则认为自己首先是个哲学家,甚至从火控系统的研 究中,他也能得出关于目的和行为的哲学结论。如果把“行为”的定义巧加改动
(“实体针对环境所做的任何变化”[13]),那么除了动物,这个词也能拿来描述机 器。为实现某个目标而采取的行为具有目的性,而目的有时是出自机器本身,而 非机器的人类操作员:比如,一种配备目标搜寻机制的鱼雷。“‘伺服机制’一词 正是用来称呼那些能实行具有内在目的性行为的机器。”其中的关键是控制,或自 我调节。
第8章 信息转向|233
234 | 信息简史
为了对此进行有效分析,维纳从电气工程中借用了一个不常用的概念:“反 馈”,即使能量从电路的输出端返回至其输入端。在正反馈的情形中,比如把扩音 器输出的声音通过麦克风再次放大,它最终会使系统失去控制。但在负反馈的情 形中,比如用于控制蒸汽机的早期机械离心式调速器(詹姆斯·克拉克·麦克斯 韦最早对此进行了分析),它却能将系统导向均衡,这时它起到了维持稳态的作用。 反馈可以是机械的:离心式调速器旋转得越快,其悬臂就伸展得越宽;反过来, 悬臂伸展得越宽,其旋转就势必越慢。反馈也可以是电气的。但无论是哪种方式, 信息都是整个过程中的关键。比如,高射炮火控系统的关键是,有关飞机坐标以 及有关高射炮自身上一个位置的信息。正如维纳的朋友比奇洛所强调的,对于上 一个行动的结果,重要的“不是如能量、长度或电压之类的具体物理量,而是信 息(无论其以何种途径传递)”。[14]
维纳意识到,负反馈肯定无所不在。比如在手眼协调中,负反馈引导着神经 系统,才能让人完成普通如拾起一支铅笔的动作。因此,他特别关注影响肢体协 调或语言表达的神经失调,认为这正是信息反馈机制出错的具体情形:比如各种 运动性共济失调,就是由于感官讯息或在脊髓处被阻断,或在小脑处被误读所致。 维纳对此的分析深入细致,也很数学化,甚至列出了方程,而这在神经学领域几 乎是前所未闻的。与此同时,反馈控制系统也被逐渐引入工厂装配线,毕竟机械 系统也同样能修正自身行为。反馈成了名副其实的治理者、舵手。
就这样,“控制论”成了维纳首部著作的主书名,副书名则是“或关于在动物 和机器中控制和通信的科学”。该书在 1948 年秋在美国和法国出版,而令出版社 吃惊的是,这样一部充斥着概念和分析的作品竟然出人意料地成了当年的畅销书, 连美国的大众新闻杂志《时代》周刊和《新闻周刊》都对它进行了专题报道。事 实上,维纳的控制论适逢其时,因为当时一样新事物正开始进入公众的视线,那 就是计算机器。随着战争的结束,首批为战争上马的电子计算工程也揭去了神秘 面纱,尤其是在宾夕法尼亚大学电气工程学院的埃尼阿克(ENIAC)。这是个重近 三十吨、长近三十米的庞然大物,由众多真空管、继电器和手焊线路组成,能够 对最多二十个十进制数进行存储和乘法操作,曾被美军用来计算火炮射表。国际
商用机器公司(IBM)除了为军事工程提供打孔卡片制表机外,也在哈佛大学建 造了一部巨型计算机器——马克一号(Mark I)。而在英国的布莱切利庄园,密码 破解者们建造了多部称为巨像(Colossus)的真空管计算机器,但它们在战后多 年依然是高度机密。阿兰·图灵在曼彻斯特大学也在建造类似的机器。所以当公 众得知这些机器的情况后,他们自然而然会将它们想象成“大脑”。所有人都在问 同一个问题:这些机器能思考吗?
“它们正以令人恐惧的速度成长,起初只是以快如闪电的速度求解数学方程, 现如今却已经开始像真正的机械大脑那样运作。”[15]而维纳的研究进一步鼓励了 这种遐想,《时代》周刊在当年的年终版中继续说道:
在维纳博士看来,没有理由认为机器不能从经验中学习,就像许多 大个早熟的孩童在文法学校中成绩会突飞猛进一样。一个这样的机械大 脑,一旦通过存储经验而变得成熟,它就可能足以经营一整个产业,不 仅会取代机械师和职员,甚至还会取代许多管理人员......
维纳解释道,随着人类建造出性能更优越的计算机器,随着他们对 自己大脑的探索更为深入,这两者看上去会越来越相似。他认为,人类 是在依照自己的形象来重建一个新的自己,只不过这次是把体积放大了 很多倍。
维纳的著作,尽管曲奥难读,但仍取得了巨大的成功,而这很大一方面要归功于,
他总是使自己的关注点最终落回人类身上,而非机器身上。相较于计算兴起本身 (毕竟他的研究与此关联不多),维纳对于计算对人类的可能影响更感兴趣。他深 切关注如精神失调、机械假体,以及智能机器兴起可能引致的社会失序等问题。 他担忧,智能机器将使人的大脑贬值,就像工业机器已经使人的双手贬值一样。 在“计算机器与神经系统”一章中,维纳深入探讨了人与机器的相似处。首
先,他区分了两种类型的计算机器:模拟与数字(不过他并没有使用这样的用语)。
前者(比如布什的微分分析机)使用连续尺上的度量来表示数,他称之为模拟 (analogy)机器。后者,他称之为数值(numerical)机器,则使用直接、精确的
第8章 信息转向|235
236 | 信息简史
方式来表示数,就像机械计算器里的情形。在理想状况下,为简单起见,数值机 器可以采用二进制数字系统。而如果要进行更复杂计算的话,它们还要用到某种 形式的逻辑。何种形式的逻辑呢?香农早在 1937 年的硕士论文中就已经回答了这 个问题,而现在维纳也给出了相同的答案:
逻辑代数,又称布尔代数。与二进制算术一样,这种算法也是基于 二分法,即是或否的选择,属于某类或不属于某类的选择。[16]
维纳认为,人的大脑至少部分可以被视为一部逻辑机器。计算机有继电器(无论 是机械的、机电的,还是完全电动的),大脑则有神经元。这些神经细胞在任意给 定时刻都处在以下两种状态之一:动作(点火)或静息(休止)。因此,它们可以 被视为双稳态继电器。神经元彼此连接,形成大型阵列,其接触点称为突触。讯 息就在神经网络中传递。为了储存讯息,大脑有记忆功能,而计算机器也同样需 要被称为记忆体的物理存储器。(维纳很清楚,这只是对该复杂系统的一种简化描 述。还有其他类型的讯息,它们更多的是模拟而非数字讯息,似乎是通过激素以 化学方式传递的。)他还提出,像“神经崩溃”这样的功能失调在电子学中也可能 找到对应物,比如对应于“神经系统中交通拥堵和过载问题”[17]的数据过载。因 此,计算机器的设计师可能需要为不合时宜的数据过载预先准备应对方案。
此外,大脑和电子计算机在执行逻辑运算时都需要大量能量。这些能量“被 消耗、转化成了热量”,并被血液或通风和冷却设施带走。但这其实都无关紧要, 维纳指出:“机械大脑并不会像过去的唯物论者所主张的‘如同肝脏分泌胆汁’那 样分泌出思想,也不会像肌肉发出动作那样以能量的形式发出思想。信息就是信 息,既不是物质也不是能量。不承认这一点,唯物主义在今天就站不住脚。”
接下来是一段群情激昂的时期。 “我们再度进入了一个科学进步的黄金时代——就像当初的前苏格拉底时
代。”[18]美国神经生理学家沃伦·麦卡洛克在一次会议上对与会的英国哲学家们 这样宣称道。他还告诉他们,聆听维纳和冯·诺伊曼等人就现代计算机器诸问题
进行的讨论,使人恍惚置身于古代先贤的辩论当中。他认为,一种关于通信的新 物理学已经诞生,形而上学也将因此发生根本的改观:“科学史上头一回,我们明 白了自己是如何进行认知的,因而我们能够清楚地将其表述出来。”不过,他所指 明的道路在当时无异于离经叛道,因为他所设想的这个明白人是一部计算机器, 其大脑由多达上百亿个继电器组成,其中每一个都从其他继电器那里接收信号并 将其传递出去。信号会被加以量化:它们或者发生,或者未发生。因此,世界的 构成材料再一次被证明是德谟克利特的原子:“在虚空中随意晃荡的不可分之物、 最小之物。”
它所在的是一个赫拉克利特的世界,永远“在变动”。我并不仅仅是 指每一个继电器本身都在永恒的活火中时刻消亡又再生,我也是指,每 一个继电器的工作都与信息相关——信息通过许多渠道进入它,在其中 穿行流转,最后再次回到世界中。
而这样的思想之所以有机会进行跨学科的交流,这在很大程度上要归功于麦 卡洛克,他就像一部推动交流、融合的发电机。战争刚结束不久,他就在位于纽 约公园大道的比克曼酒店筹办了一系列会议(1946 年至 1953 年)。会议得到了小 乔赛亚·梅西基金会的资助,该基金会由这位 19 世纪来自楠塔基特岛的捕鲸船长 的后代所创立。当时,一大批科学几乎在同时进入了成熟阶段:其中有些是所谓 社会科学,如人类学和心理学,它们正试图为自己寻找新的数学基础;有些是有 着混合名称的医学分支,如神经生理学;还有一些则还不完全称得上是科学,如 精神分析。麦卡洛克邀请了所有这些领域的专家,当然还有数学家和电气工程学 专家。他创立了一种诺亚方舟原则,即从每个领域邀请两名专家,这么一来,主 讲者的行话就总有在场的人能完全领会。[19]会议的核心成员包括,著名的人类学 家玛格丽特·米德(Margaret Mead)和当时还是她丈夫的格雷戈里·贝特森
(Gregory Bateson),心理学家劳伦斯·弗兰克(Lawrence K.Frank)和海因里 希·克吕弗(Heinrich Klüver),以及一对受人尊敬、但有时相互也会针锋相对的 数学家——维纳和冯·诺伊曼。
第8章 信息转向|237
238 | 信息简史
米德在会上使用别人看不懂的速记符号做纪要,而在首场会议上,她甚至在 激烈的讨论中咬碎了一颗牙齿而不自知,直到会后才发觉。维纳则在会上宣称, 所有这些科学,尤其是社会科学,说到底研究的都是通信,因而它们共有的一个概 念就是讯息。[20]会议一开始有个冗长的名称:“生物和社会系统中的循环因果和反 馈机制会议”。后来,出于对维纳的敬意,也是为了借助他当时的盛名,会议名称 改为了“控制论会议”。在各次会议上,“信息论”这个新潮、拗口、又有些可疑的 术语被人们反复使用。在有些学科中,这个术语用起来比较契合,有些就差一点。 但对于信息在各自世界观中应处于怎样的位置,人们当时还没有清晰的概念。
情况在 1950 年 3 月 22 日至 23 日举办的那次会议上有了转机。第一位主讲人 是来自芝加哥大学医学院的神经科学家拉尔夫·杰勒德(Ralph Gerard)。他首先 称赞了历次会议的成功:“会议主题和与会阵容引发了外界的极大兴趣,几乎成了 一次席卷全国的热潮。许多知名的科学杂志,如《时代》周刊、《新闻周刊》和《生 活》杂志,都对此有连篇累牍的报道。”[21]在众多报道中,他可能特别指的是《时 代》周刊年初一篇关于维纳的封面报道,题为《思考机器》,其中写道:
维纳教授是一只翱翔在数学及其邻近领域的矫健的海燕(不过他看 上去倒更像只粗壮矮小的海鹦)......在书中,维纳夹杂着警告和喜悦呐 喊道,这些伟大的新型计算机......昭告了一门全新的通信和控制科学的 诞生,并且他及时地将之命名为“控制论”。维纳指出,最新的一批机器 无论从结构或功能上看,都已经与人脑十分相似了。虽然目前它们还不 具备感官或“效应器”(如四肢),但为什么不给它们加上呢?
杰勒德承认,自己从事的领域正深刻地受到来自通信工程的新思维方式的影 响,比如由此将神经冲动不仅视为一个“物理–化学事件”,而且视为一个符号或 信号。向“计算机器和通信系统”取经很有用,但这样做无疑也存在危险性:
如果像大众媒体所说,这些机器就是大脑,而我们的大脑也不过是 计算机器,这种说法未免草率。倘若这样的话,我们也可以说,望远镜
就是眼睛,而推土机就是肌肉了。[22]
对此,维纳觉得有必要作出回应:“我无力阻止这些报道的面世,但我确曾尝 试要求这些报道在表述上保持克制。不过,对于他们在报道中使用的‘思考’一 词,我还是觉得不应该全盘否定。*”[23]
杰勒德的讲演主旨是讨论人的大脑(其中神经元之间的架构错综复杂,树突 的分支盘根错节,而且相互的复杂交互在“化学汤”中此起彼伏)能否被恰当地 界定为模拟的或数字的。[24]格雷戈里·贝特森立即打断了主讲人,表示不太明白 数字的与模拟的之间的区别。这可是个根本性的问题。杰勒德强调,他本人对此 的理解要归功于“先前在这块场地上得到的专家指教,尤其是来自约翰·冯·诺 伊曼的”(当时,冯·诺伊曼本人就坐在下面听讲),不过他还是决定班门弄斧, 尝试进行一下区分。模拟的就像计算尺,数用间距来表示;而数字的则像算盘, 算珠要么被计数,要么不被计数,没有介于两者之间的状态。同样,用来调节光 线的变阻器是模拟的,而墙上的开关则是数字的。杰勒德认为,神经系统的化学 活动和电活动都是模拟的。
讨论变得越来越热烈。冯·诺伊曼对此也有话要说。当时他正忙于发展“博 弈论”,一门他实际上视为研究不完全信息的数学。同时,他也在为新型电子计算 机考虑一种新的体系结构。借着杰勒德的话头,他希望说服与会者当中那些更习 惯于从模拟的角度看待问题的人能更加抽象地进行思考,从而认识到数字过程存 在于这个纷繁复杂、连续的世界当中。比如,当神经细胞在两种可能状态(“神经 细胞内没有讯息的状态,以及有讯息的状态”[25])中来回切换时,这种切换的化 学活动中可能具有中间的细微变化,但在理论上,这些细微变化可以被忽略。冯·诺 伊曼指出,不论是在大脑中,还是在真空管计算机中,尽管“这些‘离散的切换 动作’实际上是在连续过程的刺激下完成的”,但这些刺激的有限变化对于动作的 大局来说无关紧要。其实在不久前的一篇论文《论名叫大脑的数字计算机》中,
——————————
* 对此,让-皮埃尔·迪皮伊后来评论道:“说到底,这其实是一种极常见的情境,即科学家责备非科 学家对于他们所说的过于望文生义。控制论者一方面给公众灌输了思考机器即将变成现实的观念, 另一方面又迫不及待地与那些轻信此事的人撇清关系。”[26]
第8章 信息转向|239
240 | 信息简史
麦卡洛克已经将这种观点表述得很清晰:“在这个世界上,即使是表面看上去连续 的东西,似乎也最好将其视为由若干较小的步骤组成。”[27]在听众当中,会议新 人克劳德·香农,对此未置一词。
下一位主讲者是来自哈佛大学心理声学实验室的 J. C. R. 利克里德,人们都叫 他利克。他是一位涉足心理学和电气工程两个不同领域的年轻科学家,在语音和 声音处理方面颇有造诣。在这一年晚些时候,他加入了麻省理工学院,教授心理 学,并致力于组建一个独立的心理学系(心理学在当时还是经济学系的一部分)。 当时他正在研究语音量化的种种可能性,比如将语音的声波简化成可被一种“触 发器电路”再现的最小量。[28]这种触发器电路其实是一个他用真空管、电阻和电 容自制而成的设备,成本不过约二十五美元。但实验结果表明,即便对那些已经 习惯于在电话噪声干扰下进行通话的人来说,语音能被简化而不至于无法分辨的 程度还是令人惊讶。香农很用心地听了这场演讲,不仅因为他了解相关的电话工 程原理,也因为他在战争期间曾参与过语音加密的机密项目。维纳也听得兴趣盎 然,部分原因是他对于助听器有着特殊兴趣。
当利克里德说到,有某些失真既不是线性的,也不是对数的,而是“居于两 者中间”时,维纳打断了他。
“请问‘中间’是什么意思? X 加 S 再除以 N 吗?” 利克里德叹了口气:“数学家总是这样,对别人不精确的表述紧抓不放。”[29]
不过,利克里德对于数学并无问题,随后他就给出了一个估算,看在一条带宽为 5000 赫兹、信噪比为 33 分贝的传输线路上(这些数值与商用无线电广播的情况 接近),可以传送多少信息(这里用的则是香农提出的新术语)。“我认为,这样一 条信道可以传送 100 000 比特的信息。”当然,这里他指的是比特每秒。这是个让 人惊讶的巨大数目。作为对比,利克里德计算了日常人类语音的信息传输速率: 如果每秒传输 10 个音素,并假设可能音素的数目为 64(“为方便起见”取 26 ,这 样可能音素数目的对数值就是 6),那么信息传输速率就是每秒 60 比特。利克里 德补充道:“前提是,各个音素的出现概率都相等——”
“对!”维纳又插话。
“——但当然,各个音素的出现概率并不相等。”[30] 维纳被激起了兴趣,他还想知道,是否有人用类似的算法计算过“视觉压缩”,
比如电视的情形,而要想达到可分辨的程度,其中所需的“真实信息”又起码要 有多少。说到这,他顺口补充道:“我常弄不明白,人们为什么想要看电视。”
玛格丽特·米德则提出了另一个议题。她希望与会者不要忘记,意义有时可 以与音素和字典上的定义不完全相关。她说道:“如果谈到另一种信息,比如你试 图传递某人正在生气这一事实,那么在保持一条讯息原话不变的前提下,需要引 入多大程度的失真才能去除该讯息中的‘生气’意义呢?”[31]
第三场讲演在晚上举行,主讲人是克劳德·香农。他一上来就开宗明义:根 本不要去管什么意义。即便他讲的主题是书面英语的冗余,他也对意义毫无兴趣。 他所谈论的信息,是某种从一点被传递至另一点的东西,可能根本不含意义: “比如,它可以是一个随机数字串,也可以是一枚导弹或一个电视信号里的信息。” [32]重要的是,他打算把信源表示成一种随机过程,通过利用不同的概率生成讯息。
他展示了在《通信的数学理论》(下面听众中几乎没人读过这本书)中用过的字符 串样本,并描述了他的“预测实验”,即让受试者逐个字母地猜测文本内容。他告 诉听众,书面英语有一个特定的熵,这个值与冗余度相关,而他能根据这些实验 算出该值。听众被深深吸引住了,尤其是维纳,他也想到了自己的“预测理论”。
“我的方法与此有些相似之处。抱歉打断了你的话。”维纳插话说道。 香农和维纳的侧重点有所不同。维纳用熵来度量无序程度,而香农用熵度量 的则是不确定性。不过,正如他们所意识到的,两者从根本上说是一回事。一个 书面英语样本中的内在有序性越强(有序性表现为为语言使用者有意识或下意识 所知悉的统计特征),其可预测性也就越高,换用香农的话来说,也就是后续字母 所传递的信息量越少。如果受试者对下一个字母是什么信心十足,那么这个字母
就是冗余的,它的出现没有贡献新的信息。信息是出人意料。 其他听众也纷纷提出了各种问题,比如不同语言、不同文体、表意文字或音
第8章 信息转向|241
242 | 信息简史
素文字之间的统计分布是否都遵循齐普夫定律。*麦卡洛克就问道,新闻报道与詹 姆斯·乔伊斯的作品是否都遵循这个定律?(有人认为是的。)冯·诺伊曼的同 事、统计学家伦纳德·萨维奇(Leonard Savage)则问香农当初如何选的实验用书: 随机的吗?
“我走到书架前,随便拿了一本。”
“那不能称为随机吧,不是吗?”萨维奇反问道,“可能你会挑到一本工程学 专著。”[33]但香农没告诉萨维奇,其实他挑到的是本侦探小说集。
还有人问香农,婴儿的咿呀学语是比大人的说话更容易预测,还是更难? “我认为是更容易,”香农答道,“如果你与那个婴儿很熟的话。”
英语其实是很多种不同的语言,也许有多少人说英语,就有多少种不同的语 言,而每一种都有各自不同的统计特征。英语中还衍生出了许多人造方言,例如 字母表有限且精确的符号逻辑语言,以及一名提问者提到的所谓“飞机语”,即指 挥塔台和飞行员所使用的语言。此外,语言也是在一直变动的。因此,出生于维 也纳、也是维特根斯坦早期追随者的年轻物理学家海因茨·冯·弗尔斯特(Heinz von Foerster)就想知道,语言的冗余度随着语言的演化将发生怎样的变迁,尤其 是在从口语文化过渡到书面文化的阶段。
与玛格丽特·米德等人一样,冯·弗尔斯特也对不含意义的信息的概念感到 难以接受。冯·弗尔斯特后来回忆道:“当时我打算把他们所谓的信息论改称为信 号论,因为在其中信息还没有产生。那里只有‘哔哔声’,仅此而已,没有信息。 只有当这组信号被转换成我们大脑可理解的其他信号之后,信息才算诞生——总 之,信息不在‘哔哔声’里。”[34]尽管如此,他还是发现自己已经开始从新的角 度思考语言的本质以及它在人类心智和文化中的历史。他指出,一开始,没有人 意识到字母或音素是语言的基本单位。
——————————
* 齐普夫定律由语言学家乔治·齐普夫(George Zipf)在 1949 年提出。这是一条经验定律,描述的 是,在自然语言的语料库里,最常见单词的出现次数是次常见单词的两倍,是第三常见单词的三倍, 依此类推。——译者注
我想到的有古代玛雅文字、埃及的象形文字和早期的苏美尔泥板。 然后在文字的发展历程中,人们花了相当长的时间(或是出于偶然)才 发现语言可以拆分成比单词更小的单位,如音节或字母。
我有种感觉,那就是文字和口语之间存在着某种反馈机制......换句 话说,我相信,一种语言以单词统计的冗余度与以字母统计的冗余度之 间应该存在某种关联。[35]
会议上的讨论改变了他原先的认知,他开始承认信息占据着举足轻重的地位。在
编辑次年的第八次会议的会刊时,他在编者注中写了这样一句带有警句意味的话: “信息可被认为是从无序中夺得的有序。”[36]
尽管香农努力试图让听众集中注意在他对信息所下的不含意义的定义上,但 这群与会者可不会轻易就这样对其中的语义纠缠置之不顾。他们迅速把握了香农 的核心思想,然后就开始了大胆的发挥。社会心理学家亚历克斯·巴弗拉斯(Alex Bavelas)就评论道:“如果我们同意把信息定义为任何能改变概率或降低不确定 性的东西,那么很容易从这个角度来看待比如情绪安全感的变化。情绪安全感的 变化可被定义为个体对于自己属不属于某类人或自己被爱或不被爱的主观概率的 变化。”同样,手势或脸部表情、拍拍背或隔桌对你眨眼睛,如果这减少了你对自 身状态或在陌生群体中的地位的不确定性,那么这也是信息。随着心理学家吸收 了这种考虑信号和大脑的新视角,心理学的整个面貌即将发生急剧的转变。
说到群体中的陌生人,神经科学家拉尔夫·杰勒德想起了一个故事。在一个 派对里,人们彼此都很熟,这时来个了新人。他看到,有个人说“72”,所有人都 大笑。又有个人说“29”,全场沸腾。他就问这是怎么回事。
他旁边的人回答说:“我们讲过很多笑话,而且讲得次数太多了,所 以现在干脆直接讲号码算了。”这个客人也想尝试一下。他说了几个词, 然后说“63”。结果人们反应冷淡。“怎么回事,难道这数不是个笑话吗?”
“喔,是笑话,而且还是其中最好笑的之一,只可惜你没讲好。”[37]
第8章 信息转向|243
244 | 信息简史
在次年的会议上,香农带来了一个机器人。尽管它并不很聪明,外表也不像 人,但它给与会者留下了深刻印象,因为它能走迷宫。他们称它为“香农的老鼠”。
香农推出了一个柜子,柜面上是一个五乘五的网格。在二十五个方格之间可 以任意放置隔板,从而构造出不同的迷宫。迷宫的终点则以放置在任意一个方格 里的一个徽章来标记。在迷宫中走来走去的是一个感应触头,它在两个小马达的 驱动下可分别在东西和南北方向上移动。而在柜面下面有一个由约七十五个继电 器相互连接组成的阵列,它们各自的开开关关形成了机器人的“记忆体”。此外, 还有一个总开关,控制着机器人的启动和关闭。
香农边演示边讲解道:“机器关闭后,继电器就会忘记它已知的一切。因此现 在启动时,它们又是从头开始,对迷宫毫无了解。”[38]听众们都听得入了迷。“你 看,触头正在探索迷宫,找寻终点所在。每当它来到一个方格的中央时,机器就 会决定接下来要尝试的方向。”一旦感应触头碰到隔板,马达就会反转,使触头回 复到中央位置,而继电器则会将该事件记录下来。如此这般,机器会根据此前的
“知识”(这里免不了要用到这些心理学词汇)以及香农预先设定的策略来做每一 个“决策”。触头在迷宫里不断试错,有时会走进死胡同,有时会碰壁。但最终, 在众人瞩目之下,触头走到了终点。这时触头上的灯泡亮起,同时铃声响起,马 达停止了转动。
然后香农将触头移回起点,重新运行一次。这回,它直抵终点,没有转错弯, 也没有撞到隔板。它已经“学会”了如何走这个迷宫。如果把它放到先前走过的 方格中,它也能直接抵达终点。但如果把它放入先前未探索过的区域,那么它需 要重新开始试错,直到最终,“它建立起了完整的信息模式,可以直接从任何位置 抵达终点”。[39]
为了执行预先设定的搜寻策略和直抵目标策略,这台机器必须每访问一个方 格,就存储下一点信息:具体而言,也就是它上一次离开该方格时的方向。香农 解释道,由于只有东西南北四种可能,所以每个方格都被分配了两个继电器作为 记忆体。两个继电器,意味着两比特信息,但这对四选一来说已经足够了,因为 两个继电器可以有四种组合状态:关–关、关–开、开–关、开–开。
第8章 信息转向|245
香农和他的迷宫
下一步,香农重新布置了隔板,这样之前的路线就失效了。机器只好“瞎打 转”,直到找出新的路线为止。不过,碰得不巧的话,当旧记忆遇上新迷宫时,机 器可能会陷入无尽的循环。香农演示道:“当它到达 A 时,它记得旧的路线是往 B 走,结果它就陷入了 A-B-C-D-A-B-C-D 的循环当中。这是一个恶性循环,或者说, 它是在把这几个音符来回唱个不停。”[40]
“真是一种神经症!”拉尔夫·杰勒德说道。 不过,香农早有准备,他设计了一种“抗神经症电路”:一个计数器,用来在
机器重复同样的序列六次时跳出循环。伦纳德·萨维奇认为,这不免有作弊之嫌。 “它没有办法意识到自己‘发疯’了,只是意识到自己走得距离太长了?”萨维奇
问道。“是的。”香农也承认这一点。 如果迷宫里没有放置终点,它又会怎样做呢?香农解释道,那它会尝试走遍
每一个方格,碰遍每一块壁,并持续重复这个路径。 “这也太像人了。”劳伦斯·弗兰克不由叹道。
“乔治·奥威尔,已故的《1984》作者,大概应该见过这个东西。”精神病学
246 | 信息简史
家亨利·布罗辛(Henry Brosin)则这样表示。 香农使单个方向与每个方格相关联的组织机器记忆体的方式,具有一个特别
之处,即路线是不可逆的。当触头抵达终点时,它并不“知道”怎样返回到出发 点。机器所了解的所谓“知识”,其实是得自由这二十五个向量组成的向量场。他 解释道:“沿着这些向量所示,你会走到终点。但反转这个过程的话,你可能会遇 到分岔点,面对许多可能的方向。你无法通过研究记忆体确定,感应触头是来自 哪个方向的。”
麦卡洛克补充道:“这就像一个熟悉某小镇的人,他可以从任意一个地方走到 另一个地方,但他不一定都记得是怎么走到的。”[41]
香农的老鼠与巴贝奇的白银舞女、梅兰的机械博物馆里的白银天鹅和金属鱼 是同类,即它们都是模拟生命体的自动机械,总是会带给人惊喜和欢乐。而随着 信息时代的来临,出现了新一代的人工老鼠、人工甲壳虫和人工乌龟之类。它们 由真空管或稍后由晶体管制成,不过即便对比仅仅几年后的标准,它们也还显得 粗糙,甚至不值一提。比如,香农的老鼠的记忆体容量就只不过七十五比特。然 而,香农可以当之无愧地说,他的机器能通过试错解决问题,能记住解法并正确 无误地加以重复,能从经验中吸取和整合信息,还能在情况发生变化时“忘掉” 旧的解法。这部机器不只是在模仿生命体的行为,它也是在完成一些原本只有大 脑才能完成的功能。
匈牙利电气工程师丹尼斯·伽柏(他后来因发明全息摄影而获得诺贝尔物理 学奖)就批评道:“它看上去能从经验中学习,但实际上,记忆经验的是迷宫,而 非那只老鼠。”[42]这种说法有一定道理。毕竟说到底,里面并没有真正的老鼠。 而继电器无论被放置到哪里,它们都仍然保持着对于迷宫的记忆。事实上,这些 继电器成为了迷宫的一种心智模式,或者说,成为了关于该迷宫的一个理论。
并不是只有在战后的美国,才出现生物学家和神经科学家忽然间开始与数学 家和电机工程师相互协作的情况,尽管有时美国人说得仿佛就是这样。比如,维 纳在《控制论》的引论中用了相当篇幅谈及自己在别国的游历,在其中他就有点
不屑地写道,虽然英国研究者在控制论方面的兴趣几乎同样“浓厚且消息灵通”, 但在“整合该主题的研究,捏合不同研究思路”方面却比不上在美国所取得的进 展。[43]不过到了 1949 年,英国科学家当中形成了新的一批研究信息论和控制论的 核心团体。他们大多数都是年轻人,有着密码破解、雷达或火控方面的崭新经验。 脑电图研究的先驱之一约翰·贝茨建议,有必要为此成立一个英式的晚餐俱乐部
(“有限会员制,活动主要在用餐后进行”,对于俱乐部名称和徽章、会员守则、聚 会地点等也会有细致规定)。贝茨希望邀请有涉足电学的生物学家以及有涉足生物 学的工程师,并想到了一些可能的人选,“大概有十五个人,他们在维纳的著作出 版之前,就产生了与他类似的思想”。[44]在位于伦敦布卢姆斯伯里的英国精神疾 病医院(National Hospital for Nervous Diseases)的地下室,他们进行了首次聚会, 并决定自称“计算俱乐部”(Ratio Club)——Ratio 这个词具有多种含义可供会员 选取。*(菲利普·赫斯本兹和欧文·霍兰后来在撰写该团体的历史时,曾彩访过 许多当时还健在的会员,发现他们当中一半将 Ratio 读作 RAY-she-oh,另一半则 读作 RAT-ee-oh)。[45]在首次聚会上,他们还邀请到了沃伦·麦卡洛克。
他们讨论的话题不仅包括理解大脑,也包括“设计”大脑。精神病学家威廉·罗 斯·阿什比(W. Ross Ashby)就表示自己正在研究这样一种可能性,即“由随机 连接的、可塑的突触构成的大脑,通过经验的积累,将可以达到任意水平的有序 性”——换句话说,心智是一个自组织的动力系统。[46]另外一些人则在讨论模式 识别、神经系统中的噪声、能下国际象棋的机器人,以及机械产生自我意识的可 能性。用麦卡洛克的话来说:“可以把大脑想成电报中继器,它在一个信号激发下, 便发射出另一个信号。”中继器的历史则可追溯至摩尔斯的时代。“从大脑的分子 事件上看,这些信号由原子构成。每个信号或发出,或不发出。”大脑的基本单位 是一个选择,并且是一个二元选择。“这是或为真、或为假的最小的事件。”[47]
他们还成功地在 1950 年吸引了阿兰·图灵的加入。图灵在当年发表了一篇著
——————————
* Ratio 由艾伯特·厄特利(Albert Uttley)提议,取自莱布尼茨的“calculus ratiocinator”(计算机器), 意指“计算或与计算、计划和推理相关联的心智功能”。Ratio 也是 rationarium(统计数据)、 ratiocinatius(论证的)的词根。作为一个源自拉丁语的名字,Ratio 按理应读为 RAT-ee-oh。——译者注
第8章 信息转向|247
248 | 信息简史
名的论文,其中一开头便令人兴奋:“我想请大家考虑这样一个问题:‘机器能思 考吗?’”[48]而对于机器和思考这两个含义模糊的词,他认为即便对此不加定义, 也可以讨论这个问题。他的做法是,用一个测试来代替这个问题,他称之为“模 仿博弈”,也就是后来鼎鼎有名的“图灵测试”。模仿博弈最初的形式需要三个人 参与:一个男人、一个女人和一个提问者。提问者坐在一个隔开的房间里提问(在 理想状况下,图灵建议,问答双方所在的两个房间通过“电传打字机通信”)。提 问者的目标是判断另两个人中哪个是男人,哪个是女人。其中一个人,比如那个 男人,目标是误导提问者;而另一个人的目标则是帮助揭露真相。图灵认为:“对 于那个女人来说,最好的策略很可能就是如实作答。她可以补充这样一些话,比 如‘我才是女人,别听他瞎说’。不过这么做并不会有所帮助,因为那个男人也可 以说出类似的话。”
但如果问题并非问性别是男还是女,而是问种族是人还是机器呢?
通常认为人类的本质在于其“智能”,因此这个博弈被设计成了,通过在两个 房间之间传递的看不见摸不着的讯息进行判断。图灵平淡地说道:“我们不希望机 器由于在选美比赛中无法胜出而失分,同样我们也不希望一个人由于跑不过飞机 而失分。”此外,人也不应该由于做算术运算很慢而失分。图灵给出了一些适当的 问题和答案的例子,比如:
问:请以福斯桥为题,给我做一首十四行诗。 答:这种事就不要找我啦,我从来都不会写诗的。
不过,在继续深入之前,图灵觉得有必要解释一下自己所讨论的机器属于哪一类。 他指出:“当前大家对于‘思考机器’的兴趣,其实是由一类特殊的机器所引发的, 它们通常被称为‘电子计算机’或‘数字计算机’。”[49]这些设备从事的是人类计 算员的工作,但要比人类更快速,也更可靠。图灵清晰地阐明了数字计算机的本 质和特性,而这一点是香农没有做到的。冯·诺伊曼在建造埃尼阿克的后续机型 时,同样也做到了这一点。图灵认为,数字计算机包括三个部分:一个“信息仓 库”,相当于人类计算员的记忆或纸张;一个“执行单元”,负责完成一个个操作;
以及一个“控制器”,管理一个指令列表,以确保各指令按照正确顺序被执行。这 些指令被编码成数,它们有时被称为一个“程序”,而构建这样一个列表的工作通 常被称为“编程”。
图灵认为,数字计算机的设想早已有之,并将它归功于查尔斯·巴贝奇,他 曾在 1828 年到 1839 年间担任剑桥大学的卢卡斯数学教授——在当时可是鼎鼎有 名,但现在却几乎被人遗忘。图灵解释道,巴贝奇“已经产生了所有核心的思想”, 并且还“设计了这么一部机器,名叫分析机,但可惜始终没有完成”。分析机本来 要用到的是齿轮和打孔卡片——这与电可一点关系都没有。这种机器存在(或者 虽说不存在,但已经接近存在)的事实,让图灵得以驳斥他在 20 年纪 50 年代的 时代精神当中觉察到的一丝迷信。当时的人们似乎认为,数字计算机的魔力本质 上来源于电,并且神经系统的本质也是电。然而,图灵所努力要做的是,从最一 般的抽象角度来思考计算的本质。他知道,这与电毫不相干:
由于巴贝奇的机器没有用到电,并且所有的数字计算机在某种意义 上又都是等价的,我们可以得出,电的这种使用并没有什么理论上的重 要性......因此,数字计算机和神经系统都使用电这一特征,其实只是非 常肤浅的相似性而已。[50]
著名的图灵机是一部通过逻辑构建的机器,有着想象的纸带、任意的符号。它拥 有无尽的时间和无限的记忆体,能完成任何可表示成一系列步骤或运算的工作, 甚至能判断《数学原理》体系中的证明是否成立。“当遇到既不能被证实、也不能 被证伪的公式时,这部机器的行为显然不能尽如人意,因为它会无休止地运行下 去,却不会产生任何结果。不过,这与数学家的反应其实也相差不了多少,比如 他们就花费了数百年时间研究费马大定理是否成立。”[51]因此,图灵认为这部机 器应该能够玩模仿博弈。
当然,图灵无法装作能证明这一点。他的主旨其实是试图澄清在这场他看来 略显愚蠢的论辩(“机器能思考吗?”)中所使用的一些术语,比如数字计算机。 他还对未来半个世纪作出了一些预测:计算机的存储容量将达到109 比特(在他
第8章 信息转向|249
250 | 信息简史
的想象中,未来只需少量巨型计算机;他没有预见到,现如今小型计算设备会无 所不在,而且它们的存储容量都要比109 大上很多个数量级),并且计算机在经过 编程后可以较好地玩模仿博弈,至少能在几分钟内愚弄一些提问者(就目前所见, 这一点倒是不假)。
我相信,“机器能思考吗?”这个原始问题含义模糊,不值得讨论。 不过我也相信,到本世纪末,字词的使用以及普通公众的认识将会发生 很大改变,到时人们说到“机器能思考”时,将不会遭到什么质疑。[52]
但可惜图灵无法亲眼见证自己的预言是如何准确地得到了应验。1952 年,他因同 性恋行为被逮捕,随后遭受审判,并被定罪和取消参与涉密项目的资格。当局对 图灵实施了侮辱性的雌激素注射。1954 年,图灵自杀身亡。
在很长一段时间内,很少有人知道图灵在布莱切利庄园为破解恩尼格玛所从 事的秘密工作,了解他为国家所作出的卓越贡献。他有关思考机器的思想,在大 西洋两岸倒是吸引了不少关注。有些人觉得图灵的想法很荒唐,甚至很恐怖。当 他们征求香农的意见时,香农则坚定地站在了图灵这一边。他曾对一位工程师写 道:“对于我们所有人来说,机器能思考的思想丝毫没有什么令人不悦之处。事实 上,如果反过来说,人的大脑可能本身是一部机器,能够通过无生命的物体复制 其功能,我觉得这个思想相当吸引人。”[53]毕竟这比“用看不见摸不着的‘生命 力’、‘灵魂’或诸如此类来解释”要有用得多。
在 20 世纪中叶,计算机科学家想了解计算机究竟能做什么事,心理学家也想 了解大脑是不是计算机,或者说,大脑是不是仅仅是计算机。在当时,计算机科 学还是门新兴学科,而心理学作为一门科学也同样非常年轻。
心理学在 20 世纪中叶几乎陷入了停滞。在所有的科学门类当中,心理学一直 以来都最难以说清自己的研究对象究竟为何物。一开始,它的研究对象是灵魂, 以区分于人体学所研究的身体和血液学所研究的血液。17 世纪的荷兰医生詹姆 斯·德巴克(James de Back)最早提出“心理学”的说法:“心理学(psychologie)
是一门探究人类灵魂及其效应的学问。没有灵魂,人将不人。”[54]然而在本质上, 灵魂是不可言喻的,因而也几乎不可能被了解。而观察者与被观察对象共存一体、 相互纠缠(这只见于心理学),更使得问题难上加难。1854 年,当时心理学还更 多地被称为“心灵哲学”,大卫·布儒斯特就曾哀叹,没有一门其他学问像“心智 科学,如果它能算一门科学的话”那样进展寥寥。
人的心智,一些人认为是物质的,另一些人认为是精神的,还有些 人认为是由两者神秘混合而成的,但它始终不为人的感官和理性所理解。 它有如一块在北风恣虐下的荒原,每位路过的思想者都在上面撒下自己 的心灵杂草种子,生生扼杀了那些原本可能萌发成熟的好种子。[55]
当时这些路过的思想者,主要是通过内省的方法研究心理学,但这种方法的局限 性也很明显。到了 19、20 世纪之交时,为了使研究变得严谨、可验证,甚至是数 学化,许多心理学研究者开始转向多个大不相同的方向。弗洛伊德的思路只是其 中之一。在美国,威廉·詹姆斯几乎凭一己之力创建了心理学这门学科:他开设 了首个心理学课程,撰写了第一本综合性的心理学教科书《心理学原理》。但就在 他花十二年时间完成了这部巨著时,他却心生弃意。他在给出版商的信中写道, 这在自己看来是“一堆令人生厌、冗长、累赘、臃肿的文字,只表明了两个事实: 其一,根本不存在一门称为心理学的科学;其二,威廉·詹姆斯无能”。[56]
在俄罗斯,生理学家伊万·彼得罗维奇·巴甫洛夫,他曾因对于消化过程的 研究而赢得诺贝尔奖,开辟了心理学的一种新思路。詹姆斯在心情好的时候,还 会把心理学称为研究心智生活的科学,但巴甫洛夫对于“心理学”一词及其所有 相关术语都不以为然。在他看来,根本不存在什么心智,有的只是行为。所谓心 理状态、思想、情绪、目标、目的等,全是无形的、主观的、不可把握的东西, 不可避免地会沾染到宗教和迷信。詹姆斯视为心理学核心课题的东西,比如“思 想流”、“自我意识”、对时空的感知、想象力、推理能力以及意志等,在巴甫洛夫 的实验室里都不见踪影。科学家能观察到的只有行为,并且行为至少能够被记录 和测量。行为主义者,以美国的约翰·华生和后来非常知名的 B. F. 斯金纳为代表,
基于刺激(如铃铛、食丸、电击)和反应(如唾液分泌、按操作杆、走出迷宫) 建立了整个的科学体系。华生认为,心理学的全部目的在于预测某个特定的刺激 会引发怎样的反应,以及某个特定的行为要源自怎样的刺激。在刺激与反应之间 是一个黑箱,人们只知道它由感官、神经通道和运动机能组成,却无法通过科学 方法对其进行分析。事实上,行为主义者无非是又说了一遍“灵魂是不可言喻的”。 由于在条件反射和控制行为方面取得的成果,行为主义兴盛了约半个世纪的时间。
用心理学家乔治·米勒的话讲,行为主义者大概会说:“你们说什么记忆,说 什么期待,说什么感觉,说了那么多心智方面的东西。这些都是虚的,否则秀一 个给我看,指一个给我瞧。”[57]而他们则甚至能教鸽子打乒乓球或是教老鼠走迷 宫。然而到了 20 世纪中叶,不满的情绪开始显露出来。行为主义只研究可观察对 象的前提变成了教条,它对心理状态的一概排斥成了束缚自身发展的牢笼,而心 理学家依然渴望理解心智到底是什么。
信息论给了心理学家一条进入黑箱的入口。科学家分析了信息处理过程,并 建造机器来实现这样的过程。这些机器能记忆,还能模拟学习和目标搜索的行为。 对于老鼠走迷宫,行为主义者会讨论其中刺激和反应之间的关联,却会完全拒绝 讨论老鼠的心智;但现在,工程师只用少量电子继电器就建造出了老鼠的心智模 型。因此,工程师不只是在努力打开黑箱,他们甚至还试图自己做黑箱。在这些 黑箱中,信号不断被传输、编码、存储和提取,对于外部世界的内部模型也被创 建和持续更新。心理学家密切关注了这些进展,并从信息论和控制论当中借鉴了 一套有用的隐喻乃至一个有效的概念框架。比如,香农的老鼠就不仅可以被视为 大脑的一个粗略模型,也可以被视为一个行为理论。于是突然之间,心理学家也 开始谈论起了计划、算法、句法规则等东西。他们不仅研究生物如何对外部世界 作出反应,也开始考察生物如何将外部世界呈现给自己。
在不同研究者手中,香农的信息论被引向了他当初始料未及的方向。香农曾 说:“通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。” 心理学家则不难看出,可以把外部世界视为信源,而把心智视为接收器。
既然耳朵和眼睛可以被视为信道,那么为什么不像对麦克风和相机那样也对
它们进行测试和度量呢?纽约市立大学亨特学院的化学家霍默·雅各布森就说 道:“对于信息的本质和度量的众多新概念,使得度量人类耳朵的信息容量成为可 能。”[58]他这样说,也这样做了。后来他又对眼睛进行了同样的度量,得出的估 值要比耳朵的信息容量(以比特每秒计)大上四百多倍。就这样,许多更精致的 类似实验突然间变得有了意义,其中一些更是直接受到了香农在噪声和冗余方面 研究的启发。1951 年,一个研究小组就做了一项实验,测量受试者在不同情况下 听对单词的可能性:一种情况是他们被告知单词要从少量可选单词中选出,另一 种情况则是要从大量可选单词中选出。[59]结果似乎显而易见,但这样的实验之前 却从来没人做过。还有实验者研究了如果试图同时理解两个对话,会有什么效果。 也有人开始研究,人在面对一组数字、字母或字词时能够理解或记住多少,而它 们又包含多少信息。在一些标准实验中(比如,受试者可能需要在蜂鸣声中识别 出语音,并在接受视觉刺激时,通过手按键和跺下脚作出反应),刺激和反应这样 的用语逐渐被信息的传输和接收所取代了。
曾有一段短暂的时期,心理学研究者之间还对这种转变争执不休。但过了不 久,讨论便平息了下来。1958 年,主要研究选择性注意和短期记忆的英国实验心 理学家唐纳德·布罗德本特就写道:“当比较需要作出两个反应的情况与只需作 出一个反应的情况时,是用刺激和反应来解释实验结果,还是用信息论的术语来 解释,两者之间的差异变得最为明显......毫无疑问,用刺激和反应也能对结果作 出合适的解释......但相较于信息论的解释,这样的解释就显得繁复了。”[60]也是 在这一年,布罗德本特开始执掌英国医学研究理事会下的应用心理学研究部门。 人们在那里及其他地方都进行了大量实验,涉及人类处理信息的各种方式,比如 噪声对表现的影响、选择性注意和感知的过滤、短期和长期记忆、模式识别,以 及问题解决等。那么其中逻辑又该归入哪门学科呢?是心理学,还是计算机科学? 但有一点已可以肯定,它已不仅仅只属于哲学的范畴了。
在英国有唐纳德·布罗德本特,在美国则有同样影响深远的乔治·米勒,他 在 1960 年共同发起成立了哈佛大学认知研究中心。而早在 1956 年,他便已经因 一篇论文而声名鹊起。论文的标题略显古怪:《神奇之数: 7 2 ——我们处理信息能力的某些局限》。[61]论文提出,大多数人每次在工作记忆内储存的最大单位 数目大致是七个,比如七个数字(这是当时美国典型的电话号码长度)、七个单词 或实验心理学家展示的七件物品。米勒声称,在其他类型的实验中也会不断发现 这个数。比如受试者会被要求辨别盐度不同的盐水滴、音高或响度不同的声音, 以及计算屏幕上随机显示的亮点数目(如果亮点数目在七个以下,他们几乎总能 准确说出来;而如果超过七个,人们就几乎总是要靠估算)。无论实验怎么做,七 总会是反复出现的那个阈值。米勒写道:“这个数会以各种不同的形式出现,有时 略大一点,有时略小一点,但从来都不会变到无法辨认的程度。”
显然,这是某种类型的粗略简化;米勒也承认,人类具备从数千人脸或单词 中进行辨识的能力,也能够记下很长的符号序列。为了说明这是种什么类型的简 化,米勒借助了信息论,尤其是香农将信息理解为在多个可能选择中作出一个选 择的观点。他首先提出,“观察者可以被视为一个信道”(这种说法想必会让当时 还占据主流的行为主义者大吃一惊),他接受输入信息,传递并输出信息(关于响 度、咸度或数字的信息)。米勒还简要解释了一下比特:
一比特信息,就是我们在两个出现概率相等的可能选择中做出决策 时所需的信息量。如果我们想要判断某人身高是低于六英尺,还是高于 六英尺,并且已知两种情况出现的可能性相等,那么我们只需一比特信 息......
两比特信息使得我们能在四个出现概率相等的可能选择中做出决 策,三比特使得我们能在八个出现概率相等的可能选择中做出决策...... 依此类推。换言之,假如存在三十二个出现概率相等的可能选择,我们 就要依次做出五次二元决策,每次决策一比特信息,这样才能知道哪个 选择是正确的。因此,基本规则很简单:可能选择的数目每翻一番,所 需信息量的比特数就加一。
这样算来,神奇之数七是略小于三比特。米勒接着分析了,在单维刺激和多维刺激(比如结合了大小、明度和色相)的情况下,随着可能刺激的数目增加,观察者的反应会开始出现混淆,而混淆出现的这一点可以被称为其信道容量。米勒还 注意到,人们还会借助信息理论家所谓的“再编码”(recoding),将信息拼凑成越 来越大的组块,比如使电报的点和划凑成字母,字母又凑成单词,单词再凑成短 语。米勒最后的总结颇有点宣言的性质。他宣称:“这种语言的再编码,在我看来, 正是思考过程的核心命脉。”
来自信息论的各种概念和度量方法,使得我们能够对其中一些问题 加以量化。该理论给我们提供了一把量尺,借此我们可以校准刺激材料, 并度量受试者的表现......
信息论相关概念的价值已经在辨别和语言的研究中得到了证实,并 在学习和记忆的研究方面表现出了巨大的潜力,近来甚至还有人建议它 在概念形成的研究中也可以有用武之地。许多在二三十年前看来不会取 得什么成果的问题,或许现在值得重新审视一番了。
这就是在心理学史上被称为认知革命的开始,一门结合了心理学、计算机科 学和哲学的认知科学也由此发端。事后回想起来,一些哲学家也将这一时刻称为 信息转向(informational turn)。弗雷德里克·亚当斯就写道:“在那些接受信息转 向的人看来,信息是形成心智的基本要素,信息必然促成了心智的起源。”[62]也 正如米勒本人所喜欢说的,心智借着机器重新进入了视野。[63]
香农在当时不是个家喻户晓的名字(他的名声从不曾传到普通公众当中),不 过在自己的学术圈内,他却享有偶像级的声望。有时他也会到大学和博物馆就“信 息”发表通俗演讲。在其中他会解释基本思想,比如调皮地引用《新约·马太福 音》第 5 章第 37 节的话,“你们的话,是,就说是;不是,就说不是;若再多说, 就是出于那恶者”,以此作为比特和冗余编码概念的范本。他还会预测计算机和自 动机械的未来前景,比如他在宾夕法尼亚大学的一次演讲中就说道:“总而言之, 我认为,这一整个信息产业将在本世纪快速崛起和发展,其中包括信息的采集、 信息从一点到另一点的传输,以及恐怕是最为重要的,信息的处理。”[64]
第8章 信息转向|255
256 | 信息简史
克劳德·香农(1963)
面对心理学家、人类学家、语言学家、经济学家及其他各类社会科学家纷纷 学时髦搭车信息论的做法,一些数学家和工程师不免感到不悦。香农本人便把信 息论称为一种科学“时尚”(bandwagon),并以此为题在 1956 年写了一篇仅有四 段话的短文,特意进行提醒:“许多不同领域的科学家同人,为其浩大声势及其开 辟的科学分析新思路所吸引,正纷纷将这些思想应用到自己研究的问题上去...... 尽管对于我们这些从事这个领域研究的人来说,这一波流行热潮固然让人欣喜和 兴奋,但同时它其中也带有危险的元素。”[65]香农提醒人们,信息论的核心是数 学。尽管他个人确实认为信息论的许多概念会对其他领域有所帮助,但它不是万 金油,也无法被简单照搬:“这样的应用,并不是简单地将术语翻译到一个新领域, 而是需要经过缓慢而艰辛的假设和实验检验的过程。”并且香农感到,类似的艰苦 工作在“我们自家院里”都还没怎么开展,因此当务之急是研究,而非阐释。
至于控制论,这个词则开始淡出人们的视线。1953 年,最后一次控制论会议 在普林斯顿的拿骚旅馆举办,但维纳并不在场,因为他早已与一些与会者闹翻,
第8章 信息转向|257 包括麦卡洛克。在最后进行总结发言时,对于会议所取得的成就,麦卡洛克说道:
“我们从未达成过一致的共识。但就算是达成了,我也看不出上帝有什么理由会赞 同我们。”[66]
在整个 20 世纪 50 年代,香农始终是这个自己创立的领域里的学术领导者。 他写出了大量艰深、充满各种定理的论文,其中很多都蕴涵着进一步发展的可能, 为扩展该领域的研究奠定了基础。香农研究的主题之一是信道,麦克卢汉后来也 将之称为“媒介”。他对信道进行了严谨的数学分析,研究很快得到了应用并取得 了丰硕的成果:广播信道和窃听信道、有噪信道和无噪信道、高斯信道、有约束信 道、反馈信道、有记忆信道、多用户信道和多址接入信道,等等。(当麦克卢汉宣 称媒介即讯息时,他是在开玩笑。事实上,媒介既独立于讯息,又与它密不可分。)
香农取得的重要成果之一是有噪信道编码定理,它指出利用纠错编码可以有 效地抵消噪声和失真的影响。一开始,这个成果所预示的前景可望而不可即,因 为纠错编码需要用到大量计算,而计算在当时并不便宜。但到了 20 世纪 50 年代, 在纠错编码上的进展开始逐渐将香农预示的前景变成了现实,对此的需求也日渐 明显。其中一个应用是,在使用火箭和人造卫星进行太空探索时,它们需要借助 有限的能量将讯息送出遥远的距离。随着纠错编码和数据压缩技术的齐头并进, 编码理论也成为了计算机科学的关键组成。没有编码理论,就不可能有调制解调 器、光盘和数字电视等。而对于研究随机过程的数学家来说,编码定理也可以用 来度量信息熵。
与此同时,香农还取得了其他许多为今后的计算机设计奠定基础的理论进展。 其中一个发现给出了在一个具有多个分支的网络中,如何使流量最大化的方法, 这里的网络可以是通信网、铁路网、电网或水网。*还有一篇论文则有一个直截了 当的题目,《采用劣质继电器构建可靠的电路》[不过在发表时,题目被改为了《采 用不甚可靠的继电器构建可靠的电路》(“Reliable Circuits Using Less Reliable Relays”)[67]]。香农还研究过开关函数、率失真理论和微分熵等。虽然公众对于 ——————————
* P. Elias, A. Feinstein, and C. E. Shannon, “A Note on the Maximum Flow Through a Network,” IRE Transactions on Information Theory 2, no. 4 (1956): 117–119.——译者注
258 | 信息简史
这些研究一无所知,但他们却能广泛感觉到计算时代到来的震撼,而这其中香农 与有力焉。
1948 年,香农在一篇论文中探讨了一个他自称“本身无关紧要”的问题:如 何给机器编程,来让它下国际象棋。[68]人们早在 18 和 19 世纪就做过此类尝试, 但这些在欧洲各地巡演的自动下棋机器偶尔会被人拆穿是里面藏着小人。到了 1914 年,西班牙数学家、工程师莱昂纳多·托雷斯克韦多(Leonardo Torres y Quevedo)公开展示了一部真正的、纯机械的下棋机器,名字就叫棋手。它会下 一种简单的三子残局:单车杀王。
现在香农指出,执行数字运算的计算机经过设计之后,能够下完整的棋局。 他解释道,这些“包含数千个真空管、继电器和其他零件”的设备,能够在“记 忆体”内存储许多数,而经过一个巧妙的翻译过程后,这些数可以用来表示棋盘 上的方格和棋子。香农提出的基本原理一直被所有国际象棋程序沿用至今。当时 计算尚还处于青涩年代,很多人很快就设想,计算机能够计算出所有可能的走法 和子力组合,从而完美解决国际象棋问题。他们认为运算快速的电子计算机能完 美地下棋,就好像他们当时也认为它能做出可靠的长期天气预报一样。然而,香 农经过粗略计算后指出,一盘典型的国际象棋棋局涉及的可能组合数目超过了 10120 ——这个数要远大于以纳秒计的宇宙年龄。因此,在香农看来,计算机不能 靠蛮力搜索来下国际象棋,而是要像人下棋那样进行推理。
香农甚至还登门拜访了美国国际象棋冠军爱德华·拉斯克,而拉斯克也给了 他一些改进建议。[69]1950 年,香农为《科学美国人》杂志撰写了一篇介绍先前论 文的通俗文章,在其中他提出了那个浮现在所有人脑海中的疑问:“这种下棋机器
‘思考’吗?”
答案完全取决于我们如何定义思考......从行为主义的观点来看,这 部机器表现得它似乎在思考。我们总是认为,要下好国际象棋需要推理 能力。因此,如果我们把思考视为是外部行为而非内部方法的一种属性, 那么这种机器显然在思考。
不过,根据香农在 1952 年的估算,大概需要三名程序员花费六个月的时间, 才只能让一台大型计算机的下棋水平勉强达到马马虎虎的业余水准。“而比起预 先编好程序的棋手,能自主学习的计算机棋手的问题恐怕要留待更远的将来来解 决。目前提出的各种方法显然都太过缓慢,想必还没等赢下一盘棋,机器就已经 报废了。”[70]但重要的是,要探索通用计算机尽可能多的潜在用途。
香农也不忘施展自己的奇思异想。他设计并建造了一台机器,用来做罗马数 字的算术运算,比如 IV(4)乘以 XII(12)等于 XLVIII(48)。他将这台机器命 名为 THROBAC 一号,取自“简型罗马数字守旧计算机”(THrifty ROman-numeral BAckward-looking Computer)的首字母缩写。他还建造过一台“读心机”,用来玩 小孩猜奇偶的游戏。所有这些奇思异想之举都有一个共同点,那就是将算法应用 到了新领域中去,即将思想抽象映射到数学对象上去。香农退休后还写过一篇数 千字的长文,分析抛球的科学原理,其中提出了一系列定理和推论,并凭借记忆 引用了诗人 E. E. 卡明斯的诗句:“某个混账会发明出测量春天的机器。”[71]
在 20 世纪 50 年代,香农还尝试设计一种能自行修复的机器。[72]如果其中某 个继电器坏了,机器能自动找到并替换它。他甚至考虑过这样一种可能性,一种 机器通过从环境中收集零件并加以组装,从而实现自我复制。虽然贝尔实验室乐 于让香农出去谈论这些话题,演示他那能学会走迷宫的机器,但并不是每个听众 都感到满意。“弗兰肯斯坦”之类的说法开始出现,怀俄明州的一名报纸专栏作家 就写道:“我很纳闷,你这年轻人是否意识到自己在摆弄的是些什么东西。”
要是你启动了一部这样的机械计算机,却忘了在出去吃午餐时关掉 它,那会发生什么事呢?我来告诉你。它在美国就会像野兔在澳大利亚 一样。在你算出 701 945 240 乘以 879 030 546 等于多少之前,这个国家 的每个家庭就都有了一台自己的小计算机......
香农先生,我无意批评你的这些实验,但坦率地讲,我对哪怕是一 台计算机都丝毫没有兴趣。更别提要是有一堆计算机挤到我周围,又是 乘又是除,又做其他什么它们擅长的事,那我一定会相当生气。[73]
第8章 信息转向|259
260 | 信息简史
在香农对信息论的“时尚”提出警示两年后,一位年轻的信息理论家彼得·伊 莱亚斯在一份学术期刊上发表了一篇社论,其中对一篇题为《信息论、光合作用 和宗教》的论文提出了批评。[74]当然,这篇论文是杜撰的。但在当时确实有过一 批论文,讨论诸如信息论、生命和拓扑学,信息论与组织损伤物理学,信息论与 文职系统,信息论与心理药理学,信息论与地球物理学资料解释,信息论与晶体 结构,信息论与旋律,如此等等。伊莱亚斯的父亲曾作为工程师在爱迪生的实验 室工作,而他本人则是位严肃的专业研究者——他就对编码理论作出了重要贡献。 对于这些堆砌概念、投机取巧而又毫无新意的所谓“跨学科”研究,他十分警惕:
“这篇论文讨论了信息论与心理学(或遗传学、语言学、精神病学、商业组织)在 用语和概念框架上出人意料密切的关系......诸如结构、模式、熵、噪声、发送器、 接收器以及编码等概念(只要适当加以阐释)都对双方至关重要。在首次为心理 学奠定了稳固的科学基础之后,论文作者谦虚地将填充自己所提出的框架的工作 留给了心理学家。”伊莱亚斯把这称为偷窃,并呼吁这些同人放弃偷窃,开始诚实 的劳作。
香农和伊莱亚斯的警告都发表在一份知名的信息论学术期刊上,而这份期刊 只是当时为数众多且在不断增加的专门研究信息论的新期刊之一。
有一个流行词在各个学术圈里业已名声不好,那就是熵。另一位学者科林·彻 里就抱怨道:“我们见到‘熵’被用在了语言、社会系统、经济系统以及各种苦于 缺乏新方法的研究当中。它具有某种笼统性,因而成为一些人的救命稻草。”[75] 他没有说到,毕竟当时还看不出端倪,信息论正开始改变理论物理学和生命科学 的研究轨迹,而熵正是促成了这种改变的原因之一。
虽然当时信息理论家对于许多社会科学学科的直接影响已经过了巅峰,他们 所用的数学也越来越适用于计算机科学而非心理学,但他们曾经的贡献是实实在 在的。他们催化了许多社会科学学科的发展,为其迎接即将到来的新时代作好了 准备。在这些学科中,信息转向的痕迹无法被消除。
2回应 2021-06-24 22:45:53
论坛 · · · · · ·
谁知道本书的写作背景是在那个年代吗 | 来自氓氓鲤 | 1 回应 | 2021-11-05 17:58:36 |
写推荐序的人? | 来自未命名 | 2021-10-21 12:43:13 | |
一部可以帮助理解本书的BBC纪录片 | 来自旧居 | 9 回应 | 2021-09-16 17:07:11 |
关于 “若马可能不属于任何人,那么人也可能不属于... | 来自3wen4y | 2020-08-26 16:18:02 |
当前版本有售 · · · · · ·
-
限时抢
这本书的其他版本 · · · · · · ( 全部9 )
-
Knopf Doubleday Publishing Group (2011)8.5分 68人读过
-
Vintage (2012)8.7分 23人读过
-
衛城出版 (2011)7.6分 17人读过
-
Fourth Estate (GB) (2011)暂无评分 7人读过
谁读这本书?
二手市场
订阅关于信息简史的评论:
feed: rss 2.0
3 有用 KentZhu 2014-01-09 16:33:28
万物源自比特,且比特是免费的;维基也不是纸,任何围绕纸张或者空间的隐喻已死;每句话都被记录在了空气的某处,每幅图像也会在空气的某处留下永恒的印记。
2 有用 YellowStar5 2021-07-05 22:17:19
信息是什么?信息是离散的选择。信息不是知识,知识不是智慧。为什么有的书读的快,一种可能是它提供的信息不多,存在大概冗余;另一种可能是给你提供的信息增量不多
4 有用 aJ 2014-01-24 11:55:31
这本书将「宇宙即是信息,信息即是宇宙」作为切入点,叙事宏大地描摹了世界在信息论这一纬度上的历史变迁。从巴贝奇先知似的直觉与研究到香农确定信息论,图灵完成思想实验,整个世界被信息重新赋予意义。 考虑到我们大多数人最后一次严肃而成体系地学习还要追溯到高中时期的经典物理与基础数学,现今这个世界其实对我们而言相当陌生,甚至违背「经验」。 但不同于量子物理等前沿科学,诸如因特网等又已经实实在在深入每个人的日... 这本书将「宇宙即是信息,信息即是宇宙」作为切入点,叙事宏大地描摹了世界在信息论这一纬度上的历史变迁。从巴贝奇先知似的直觉与研究到香农确定信息论,图灵完成思想实验,整个世界被信息重新赋予意义。 考虑到我们大多数人最后一次严肃而成体系地学习还要追溯到高中时期的经典物理与基础数学,现今这个世界其实对我们而言相当陌生,甚至违背「经验」。 但不同于量子物理等前沿科学,诸如因特网等又已经实实在在深入每个人的日常生活。 考虑到这一点,我们实在有必要读一些如本书这样的科普。即便对其中内容一知半解甚至一窍不通,也能拓宽一下我们的视界,毕竟这有关于我们每天与之生活(悲观论者可能会说是被迫与其打交道),但却还不甚了解的新世界。 (展开)
55 有用 mymike 2014-10-30 22:04:39
这本关于信息的科普作品完全不在状态,通篇拼凑了无数故事却离题甚远,很多概念根本没有解释,也给不出解释。推荐另一本讲述信息史的《解码宇宙》,这才叫优秀的科普作品!
14 有用 雨果僧 2014-09-05 16:08:38
敲鼓那章很有趣,其他的读起来索然无味=.=....信息冗余是有价值的,提供了情境
0 有用 或洛 2022-06-29 22:23:43
“世界的本质是比特”本身是非常吸引人的理念,信息论的观点可以迁移应用到包括人文社科在内的许多领域的研究中。开头和尾声部分臭又长,直到巴贝奇的差分机部分我才读出一些兴趣,如果删去一些无聊的描写,我可以多给一星。
0 有用 Jing 2022-06-26 20:17:02
Opened up a window through which I can observe this world from a fundamentally different angle.
0 有用 kayoko 2022-06-17 01:53:31
还不错
0 有用 芒可猫 2022-06-14 16:00:45
@2015-09-16 20:27:18
0 有用 回首之泪 2022-06-11 02:58:57
22年第37本~ 从非洲的鼓说到现在的信息过载,讲述了信息被认识和发展的过程。挺有意思的一本书,相对比较好理解。人类以负熵为食、通信的基本问题是在一个点精确或近似地复制另一个点的讯息、信息不是讯息价值好的度量方式等印象比较深~