用物理机制理解生命现象。
本书首版于2018年。
原名:《The Demon in the Machine: How Hidden Webs of Information Are Solving the Mystery of Life》(机制里的恶魔:隐秘的信息网络如何解开生命之谜)
作者:保罗·戴维斯(Paul Davies),英国,1946-,物理学家、宇宙学家、天体生物学家,科普作家。
译者:王培。
用物理机制理解生命现象。
亮点
将量子力学引入生命科学,例如:光合作用的高效性,酶的催化威力,动物的磁感应导航,基因突变的偶然性等。
前置知识
细胞 > 染色体 > DNA > 基因 > 碱基对。它们共同构成了生命的遗传信息传递体系。
细胞是生命的基本单位,人体由数万亿个细胞组成。在真核细胞的细胞核内存在的遗传物质,承载着所有的遗传信息。
染色体是细胞核中携带遗传信息的结构,由DNA与蛋白质(主要是组蛋白)组成。人类每个细胞有23对染色体(46条),其中22对为常染色体,1对为性染色体。染色体包装与传递遗传物质,在细胞分裂时高度螺旋化,确保遗传信息的准确分配。
DNA(脱氧核糖核酸)储存遗传信息,通过碱基序列编码生命指令。DNA是染色体的核心成分,呈双螺旋结构,由四种碱基(A、T、C、G)按特定顺序排列而成。DNA是遗传信息的化学载体,一条染色体包含一条超长的DNA分子(人类每个细胞中的DNA总长度约为2米)。
基因是DNA上具有特定遗传效应的片段,是遗传信息的基本功能单位。人类基因组约含2万-2.5万个基因,每条染色体上分布着数百至数千个基因(每条染色体携带特定的基因组合,不同染色体上的基因类型与数量存在显著差异)。基因通过编码蛋白质或RNA分子,控制生物体的性状与功能,例如:血型、眼睛颜色等。
碱基对是构成基因的基本单位,一个基因通常包含数百到数千个特定顺序排列的碱基对。碱基对的排列顺序决定了基因的功能,例如:人类血红蛋白基因由约1500个碱基对组成,这些碱基对的特定序列编码了血红蛋白的合成指令。
阅读笔记
第1章
薛定谔:发生在生物体空间边界内的时空事件,如何用物理学与化学来解释?生物体令人困惑的属性最终能否被还原为原子物理学或者其他事物?……生命要从无序中产生有序,并符合热力学第二定律,就必定存在分子实体。该实体能够以某种方式为形成生物体而编码指令,同时其本身要足够复杂,以嵌人大量信息,它还要足够稳定,以对抗热力学的降解效应——现在我们知道,这种分子实体就是DNA。
本书的核心话题:新物理学不涉及额外的力,它能将物质与信息、整体与部分、简单性与复杂性交织起来。
科学领域有句名言:如果某个东西真实存在,我们就应该能够测量它。
对于海盗号实验中的“标记释放”实验,科学界的主流观点认为,这些阳性结果(探测到二氧化碳)更可能是由火星土壤中高氯酸盐等强氧化剂引发的非生物化学反应所致。
人类每个体细胞含有约60亿个碱基对,每个碱基对的长度约为0.34纳米。即::60亿 × 0.34纳米 = 约2米。这意味着每个直径仅几微米的细胞核内,容纳着长达2米的DNA分子。如果将人体内所有细胞的DNA首尾相连,总长度可达约100万亿米,相当于地球到太阳来回距离的300倍。这么长的DNA能够被压缩进微小的细胞核内,得益于DNA通过多级折叠结构。
普利高津:化学耗散结构(当某种特定的化学混合物被迫远离平衡态时,它就能自发演化出稳定形式)代表了通往生命的最初几步,它既远离平衡态,又支持物质与能量的持续交换。
对化学系统而言,能量在其中的流动与存储,与信息的流动和存储方式有关。
第2章
蒸汽机是将煤炭的化学能转变为机械牵引力的首选方式。在此过程中需要在能量、热、功、废物之间做出权衡与优化。
能做功的是热流,而不是热能本身。想要利用热能,某个地方必须存在温度差。
说单个分子处于无序或随机状态没有意义。熵与热能之类的热力学量由大量粒子及其平均运动状态来定义,而不需要考虑个体粒子的具体细节(这种平均状态也称为粗粒度视图)。气体的温度与气体分子运动的平均能量有关。
不能以任何绝对的方式说在这个或那个物理系统中包含了多少信息。然而可以说,通过采用某种测量方式能够获得多少信息。信息可使被测量系统的无知程度或不确定性降低——即使我们不清楚整体的无知程度,也可以确切知道不确定程度降低了多少。
当前主流认知倾向于认为:信息既不是纯粹的抽象概念,也不是完全独立的实体,而是介于两者之间的存在形式。信息需要物质载体与能量传输,但其本身有相对独立性,能够被记录、传递、处理、创造。信息、物质、能量共同构成宇宙的基本要素,三者间是相互依存、相互转化的关系。这种认知既承认信息的客观实在性,又强调其与物质、能量的不可分割性,为理解信息的本质提供了哲学与科学基础。
清除信息的行为产生的熵增,正好抵消了麦克斯韦妖获取信息的行为带来的熵减。
费曼写在办公室黑板上的警句“凡我不能创造的,我就不能真正理解(What I cannot create, I do not understand)”体现了他对知识理解的哲学。这句话的含义是:真正的理解不是被动接收知识,而是能够主动构建与创造。如果你无法用自己的语言向他人解释某个概念,或者无法独立推导出某个结论,说明你还没有真正掌握它。费曼认为,理解知识的标准是能够用简单明了的语言向初学者解释,或者在实际应用中创造性的运用。这种理念后来发展成了费曼学习法:选择某个概念,尝试向他人讲解,发现理解漏洞,重新学习并简化表达。通过这种以教促学的方式,学习者能够将知识内化为自己的认知体系,而不仅仅是记忆术语与公式。
为了更高效,系统必须学会选择值得存储的信息,因为记住所有事情是不必要的浪费。
第3章
生命是不断变化的化学与信息模式的综合体。
图灵机是否会停机是无法预测的,即:不存在通用算法能够判断任意程序在给定输入下是否会停止运行。停机问题的不可判定性揭示了计算的限制,与哥德尔不完备定理一起动摇了“一切可判定的陈述皆可被机械证明”的乐观信念。
我们会把“人性”视为真实存在的事物或属性,尽管我们知道,人类的想法与行为最终由遵从物理定律的大脑驱动。
至今仍未得到解答的科学问题:要想同时获得自繁殖与无限可进化性特征,所需的最低级别的复杂性是什么?如果复杂性的门槛很低,我们可能会认为生命很容易出现,并能在宇宙中广泛分布;如果门槛很高,地球上的生命就可能是例外,是一系列极不可能事件的离奇产物。
当我们观察生物时,看到的是它们的物质身体。如果探索其身体内部,就会看到器官、细胞、亚细胞器、染色体、直至(用精致的仪器)看到分子本身。但我们看不到信息,看不到大脑回路中信息流的旋涡模式,看不到细胞中的信息引擎,看不到信号分子运动引发的有组织的级联反应,看不到存储在DNA中的致密填充信息——我们看到的是物质,而不是信息——我们仅了解了生命故事的一半。我们无法直接感知信息,只能感知它所在的物质结构,它在其中流动的网络,以及将它连接起来的化学回路。想要全面解释生命,我们需要同时理解生命的硬件与软件,也就是它的分子结构与信息结构。
信息会以复杂的模式在生物体与生态系统中传播,它也会垂直流动,一代一代向下传递,为自然选择与进化改变奠定基础。
第4章
进化既发生在生物的“硬件”上——更大的翅膀、更长的腿、更敏锐的视力;也发生在生物“软件”上——不断变化的信息模式与命令控制系统。
DNA是物理对象,在复制过程中必定会产生随机性错误,这就为遗传变异提供了机制,自然选择也会借机发挥作用。
只知道完整的基因组细节还不足以“解释生命”,也没有人能依据基因组序列预测出真实生物的样子,以及基因组序列中的随机变化会如何改变表型。
生物化学家林恩·卡波拉尔:“拒绝将完全随机的基因变异视为基因组进化的基底,并不是对达尔文与华莱士的自然选择理论的否定,而是为其提供了更深入的理解。”近期的很多实验均带有些许拉马克学说的意味,其实是对达尔文主义进行了修正,即:自然不仅选择最能适应环境的生物,还会选择最合适的生存策略(比完全随机性更高效的定向随机性)。
目前很多研究案例都暗示存在着不同的机制,其中大都带有拉马克学说的意味,不过还没有发现能够支配这些现象的系统性信息管理规律或原则。达尔文主义的“纯正”版本究竟需要得到多大程度的修正,仍是颇具争议性的问题。
在自然选择压力下,适度的突变率有助于物种适应环境变化。
基因突变是指DNA序列中碱基对的组成或排列顺序发生永久性改变的现象。当DNA修复机制在修复损伤时,如果修复过程出现错误,就会导致原本正常的DNA序列被错误的修改,从而形成突变。DNA复制与修复过程中的总体错误率约为10-9至10-10,即每复制10亿至100亿个碱基仅产生1个错误。虽然单个细胞的错误率极低,但细胞基数庞大(70公斤成年男性的细胞总数约为36万亿个,每天产生的突变数量约几万亿个),在多重防御机制(DNA修复机制、细胞周期检查点、免疫监视等)失效的情况下,突变累积将导致疾病。
癌症没有严格的定义,它的标志性特征有14个。人类的晚期癌症可能表现出它的部分或全部特征,包括:(1)持续的增殖信号。癌细胞自身分泌生长因子,持续刺激增殖;(2)逃避生长抑制。对抑制细胞生长的信号不敏感;(3)抵抗细胞死亡。逃避细胞凋亡程序;(4)无限复制能力。激活端粒酶以实现细胞“永生”;(5)促血管生成。诱导新血管形成,为肿瘤提供营养;(6)组织侵袭与转移。突破基底膜,扩散到其他器官;(7)基因组不稳定性与突变。DNA修复机制缺陷,突变累积;(8)逃避免疫清除。通过表达PD-L1等分子抑制免疫系统;(9)肿瘤促炎症作用。慢性炎症促进肿瘤发展;(10)能量代谢重编程。优先进行糖酵解供能(瓦氏效应);(11)解锁表型可塑性。细胞去分化,获得干细胞样特性;(12)非突变表观遗传重编程。DNA序列未变,但基因功能改变;(13)多态性微生物组。肠道菌群等微生物影响肿瘤发展;(14)衰老细胞通过分泌促炎因子促进肿瘤。
癌症不是损伤的产物,而是对损伤性环境的系统响应,是原始的细胞防御机制,是细胞应对恶劣环境的方式。癌症可能被突变触发,但它的根本原因是对“远古就存在于生物体内的应急生存程序”的自我激活,其中增殖是最古老、最重要、最受保护的功能。触发癌症的威胁不一定是辐射或化学物质,也可能是组织老化、低氧张力、各种机械压力、受伤(包括电子干扰),有很多因素可以单独或共同导致细胞采取它内置的“癌症应急模式”,即:复制、复制、再复制,同时竭力增加细胞的突变率,从而生存下去。
再解释:癌症是返祖现象。几十亿年前,我们的单细胞祖先的唯一生存法则就是无限增殖。现代多细胞生物的细胞面临严重威胁时(组织老化、低氧、机械压力、辐射、化学物质等),它们会抛弃复杂的合作机制,切换回古老的单细胞模式——不顾一切的复制,同时增加突变率以求生存。
驱动癌症的古老途径与机制具有极强的保护与保存能力,因为它们能够实现生命最基本的功能。
第5章
量子力学(量子隧穿、量子纠缠、相干性等)并非只存在于实验室中,而是生命现象不可或缺的一部分。
第6章
不可能只用化学反应来解释生命,还必须考虑到有组织的信息模式的起源。也不能单靠信息来解释生命,还需要知道逻辑运算是如何从分子中涌现的,包括数字信息存储与用数学方式编码指令,这意味着逻辑运算在编写语义内容。语义信息是更高层面的概念,它在分子层面上毫无意义。
复杂的化学反应只是生命诞生的基底,早期的分子混沌转变到有组织的信息管理(尤其是遗传密码起源的解释)可能更重要。
第7章
很多伦理与法律问题都取决于意识是否(或者在多大程度上)存在于生物体中。例如:对堕胎、安乐死、脑死亡、植物状态、闭锁综合征的看法,都取决于相关主体在多大程度上拥有意识。
只有大脑中数百万个神经元被整合到复杂且高度互联的神经网络中时,意识才会产生,意识体验是由很多同时出现的构件组成。例如:如果我意识到一片风景,我对它的瞬间体验就包括了来自整个视野的视觉信息与听觉信息,这些信息在大脑的不同区域得到处理,然后被整合成连贯的整体,并以某种方式传递给“意识自我”(无论它是什么),以产生有意义的整体体验。
没有哪种仪器能探测到时间的流动以及其流逝速率。时钟测量的是事件之间的时间间隔。
结语
坍缩是不可逆的,因为波函数各个分支的相位信息被观测行为破坏了。
自我指涉(Self-reference)描述的是系统或概念在定义、解释、运作过程中以自身为参照的循环性特征。系统能做什么不仅取决于系统如何变化,还包括系统通过自我指涉实现自我生产(Autopoiesis)的能力。系统通过自我指涉建立封闭的运作循环,同时通过异己指涉保持对环境的开放性,这种“封闭的开放性”正是现代功能分化社会系统的基本特征,即:社会通过功能分化形成多个独立平等的子系统(例如:政治、经济、法律、科学、教育、宗教等,每个系统都承担独特的社会功能),每个子系统通过自我指涉机制实现运作封闭性与认知开放性的统一,在保持各自逻辑的同时通过结构耦合相互影响,共同构成复杂的社会系统网络。
关于生命起源存在两种鲜明的哲学观点:偶然性假说与必然性假说,这两种观点构成了生命起源研究的哲学争议。偶然性假说认为,生命在地球上的出现是极其偶然的事件,是无数随机因素叠加的结果。这种观点强调,生命起源需要一系列极其苛刻的条件同时满足,这些条件出现的概率极低,因此生命在宇宙中可能是极其罕见的。必然性假说认为,生命是宇宙演化的必然产物,只要条件适宜,生命就会自然出现。这种观点强调物理化学规律的普遍性,认为生命起源是物质演化的自然结果。
偶然性与必然性并非完全对立。生命起源是必然性中的偶然性——物理化学规律为生命出现提供了必然的可能性,但具体的形式与路径则受到偶然因素的深刻影响。
目前科学界的主流观点是化学起源说,认为生命是通过化学进化从无机物逐步演化而来。这个过程包括四个阶段:无机小分子→有机小分子→生物大分子→多分子体系→原始生命。
作者的观点:没有证据显示已知的物理定律有利于生命的出现,但它们可能会有利于形成广泛的复杂信息管理系统。
遗憾
文中介绍的多个机制仍是假说,尤其涉及量子生物学领域。
质疑
正文155页:癌症的标志性特征大约有12个。实际:根据Douglas Hanahan和Robert A. Weinberg教授在《Cell》杂志上发表的经典综述,癌症的特征经历了从6个(2000年)到10个(2011年)到14个(2022年)的演进。