进化背后的图结构
看了一下其他的几篇书评,没有一个说到点子上。用下面一张图表达一下我的心情。
好了,玩笑到此为止。我虽然不是学生物的,但在科研里研究搜索算法也做过蛋白质折叠的相关问题,同时一直对进化机制感兴趣,在此就说一下个人对本书的理解。另外本人并非数学专业,如有术语错误请多包涵。
本书的书名《Arrival of the fittest》是对适者生存(survival of the fittest)的改写。作者认为适者生存这个说法仅仅解决了进化中一部分的问题,但无法解释适者是如何出现的。传统的观点是随机突变产生了大量的有差别的个体。我做了一张导图来说明这两者之间的关系。
从作者书中的例子来看,如果仅凭随机突变,那么在有限的时间里是无法产生任何有意义的创新的。因为和所有的可能性相比,这些有意义的突变犹如沧海一粟,哪怕穷尽宇宙寿命这么长的时间,也只能探索这沧海的一小部分。这里面沧海就像一个搜索空间,而一粟则是所要搜寻的解决方案。作者对此给出的答案则是,如果这个搜索空间是由某种特殊的图结构组成的,那么在其中搜索解决方案则会非常容易。
这也是这本书的中心论点,就是讲有一类特殊的图结构(这里的图是指图论中的图)组成的搜索空间,能使得无论从哪里作为起点,都能很快找到比较好的解决方案。为了阐述这类图结构的性质并表明其普遍性,作者在不同的章节通过代谢网络(metabolic network),蛋白质功能(protein folding),调节回路(regulator circuit),计算机芯片集成回路(integrated circuit)为具体实例。本书虽然披着生物和进化的皮,但一直在翻来覆去地讲这些表面现象背后相似的图结构。
书中每一章作者都是按着如下的套路展开的:一个有趣的表象 -> 若是随机突变很难在有限的时间内从搜索空间中的一点到达另一个有意义的点 -> 进行一些计算模拟,然后发现这个表象背后的搜索空间具有这类特殊的图结构。
至于这类特殊的图结构什么样子,可以想象成一种绵密缠结的图网络组成的高维空间,很难用语言描述。在书中127页有一句话“ Both metabolic and protein libraries are full of genotype networks composed of synonymous texts that reach far through a vast multi-dimensional hypercube, and both harbor unimaginably many diverse neighborhoods. ”我认为很贴切。如果硬要举一个例子就有一丢丢像下图的线球,其中的不同颜色的线相当于不同的genotype network,它们缠结在一起,每一个颜色的线在反复缠绕的过程中会经过很多其他颜色的线。如果沿着一个颜色的线(genotype network)行走,很快就能走到距离另一条颜色的线很近的一点,在这一点附近的突变就会很容易从一个genotype network跳转到另一个genotype network上。从而得到一个潜在的有意义的解决方案。