终极算法狂想曲
这篇书评可能有关键情节透露
其实这本书:
翻译得可以说是相当糟糕了——简直怀疑译者黄芳萍是不是用了机器来翻译。它主要介绍了目前人工智能机器学习领域的五种流派和其算法:符号学派、联结学派、进化学派、贝叶斯学派和类推学派。在最后作者试图将这五种算法融合在一起形成一种终极算法(当然这种终极算法内有作者自己的新东西),这就好比是物理学中的万物理论一样,可望而不可及。因为糟糕的翻译,对这五种主要算法的介绍非常晦涩难解,读完也一知半解,虽然知道了皮毛,但不知道具体是怎样的,只能从一个宏观的角度去观察它,却无法用于实例(当然,这或许需要读者拥有极高的数学、逻辑、计算机知识),不过作者在最后展示了人工智能逐步实现自动化之后的世界图景,颇有种《黑镜》之感,因此这篇读后感的标题叫:终极算法狂想曲。————————————————————
一些常识:
机器学习算法的本质:从数据中推断,机器自动会弄明白做事的方法(一种自我构建的技术),掌握的数据越多,它们的工作就越顺利,我们不用给计算机编程,它们给自己编程。算法将庞大的数据转变成新的科学知识,掌握的数据越多,算法也就越精准。比如在医学领域,只要提供患者数据库,朴素贝叶斯算法可以在一秒内作出诊断。因此数据才是最重要的,无论算法有多好用,也只是在获得数据时好用。机器学习通过输入的数据和想要的结果(可能是提供的真实数据),输出的是算法。通过机器学习,计算机会自己编写程序,用不到人类。工业革命使手工业自动化,信息革命解放了脑力劳动,而机器学习则使自动化本身自动化。机器学习的核心是预测:预测我们想要什么、我们行为的结果。但横亘在算法面前的有两头怪兽:空间复杂性——算法需要的信息量大于计算机可存储量;时间复杂性——算法运行的时间在产生结果前运行太长。在机器学习中,预设观念是必不可少的,没有预设观念就无法进行学习。————————————————————
机器学习主要有五个学派:
- 符号学派(从逻辑学中寻求洞见),主算法是逆向演绎::
——所有的信息都可以简化为操作符号,就像数学那样。符号学家选择的算法是决策树归纳,对规则进行排序,然后选择符合描述的规则,以此推类并削减(这与电话语音提示菜单系统是一样的),这类算法被称为分类器:概念本身及其反面。符号学派在尝试慢慢分离每个类别,直到每个分支都变得纯粹。因此符号学派的核心理念就是所有和智力相关的工作都可以归结为对符号的操纵——即形式推理。符号学派假定新的路基规则,作为数据与预期结论之间的步骤。
- 联结学派(对大脑进行逆向分析),主算法是反向传播:
——学习是大脑所做的事,因此我们要做的就是对大脑进行逆向演绎。联结学派相信知识存储在神经元之间的联结关系中(而计算机的晶体管数量已经赶上人类大脑里的神经元数量了,虽然人脑的能量消耗要远低于计算机),这使得它们学习神经元的加权激活方式(这个方式可以参考我以前的笔记:《连接组》阅读笔记②,简单来说是重新赋权:神经元调整彼此之间连接强弱的比重)制造了感知器。在感知器中有正权值和负权值,通过改变权值和界限值,我们改变感知器计算的函数——感知器就像一个微型社会(神经元也想一个微型社会),少数服从多数。总之,通过调和权值来进行学习活动,直到准确无误。
- 进化学派(在计算机上模拟进化),主算法是遗传编程:
——所有形式的学习都源于自然选择,我们要做的是在计算机上对进化进行模拟。机器人在计算机的模拟中得以进化,由于是在计算机中进行,其速度比活体进化快10亿倍。遗传算法的关键就是给程序打分,让程序逐渐进化到完全契合目标——适应度达到完美。随着时间的流逝,适应度更高的基模会主导群体,这就是适者生存的法则。适应能力最强的会进行交叉和变异,以生产下一代。而先天和后天是交替进行的,后天学习的东西会成为下一论进化的先天之物。但对进化学派的质疑是,进化的产物有时候是错误的,比如大脑的构造就有许多限制,纯粹根据自然启发来构建算法,可能不会是终极算法。有趣的是,作者提出了模拟进化和自然进化在“性”上的区别,似乎在模拟进化中“性”没有用,但在生物进化中,“性”的出现是为了让种群出现多样性,不至于一次性被微生物感染灭绝。而计算机也有可能产生“性”,如果计算机病毒与之作对的话,这是种适应策略。作者还说了个真相:性和色情是推动技术发展的动力,当直立人发现火时,他们用它来便于约会,而肯定的是,“拟人化”机器人会推动性爱机器人行业的发展。这点我在未来世界,人类会幸存吗?中有讨论:你披着科技的外衣更纵欲无度。
- 贝叶斯学派(认为学习是概率推理),主算法是贝叶斯推理:
——将新的证据纳入我们的信仰中,而概率推理算法尽可能有效地做到这一点。贝叶斯定理不是简单的规则,而是当你收到新的论据时,用来改变你对某个假设的信任度。也就是说,它是用数据来让先验概率转变为后验概率,使其更符合预测的方式。当数据越来越多,模型会越来越有可能性——贝叶斯学派无所谓世界的真相如何,他们只关心证据如何改变后验概率。通俗的来讲,他们通过新证据来修正你之前相信的东西,得到后来相信的东西。其实贝叶斯概率公式本身很简单,可以简单搜索下:贝叶斯公式_百度百科贝叶斯学派甚至认为所有企图描绘真实世界的模型都是错的,而他们只对其中有用的感兴趣,而概率多少决定了什么是有用的。举个抛硬币的例子,贝叶斯学派并不认为正面或反面的概率是二分之一,他们从之前抛硬币的先验概率再结合之后抛硬币的证据来决定最终的后验概率。而结果显然不是世界的真相,但却有用。
- 类推学派(通过对相似性外推进行学习),主算法是支持向量机:
——学习的关键就是在不同场景中认识到相似性,然后推导出其他相似性。人们处理事情总是会从过去的、相似的场景中学习和类推,即吸取经验,而类推学派的核心在此。最近邻算法、支持向量机和类比推理法是该学派的算法。比如要定义一张脸,该学派的方法是找出数据库中与之最接近的一张脸,这样就可以下判断了。而现在所有的网络推荐都在用该方法,如果想确认某用户是否会喜欢某部影片,算法会找到以往与这个人评分最相关的用户,如果他们对该影片评价很高,那么系统会推荐给该用户(当然它需要加权赋值)。作者甚至认为人类的创造性也不过是类比和重组罢了,即所有智能行为都可以归结为类比,因此计算机算法可能打败人类。————————————————————
在终极算法之前的强化学习:
宇宙最大的奥秘不是它如何开始和灭亡,而是有效孩子如何自我学习(显然孩子的所有知识并不都是父母传授的)。因此许多机器学习学者认为创造智能机器的方法是让它们像人类婴儿那样去体验世界,最主要的是在无人监督的情况下自我学习。如何自我学习?
- 对事物进行聚类,处理成若干集群(这最好用到贝叶斯算法,通过概率来分类),并随着新事物的加入不断更新集群。
- 将众多维数约减为可管理的信息(这就是你在整理书籍时所做的),也即概括、维度简化。
- 此外还有关联学习,类似于神经元的布线连接。
- 但最重要的是:与环境互动,主动探索,这就是强化学习。
强化学习是通过奖励机制进行的,它不会直接进行计算,而是评价每一步的价值。它的首要思想是:并不是所有状态都有奖励,但每种状态都有价值,唯独最后的位置才有奖励,通过每种有价值的状态可以得到最后的奖励。强化学习的目的是将奖励最大化,你一旦知道每种状态的价值,就知道在每种状态中该做什么。但这也决定了强化学习的机器人一开始不会做什么事情,因为它必须在采取行动后更新对于状态价值的判断,也即“强化”,随着事情的发展它才会越来越完美无缺。它本质上是一种加速进化过程——尝试、丢弃、改进——但因为计算机速度很快,因此它实际上的效率很高。重要的是,它的一切是为了最后的奖励。————————————————————
建立在机器学习之上的世界狂想曲:
其实到这里这本书才真正有趣起来(不妨也可以认为是前面糟糕的翻译毁了阅读体验),作者遐想了当机器学习甚至终极算法完成之后,人类社会会发生怎样的变化,可以看作是一些《黑镜》一般的点子:
- 数码镜子:和你自己一模一样的数码模型
每个人都会有自己的详细模型——可以称之外数码的另一半——你通过这个模型(程序)来和其他人的程序进行交流、交易,甚至无需你自己亲自动嘴动手,这个模型就帮你完成了,因为毕竟它和你一模一样,如果它能帮你做这些事,你自己为什么要做呢?更何况可能它甚至比你自己更了解你。你的数码模型甚至会继续从经历中学习,代表你继续和世界进行互动以增强技能——也是为了方便你自己。它可以拥有一个世界模型,别人的数码模型也会加入进来,最终形成一个与真实世界对应的虚拟平行世界。它会产生意识吗?但我更关心的是,它会取代你吗?
- 数据经纪人:妥善分享你的隐私
现在所有大公司,或者说有前瞻的公司都在搜集你的个人数据,这就像是一个疯狂的竞赛,而你应该为你的隐私被随意搜集而愤怒吗?或许不应该如此,因为这其中有好处也有坏处。坏处是这种手段天生让你感到不愉快,但好处是更大的,每个人分享的隐私会解决很多问题:比如治愈疾病,分享肿瘤的基因组和治疗史会有助于治愈病人,所以你应该考虑是否在道德上有义务进行隐私分享。因此在未来甚至会出现一个特殊的职业:数据经纪人,他们既保证你的数据不会被滥用,也同时保证被分享的数据会用在好事上。
- 人工智能会取代人类,但人类可以做其他的事
白领可能会比蓝领更容易取代,这点我在未来世界,人类会幸存吗?中已经解释了:机器更擅长在信息世界中工作,而不是在真实世界中。未来不是人类与机器对抗,而是由机器的人和没机器的人之间的对抗。未来唯一的科学家可能就是计算机科学家。我们会看到失业率增长,无法自动化的行业越来越少。而人类能做什么呢?或许人类会寻找新的意义(工作之外),比如灵修之类,毕竟谋生的需求已经远去了。当然这只是作者的美好愿景,我认为这有些太理想化了。
- 战争只是机器人之间的“残杀”
用机器人来进行战争不仅可以减轻痛苦,还甚至可以不会让人受伤和死亡。
- 天网会诞生吗?
作者用幽默回答这个问题:人们担心计算机会变得的过于智能而统治世界,但真正的问题是,它们也很愚蠢但已经统治世界。
- 进化!人类童年的消逝?
人工智能或许可以设计出比它们更加智能的机器,而人类智能会被远远甩在后面。但我们人类或许也不会被彻底淘汰,可能会与自己的创造物一起进展、共同进化,这种超人类主义的“技术人”会进化成无数不同的智能物种,每种物种都有其生态位,这是一个与当今完全不一样的生物圈,正如当今的生物圈与原始海洋存在差异一样。哈哈,虽然我认为这也是个美好的愿景。