学习就是通过对世界的认知和反馈来认知自己和改变自己
这篇书评可能有关键情节透露
这是一本强烈推荐且值得反复阅读和实践的书籍。本书的英文名是《HOW WE LEARN》比中文名《精准学习》更能表明本书的内容广泛的探讨了人脑最伟大的才能———学习能力的底层原理和核心机制,包括局限性以及最新的科学实践和对我们的启示:学会如何学习。“当代认知科学通过系统地剖析我们的脑算法和机制,赋予苏格拉底的名言‘认识你自己’以新的含义。今天,学习的重点不再仅仅是加强内省,而是理解产生思想的微妙的神经元机制,使之能最佳地服务于我们的需求、目标和欲望。(P009)”。本书之所以用了精准学习这么目标明确的书名,我猜测是因为类似如何学习或我们如何学习的书名已经太多了。作者斯坦尼斯拉斯·迪昂(Stanislas Dehaene),是全世界具影响力的认知神经科学家之一,欧洲脑科学研究领域的领头人,世界脑科学领域大师级的人物,2014年,他与其他两位科学家共同获得有“神经科学界诺贝尔奖”之称的 The Brain Prize,Google Scholar上的h-index高达187[0]。这篇读后感有四部分组成,一是读书感想,即是我的读书时的理解、共鸣和联想,也是我为什么强烈推荐这本书的根本原因;二是本书内容,用摘抄的方式配上页码如实的表达本书的核心内容,页码是用()+P+阿拉伯数字组成;三是读书行动,写读后感是一种向好书致敬的方式,同时能够延伸很多其他行动;四是参考资料,写读后感中一些参考材料,用[]+阿拉伯数字编码对应。
一:读书感想
1、大脑学习和机器学习相互成就
- 本书的副标题是“为什么目前大脑的学习能力比任何机器都要好(Why Brains Learn Better Than Any Machine … for Now)”,书中定义了“学习是在脑中形成外部世界的内部模型(P018)”,这是从认知科学和人工智能的角度来表达,书中大量大脑学习和机器学习的对比,这是非常科学有效的深入理解大脑和学习机制的方式。
- 《大脑传》[1]中介绍了人类历史两种研究大脑的策略:第一种是“1665年丹麦解剖学家尼古拉斯·斯丹诺在他的演讲中大胆指出,在探索脑的奥秘时,要把脑一部分一部分地拆解下来,看一看每一部分各自能做什么,合在一起能做什么”,最终给我们带来了对脑的物理结构的认知,以及确定脑而非心是人类思想中心;第二种是“1936年托马斯·罗斯总结自己的研究策略:要想相对肯定地理解一种机制,一个方法是模仿并复制这种机制”,那时正处于1930~1950年计算机和人脑研究的黄金时期,冯·诺伊曼、图灵、香农、维纳、麦卡洛克、皮茨等通过一些会议和文章等探讨神经系统和计算机关系等,脑不是一种计算机,但脑可以被看着一个计算器官,这是冯·诺伊曼计算机架构和必读书《计算机与人脑》[2]的时期,也是图灵测试和1956年提出人工智能的特茅斯会议的时期。
- 本书英文版是2020.1出版,而chatGPT是2022.12发布,读本书时的很多疑问都是通过问chatGPT来解惑,虽然机器学习和大模型最近几年有了显著的进展,但本书的绝大部分观点依旧适用,在多个关键方面,人脑的学习能力仍然超过机器,他们虽然都是通过经验学习和模式识别来构建内部模型,但人脑学习的优势是创造性和解决问题能力、情感和社会学习,机器学习的优势是大数据、速度和效率。两者的对比学习既能加深对客观的认知,也同时这些相同和不同都在促进彼此的进步,这是一个非常科学的学习方式。
- 对比人脑和AI大模型:
- 基因遗传≈≈模型选择和预训练,
- 感觉输入≈≈数据预处理和特征识别,
- 出生后无差别学习≈≈持续预训练(CPT),
- 直觉反应≈≈无监督学习,
- 学校学习和教育≈≈有监督的微调(SFT),
- 社会规则≈≈强化学习(RL),
- 睡眠和做梦≈≈持续训练(CT)和模型生成,
- 自我反省≈≈元学习,
- 记忆整合≈≈迁移学习……
2、先天和后天都是大自然的规律
- 以前我对后天努力的价值和意义是非常肯定的,但是否有天性或先天是无知的或模糊的,一直到读《埃隆·马斯克传》[3]时突然意识到为什么马斯克敢于冒险,能够在风险的边缘试探,这是有家族的遗传基因的天赋,单纯靠后天努力是难以做到极致的,是后天极大努力最大化激活和优化了先天的天赋创造了一个人的卓越才能。所以理解先天顺应先天,通过后天学习激活自己先天,通过后天学习为下一代创造更好的先天,这也是大自然的规律,因为学习就是人类进化出来的天性,充分利用学习这一天赋能激活和优化先天的所有天赋。
- 每一种动物都必须迅速适应其当前生存环境的不可预测情况。这就是自然选择(Natural Selection),达尔文的进化算法。它成功论述了每个有机体为何能够适应其所在的生态环境,但这个过程发生的速度出奇的慢。如果缺乏适当的适应性,整个生态的物种都注定会死亡,只有等到有利的基因突变出现才能增加物种生存的机会。然后,学习能够加快这个过程,它可以在几分钟之内改变物种的行为,这就是学习的精髓:能够快速地适应不可预测的情况。(P006)
- 这就是物种进化出学习能力的原因。随着时间的推移,那些即使只拥有基本学习能力的动物都比那些行为固定的动物拥有更好的生存机会,而且它们更可能将自己的基因组(这些基因组包括学习算法)传递给下一代。因此,自然选择驱使学习能力的出现。进化算法发现了一个很好的诀窍:让身体的某些参数迅速改变,以适应环境中最不稳定的方面。(P007)
- 自然选择实际上是一种学习算法,一个令人难以置信的强大程序,它已经运行了数亿年,置入了数十亿台学习机器(即曾经存在过的每一种生物)。我们是这个深不可测的智慧的继承者。通过进化的实验和失败,我们的基因组已经将我们之前几代人的知识内化。这种与人俱来的知识与我们在有生之年学到的具体事实是不同的,它更抽象,因为它使我们的神经网络偏向于尊重基本的自然规律。(P038)
- 人类物种天生具备的知识(贝叶斯派学者称之为先验,通过进化继承的一系列可能假设),以及我们个人掌握的知识(后验:基于生命中积累的所有推理,修正后的先验假设)。这个观点终止了关于“先天与后天”的经典争论。脑的结构为我们同时提供了用力的始发工具和同样强大的学习机能。所有知识都必须基于两个部件:一是我们与环境互动前就存在的一组先验假设;二是一旦我们经历过真实数据,就能够根据后验可能性来区分这些先验假设的能力。(P060)
- 支持资质先天论和支持后天论的两方都是正确的:孩子的脑既有遗传所带来的固有结构,又具有可塑性。刚出生时,所有的孩子都装备了一整套由基因塑造的特殊回路,这些回路本身是由物种数千万年的进化所形成的。这种自组织性使婴儿额脑对几个主要的知识领域有着深刻的直觉:控制物体及其运动的物理感觉;空间导航的技巧;对数量、概率和数学的直觉;对他人天生的热爱;甚至语言天赋。因此,白板假说使大错特错的。但进化也的确为许多学习机会敞开了大门,不是所有的事情都是由孩子出生时的脑决定的。事实恰恰相反:神经回路在几毫米的变化范围内,在很大程度上时对外界保持开放的。(P148)
- 我们的脑也是由各种各样的假设塑造的。婴儿出生时,脑已经井然有序,而且储备了渊博的知识。他们隐约地知道,物体只有在被推动时才会移动、固体之间不会相互穿透,他们还知道世界上有许多陌生的实体,如会说话和移动的人。这些知识不需要学习,因为它们在人类的任何地方都是如此,我们的基因组将它们作为固定回路置入脑,从而规范和加快了学习。婴儿不必学习世界的一切,因为他们的脑中充满了先天的规范,只有无法预测的具体参数(如脸型、虹膜颜色、语调和个人品味)才有待后天习得。(P037)
3、只要你愿意,你可以学会任何你想学的东西,这就是顺应自然
- 学习是通过后天的努力激活和升级先天的知识、心理模型和身体参数,这既是进化带给每个人的第一天性,也是所有人终身有效的大自然规律,还是人类文明建立和沉淀的动力。所以正确的理解和学习是顺应自然,其结果不仅仅带来认知上的进步和智慧的增长,更会带来更健康的大脑和身体。
- 因为我们都拥有相同的初始脑结构,相同的核心知识和同样的学习算法是我们获得更多的潜能,我们常常最终共享相同的概念。每个人都有相同潜能——无论是阅读、科学还是数学,无论我们是盲人还是聋哑人。简而言之,个体差异是真实存在的,但这些差异是程度上的而不是类别上的。(P089)
- Open AI CEO Sam Altman在其博文《提高工作效率的秘诀》[4]中说:学习你可以学习任何你想要的东西,你可以快速变得更好是很重要的。这在最初的几次感觉像是一个不太可能的奇迹,但最终你学会了信任你可以做到。
- 美国心理学家卡罗尔·德韦克(Carol Dweck)经过大量的研究提出,“固定型思维”(fixed mindset)是将一个人的失败(或成功)归因于一个人的人格中固定的、不可改变的方面,比如“我数学不好”“外语不是我的强项”等等,“成长型思维”(growth mindset)是所有人都有能力取得进步。她的研究成果表明,在所有其他因素相同的情况下,思维在学习中起着重要作用。坚信任何人都可以进步,这本身就是进步的源泉。(P218)
- 匈牙利心理学家盖尔盖伊·西布拉(Gergely Csibra)与捷尔吉·盖尔盖伊认为,教导他人和向他人学习是人类物种进化出来的最基本的适应功能。人类是一种拥有“自然教学法”脑回路的社会性动物,一旦我们注意到别人试图教给我们的东西,这一大脑回路就会被触发。全人类的成功至少可以部分地归功于我们进化出的与他人共同关注的能力。我们学到的大部分知识都来自他人,而非我们自己的亲身经历,因此人类社会的集体文化才能远超任何个体单独所能做到的上限。这就是心理学家迈克尔·托马塞洛(Michael Tomasello)所说的“文化棘轮”效应,就像棘轮可以防止电梯下降一样,社交共享也可以防止人类文化的倒退。每当有人有新的发现,这一有用的发现会迅速传遍整个群体。(P176)
4、看不懂、不想学和学不会是大脑在呼唤更正确的学习方式
- 未知大于已知,世界的知识是复杂且稀疏的,学习和搜索是最通用的方法,搜索是对未知的敬畏和探索,学习是对已知的理解和内化,两者的结合是认知的扩展。 强化学习之父Rich Sutton在《苦涩的教训》[6]中说:“从这一痛苦的教训中应该学到的第一点就是通用方法的巨大力量,即使算力已经非常强大,只要算力增加,方法还能持续扩展。有两种方法似乎可以因此而无拘束地扩展,它们就是搜索和学习。”
- 学习新运动是最佳的健康用脑方式,《 斯坦福抗疲劳法》[5]中说:“大脑(中枢神经)是为了让身体运动而形成的,这种构造从原始时代至今并没有发生太大的变化。” 也就是说人类原本的姿态就是不停地运动,这是人类自然进化选择的结果,运动比不动更利于人类从身体到大脑的整体运作,即使是受伤状态,尽可能的运动也会更快的康复。今天大量的抑郁和焦虑等心理问题很大程度上就是因为当人们不在为食物奔跑时,大脑需要释放天性的运动来反馈和促进健康,学习新运动既激活了大脑的天性,锻炼了身体和脑的链接,又增强了大脑心理模型和参数的更新,一举多得。可惜本书对运动和大脑之间的关系表达的很少,期待作者未来有这方面的新作。
- “注意的过程包括抑制不想要的信息,而一旦这样做,我们的脑就会有看不见已经选择不加注意的东西的风险。”(P161)所以生活中我们真的会视而不见,很多事情我们自己注意不到,我们自己注意到,别人也很大可能注意不到,不要误以为自己注意到的,别人也注意到了,不要高估自己和他人感知到的东西,甚至以为自己看到所有而完全不相信别人的不同感知。重要的事情要结构性的保持注意、主动预测和关注错误反馈,比如学习时要增加困难,比如集体注意事项很容易被个人忽略,比如魔术师的表演技巧,比如开车时不要看手机!
- “当放手让孩子自己去发现时,他们其实很难发现某个知识领域的主要抽象规则,因此他们几乎学不到什么。我们该对此感到震惊吗?我们怎么能认为孩子能在没有外力引导的情况下,在短短几个小时内就重新发现人类花了几个世纪才理解的规则?无论如何,发现教学法在所有领域都失败了。”(P188)“正确的注意是学习成功的秘缺。”(P166)“先学会的规则会阻碍后一个规则的学习。”(P210)这就是为什么我们在学习中需要有优秀的老师和教材去有结构性有组织地学习而不是自己随意的探索,对于成年人而言学习一个新领域知识新运动方式等最需要的是像小时侯一样乖乖听老师的话,认真听认真练,不要按照自己已有的惯性去自以为是,这也是成年人的控制力和主动性。
- 人类学习就是通过正确面对错误去减少错误
- 两位美国研究者罗伯特·雷斯科拉(Robert Rescorla)和艾伦·瓦格纳(Allan Wagner)提出了下列假设:人脑只有在感知到它所预测的和实际所接收到的信息之间有差距时才会去学。没有感知到错误的话,学习是不可能发生的:“有机体只有在事件违反了他们的预期时才会去学习。”(P208)
- 脑中充斥着错误信息,越高级的大脑区域处理越难错误。“在某个脑区无法解释的输入信息都会传递到下一个更高级的脑区尝试理解。我们可以把大脑皮层想象成一个庞大的多层预测系统,每个系统都试图解释输入信息,并且与其他系统交换剩余的错误信息,以期能做得更好。”(P213)
- “如果以为对学习而言最重要的是犯很多错误,那就错了,就像沙多克斯一家仓促地使用999999次火箭发生实验失败一样。最重要的是得到明确的反馈,减少学习者的不确定性。”(P211)所以试错本身,需要要把验证的事情本身想好,而非乱试,目前是得到明确的反馈,而不是错误的多少
- “成年人成功地从奖励和惩罚中提取了等量的信息,但是学生却没有:他们从成功中学的东西远比从失败中学到的要多得多。因此,让我们为他们免去这种痛苦,尽可能给他们中性的丰富的反馈信息。请不要把错误的反馈与惩罚相混淆。”(P216)对孩子表扬是建立正确的事情上,而不是随意的,错误要淡化批评,去通过准确反馈帮助其做对,再表扬,孩子对错误反馈更多是因为错误往往更模糊,孩子还在无差别学习,错误的效率没有正确的高。成年人则需要树立高标准[7],在高标准之上应该是鼓励积极的错误,通过结构性的反馈加速成功的到来,激发创造力,就像SpaceX目前的星舰发射一样,而没有到达高标准的则需要通过奖惩来满足标准,实现执行力。
- 美国心理学家亨利·罗迪格(Henry Roediger)曾说:“把学习条件弄得再困难些,迫使学生投入更多认知努力时,常常能加强记忆效果。”(P186)这里面的增加学习难度是指在学习中可以采取更有效的科学策略:间隔重复、交错学习、测试效应、深度加工、变化练习环境。这方面学习第二语言的app多邻国(duolingo)做的非常出色,使用越多你就越能感觉到它对大脑学习方式的理解深度,并变成具体的学习行动,非常值得有兴趣的人试试。
5、孩子是刚出道的小小科学家,教育是我们的脑的主要加速器,家庭教育的最好方式是父母成为学习的榜样
- “孩子是刚出道的科学家”这个比喻最早可以追溯到发展心理学家让·皮亚杰(Jean Piaget)的理论,他提出孩子在成长过程中通过探索和实验来理解周围的世界,就像一个小小的科学家一样。这个观点强调了儿童主动学习和探索环境的能力,以及他们在这个过程中如何形成关于世界的假设、进行试验和修正这些假设的方式。“请记住,当你因为宝宝第10次从桌子上丢下汤勺而感到绝望时,他们只是在做实验!像任何科学家一样,婴儿需要完整的系列实验来排除所有的错误理论。”(P066)
- “尽早入学接受教育可以改变人生!”(P149)首先,人是最先进的系统,最先进的系统需要和最先进的系统互动是最快的学习方式,学校有同龄同学,充满了竞争和协作,能够比家庭有更真实的错误反馈,其次,学校能够持续给孩子创造更科学的学习知识和方法。对于婴儿,书中提及的支持蒙台梭利教学法的学校是很好的选择。
- 父母需要终身学习,让孩子感受到父母听老师话通过科学学习面对错误持续练习改变自己,这绝对是最好家庭教育,也是孩子给父母的最好礼物。比如,过去几年我学习普拉提、跑步和自由搏击,上课时都尽可能带着孩子一起,这是亲子时间,更重要的是创造了学习氛围,让他们理解什么是学习。
- 父母需要向孩子学习。孩子展现了人类天性,很多天性因为后天的环境和习惯反而被抑制了,比如好奇心、不懂就问为什么、关注眼神,本书里面有大量天性的介绍,通过理解孩子的天性,不仅能更好的通过后天引导去激发孩子天性,更重要的是父母可以同样的方式来康复和激发自己的天性,这更是孩子给父母更好的礼物。这些天性不仅仅体现在大脑上,也体现在身体健康上,比如DNS(动态神经肌肉稳定技术)[8]是布拉格学派传人Pavel Kolar全新开创的临床康复疗法,DNS评估即用成人的姿势和动作对比婴儿出生第一年各个阶段的姿势和动作,DNS治疗即在不同姿势和位置下对成人进行引导和训练,通过训练大脑,让身体掌握更好的姿势稳定方式、呼吸方式以及运动方式。
- 父母需要和孩子真诚且真实的互动,追求最大真实性。Elon Musk的最近访谈说“追求最大真实性的人工智能极其关键,AI不应被教导说谎”[9],教育孩子的高质量数据最重要的一条就是真实性。孩子虽然有天性,但孩子对当前环境的无知,没有天生对错概念,最重要的一种方式就是父母反馈来强化是否重要,这就是为什么父母对脏话越紧张,孩子反而会说的越多,因为他感受到父母的强烈反馈从而认为重要,所以父母的最好反馈方式是点赞正确的行为忽视错误的行为。父母的反馈如此重要,所以父母的反馈质量是重中之重,其中一个重要标准就是真实性。作为人类道德引导,很少父母主动教孩子说谎,当为了追求效率减少麻烦或者掩盖父母无知导致类似谎言的反馈是不少的,比如父母要出去玩为了不让孩子一起会说成上班,比如当不能回答孩子为什么时不是去查资料或者告知孩子不知道而是编造一个答案等等,虽然看起来都是小事情,但孩子都是基于这些反馈来建立对世界的认知的,这就是原生家庭的巨大影响力。真诚和真实的和孩子的互动,说起来很容易,做起来很难,但这个不仅仅是帮助孩子更健康的成长和学习,这更是父母自我成长的巨大契机。YC的创始人Paul Graham在《如何取得杰出成就》[10]中说:“真诚的核心是诚实。我们从小就被教导要诚实,作为一种无私的美德 —— 作为一种牺牲。但事实上,它是一种力量的来源,要看到新的想法,我们需要对真相异常敏锐。假设我们正在试图看到比其他人到目前为止看到的更多的真相,如果我们在智力上不诚实,又怎么能对真相有敏锐的眼光呢?保持智力诚实(Intellectual Honesty)的一种方法是保持轻微的正压。愿意积极承认自己的错误 —— 一旦我们承认自己在某件事上犯了错误,就自由了 —— 在这之前,我们必须承担它。”
二:本书内容
导言、为什么要学习
每一种动物都必须迅速适应其当前生存环境的不可预测情况。这就是自然选择(Natural Selection),达尔文的进化算法。它成功论述了每个有机体为何能够适应其所在的生态环境,但这个过程发生的速度出奇的慢。如果缺乏适当的适应性,整个生态的物种都注定会死亡,只有等到有利的基因突变出现才能增加物种生存的机会。然后,学习能够加快这个过程,它可以在几分钟之内改变物种的行为,这就是学习的精髓:能够快速地适应不可预测的情况。(P006)
这就是物种进化出学习能力的原因。随着时间的推移,那些即使只拥有基本学习能力的动物都比那些行为固定的动物拥有更好的生存机会,而且它们更可能将自己的基因组(这些基因组包括学习算法)传递给下一代。因此,自然选择驱使学习能力的出现。进化算法发现了一个很好的诀窍:让身体的某些参数迅速改变,以适应环境中最不稳定的方面。(P007)
第一部分、什么是学习
在认知科学中,学习是脑中逐步形成外部世界的内部模型。通过学习,那些触动我们感官的原始数据被转换成经过深思熟虑之后产生的想法,抽象到足以在新的场景下被重复使用,成为描绘现实的微缩模型。(P018)
第1章:学习的七个定义
脑中已经存储了数以千计的外部世界的内部模型。它们就像微缩模型,或多或少地忠于它们所代表的现实。打个比方,我们所有人的脑中都有一张关于自己家和附近街区的思维地图。我们要做的就是闭上眼睛,调动思维来回想它们。当然,没有人生来就拥有这种思维地图,我们必须通过学习来获得它。这类心理模型非常丰富,而且绝大多数是在无意识中生成的,超出了我们的现象。(P019)
我们梦境中出现的所有想法,无论它们多么复杂,都只是我们内在心理模型随意呈现的产物。我们醒着的时候也在做真实世界的梦,脑不断地向外界投射假设和解释构成的框架。正是脑的投射赋予来自我们感官的数据流以意义。假如没有内部模型,原始的感官输入是没有任何意义的。学习使我们的脑能够抓住之前被遗漏的现实片段,并利用它来构建新的世界模型。学习的内核就在于它适应外部世界和纠正错误的能力。接下来讲述7个关键的观点,它们是当今机器学习算法的核心。这些观点同样适用于我们脑的学习,是对“学习”的7个不同定义。(P020)
1、学习就是调整心理模型的参数
- 学习是在无数可能的内部模型中寻找最符合外部世界状态的可能性。(P021)
- 学习就是根据外部反馈调整脑心理模型的参数。(P022)
2、学习是在利用组合爆炸
- 所谓的“组合爆炸”(combinatiorial explosion),当你将极少数的可能性参数组合在一起时,参数的数量就会呈现指数级的增长。(P024)
- 人脑通过创建一个多层分级的模型来分解学习问题。(P025)
3、学习就是将错误降到最低
- 被我们称为“人工神经网络”的计算机算法,其灵感源自大脑皮层级性组织。它有着和大脑皮层一样的金字塔般的连续层级结构,每一层都具有比前一层更深层次的规律。这些连续的层级以越来越深的方式处理输入的数据,因此它们也被称为“深度网络”。每一层级本身只能侦察外部世界的极其微小的一部分,……然而,当你将各个层级组合在一起时,你就会得到一个非常强大的学习工具,它能够侦查复杂的结构并通过调节自己以处理各种不同的问题。……而距离感官输入越远的层级,其洞察力就越强,识别抽象本质的能力也就越强。(P025)
- 现代人工智能运行模式:先观察到自己的错误,然后用错误矫正内在模式,使之朝着它们认为错误减少的方向发展。……在机器学习术语中,这种情况被称为“监督学习”(人被看作机器的监督者,知道机器必须给出的正确答案)和“误差反向传播”(错误信号会被发回人工神经网络得以修改其参数)。(P027)
4、学习就是探索各种可能性
- 纠错过程的问题之一是,它可能会卡在一组不是最优的参数上。……(目标是全局最优解),梯度下降算法有时候会卡在一个它无法退出的点上,这被称为“局部最小解”,它是参数空间的一口井,是学习算法被困住后无法逃脱的陷阱,此时,学习陷入停滞,因为所有的改变似乎都适得其反,每一次的改变都会增加错误率。这个系统觉得它已经学到了所有它能学到的东西,以至于仍然存在的更好的设置视而不见,哪怕这些设置的参数空间中近在咫尺。梯度下降算法无法“看到”它们,因为它拒绝上坡,不愿意越过眼前的上到达另一个下坡。由于“目光短浅”,它只在距离起点一小段距离的地方探险,因此错过了更遥远但更好的参数配置。(P029)
- 计算机科学家进场面临这一困难,它们会使用一整套的算法解决它。这些算法中大多数都是在寻找最佳参数的过程中引入一点随机性(randomness)。(P030)
- 随机的探索、随机产生的好奇心和频繁的神经元放电都在智人的学习中扮演着重要的角色。……孩子玩耍时就是在用大量的随机性在探索各种的可能性,那时他们已经进入了学习模式了。而在晚上睡觉时,他们的脑会继续胡思乱想,直到突然相处一个最能解释他们白天经历的说法。(P030)
5、学习是一种优化的奖励函数
- 人工神经网络只能通过计算其响应和正确答案之间的偏差来进行自我纠正,这个过程被称为“监督学习”(supervised learning)。……但应该注意的是,这种提前知道正确答案的情况相当罕见。当幼儿学习走路时,没有人确切告诉他们应该收缩哪块肌肉,他们收到的自由一次又一次的鼓励,直到不再跌倒。幼儿的学习完全是基于对结果的评估……人工智能面临同样的“无监督学习”(unsupervised learning)问题。……科学家们发明了“强化学习”(reinforcement learning)来应对这一挑战。我们不向系统提供任何关于它必须做什么的细节(也没有人知道做什么),只是提供“奖励”,即一种量化分数形式的评估。但更糟糕的是,机器可能会在延迟很长一段时间后才收到分数,远远滞后于它做决定的那一刻。……计算机科学家发现的技巧是给机器编程,让它同时作两件事:行动和自我评估。自我评估被称为“评论者”,它的目标是尽可能准确地评估游戏的状态,以便预测最终的奖励。……评论者可以让系统时时刻刻评估自己的行动,而不仅仅是在结束的时候得知结论。“行动者”的目标是使用这个评估来纠正自己。……行动者与评论者的结合是当代人工智能最有效的策略之一。
- 通过让两个人工神经网络合作或者竞争来提高学习速度的方法使人工智能获得了长足的进步。最新的一个想法被称为“对抗性学习”(adversarial learning),……我们的两个脑半球和众多的皮层下基底神经核也聚集了一大批“专家”,它们相互斗争、协调和评估。……将脑视为一群协作和竞争的专家集合并无不妥。(P034)
6、学习限定了搜索空间
- 当代人工智能仍然面临着一个重大问题,那就是内部模型的参数越多,系统就越难找到最佳的调整方法。而在目前的人工神经网络中,搜索空间是巨大的。因此,计算机科学家不得不处理大规模的组合爆炸:在每个层级都有数以百万计的选择,而它们的组合如此之多,系统不可能探索所有的选择。因此,学习有时会非常缓慢,需要在这片广阔的可能性地图上进行数十亿次尝试才能将系统推向正确的方向。在巨大的空间中,无论数据有多少,都会变得稀缺。这个问题被称为“维度诅咒”(curse of dimensionality),当你有数百万个潜在的杠杆需要撬动时,学习就会变得非常困难。(P035)
- 神经网络拥有的大量参数往往还会导致另外一个问题,这就是所谓的“过度拟合”(overfitting)或“过度学习”:系统拥有如此多的自由度,以至于它发现记住每个例子的所有细节比找出一个更普遍的规律来解释这些细节更容易。(P035)
- 简化模型是既能加速学习又能提高泛化能力的最有效的干预措施之一。只要需要调整的参数数量减少,就可以迫使系统寻找更普遍的解决方案。(P036)
7、学习是投射先验假设
- 纯粹的、没有任何先天限制的情况下的学习是根本不存在的。任何学习的算法都或多或少包含着一些关于要学习的领域的先验假设。与其试图从头开始学习所有东西,不如依赖先验假设,这些假设清楚地描述了必须探索的领域的基础规律,并将这些规律集成到系统的体系结构中,这要高效得多。先验假设越多,学习速度就越快(当然,前提是这些假设是正确的),这是普遍真理。(P037)
- 先天和后天不必对立起来。婴儿的脑之所以知道人和无生命物体的区别,那是因为他已经学会了这一点。不是在出生的最初几天学会的,而是在数百万年的进化过程中学习的。自然选择实际上是一种学习算法,一个令人难以置信的强大程序,它已经运行了数亿年,置入了数十亿台学习机器(即曾经存在过的每一种生物)。我们是这个深不可测的智慧的继承者。通过进化的实验和失败,我们的基因组已经将我们之前几代人的知识内化。这种与人俱来的知识与我们在有生之年学到的具体事实是不同的,它更抽象,因为它使我们的神经网络偏向于尊重基本的自然规律。(P038)
- 在怀孕期间,我们的基因奠定了脑架构的基础,通过对探索的空间大小施加限制来指导和加速随后的学习。在计算机科学术语中,我们可以说基因预置了脑的“超参数”:指定层数、神经元类型、它们相互联结的一般形状,它们是否在视网膜上的任何一点复制等高水平变量。因为这些变量中许多都储存我们的基因组中,我们不再需要学习它们:我们的物种在进化中已将它们内化。(P038)
- 在人和机器中,学习总是从一组先验假设开始,这些假设被投射到输入数据上,系统从这些假设中选择最适合当前环境的假设。(P039)
第2章:为什么人脑的学习能力比目前的人工智能机器更强
1、人工智能缺少了什么?
找到人工智能的缺陷是个有趣的任务,因为这也是分辨人类独特的学习能力的方法。下面是一份简短的,可能还不完整的功能清单。这些功能甚至连婴儿都具备,而目前的大多数人工智能缺缺乏这些能力。
- 学习抽象概念。
- 深度学习算法的发明者之一约书亚·本吉奥(Yoshua Bengio)认为,深度学习实际上更倾向于学习数据中浅显的统计规则,而非高层次的抽象概念。(P042)
- 人类学习并不是图像识别过滤器的装置,而是对世界抽象模式的构建。(P042)……我们的脑则能将抽象化本领用于日常生活的方方面面。(P043)
- 高效的数据学习。
- 每个人都同意,当今的人工神经网络的学习速率缓慢,它们需要成千上万甚至上亿的数据来发展一个领域的直觉。(P043)
- 在学习领域,人脑的高效性仍然无与伦比。机器渴求数据,而人类可以高效地运用数据。人类的学习可以将最少的数据实现最大化运用。(P044)
- 社会学习。
- 人类是唯一会主动分享信息的物种。我们通过语言向其他人学习。这一本领是目前的人工神经网络无法企及的。(P044,注:说人类是唯一会主动分享信息的物种是不准确的。实际上,很多动物也具有信息分享的行为。例如,蜜蜂通过舞蹈来告诉同伴花蜜的位置,海豚和某些鸟类也通过声音交流来传递信息。人工神经网络在模拟某些类型的语言处理和信息学习方面已经取得了显著的进展。虽然这些系统还不能完全模拟人类的语言学习和使用的所有复杂性和灵活性,但在特定任务上,如语言翻译、语音识别等,它们已经表现出相当的能力。)
- 一次性测试学习。
- 一个极端例子是我们通过一次测试就能学会一项新东西。……当然,一些人工神经网络也能储存一些具体的片段。机器尚无法做到而人脑能轻而易举地做到极致的,是将新信息综合到已存在的只是系统里。(P044,注:表达不够准确。的确,人类有时可以通过很少的经验(甚至一次测试)学会新事物,这反映了人类大脑的高度灵活性和强大的抽象思维能力。然而,这并不是常规情况,复杂技能的掌握通常需要重复练习和时间积累。人工神经网络确实能在某种程度上“记忆”训练过程中的具体数据片段,特别是在使用如少次学习(few-shot learning)或一次学习(one-shot learning)的技术时。这些技术旨在使网络能够从很少的数据中快速学习。)
- 学习就是成功地将新知识纳入已有的知识网络的过程。(045)
- 系统性以及思想语言。
- 人脑能够在具体事例背后发现普遍规则,语法规则只是这独特天分的一个例子。不论是在数学、语言、科学领域,还是音乐领域,人脑都能从中提取抽象原则、系统规律,从而再运用到不同的情境中。(P045)
- 如今的人工神经网络无法表达“每个数字都有一个手续数字”这样简单的抽象定律。总结绝对真理不是它们所擅长的。系统性是在符号规则上进行总结的能力,而不是肤浅的同质化。它仍然困扰着现行人工神经网络的运算。具有讽刺意义的是,所谓的深度学习算法几乎无法进行任何深刻的思考。(P045)
- 组合。
- 令人惊讶的是,当下的人工神经网络尚未显示出这样的灵活性。它们习得的知识还局限于隐秘的、无法获取的联结中,从而很难将它重新运用于其他更复杂的任务中。将之前所学技能进行组合的能力,也就是重组技能并运用于解决新问题的能力。……在人脑中,学习几乎总是代表着使知识显性化,从而使之被再次使用、重组,并能向他人解释。(P047)
- 理性是思维的普遍工具……学习向推理靠拢,即尝试去掌握领域规则的逻辑推断。(P048)
2、学习是对领域语法的推理
- 人类的特征之一是不懈地搜寻抽象规则,从一个具体的情况及随后在新情况的测试观察中提取高级别的总结。尝试构建这样的抽象定理可谓非常有力的学习策略,因为大部分抽象定理恰恰就是适用于最多观察的规则。大规模加快学习的总结方法,就是找出能解释所有已知数据的合适定理或逻辑规则,而人脑深谙此道。(P048)
- 学习意味着尝试选择符合数据的最简单模型。(P051)
- “抽象之福”(blessing of abstraction),最抽象的规则最容易学。(P054 )
- 学习包括从一组众多的人脑思维语言数据中,选出最符合外部事物对应的那一个。我们很快就会看到,这是儿童所拥有的一个卓越模式。他们就像一个个刚出道的科学家,构建理论并将之与外部世界进行比较。这意味着儿童的思维表征比当下的人工神经网络要结构化得多。从出生起,儿童的脑中就已经具备了两个核心成分:能使制造出丰盈的抽象公式成为可能的所有机械装置(即思维语言的组合),以及根据数据的合理性明智选择出合适公式的能力。这就是脑的新版本:一个巨大的假设生产模型,制造层级式假设的规则和结构并实现大规模的结构化,同时又能逐渐限制自己以符合现实。(P055)
3、学习就是像科学家一样推理
- 脑是怎么选择最佳假设的?外部世界的模型应该基于怎样的标准来被接受或被拒绝?事实上,有一个理想策略来回答这些问题,即“脑像一个刚出道的科学家一样行事”这一假设。根据这个假设,学习就是像一个优秀统计学家一样在几个备选理论中选择正确率最高的一个,因为它是最能解释既有数据。(P056)
- 科学推理的原理是什么?当科学家构建一个理论时,他们不只是写下数学公式,还要作预测。一个理论的优势在于其原始预测的丰富性。随后对这些预测的确认或推翻决定了这个理论的有效或失败。重述哲学家卡尔·波谱(Karl Popper)的话:随着一些列推断与驳斥对一个理论的推进性完善,无知就会逐渐衰落。(P056)
- 科学缓慢的进展与我们的学习相似。随着我们的脑通过观察越发准确地构建关于外部世界的理论,每个人思想里的无知会逐渐消失。“孩子是刚出道的科学家”难道不是一个模糊的比方吗?不,它实际上是一个关于人脑如何运作的精准表述。而且,在过去30年间,“刚出道的科学家”这一个假设引领了一些列关于儿童如何推理和学习的重大发现。(P056)
- 数学家及计算机科学家很早以前就已经从理论上说明了在不确定性面前推理的最佳方式。这一精准理论被称为“贝叶斯”,是以其发明者托马斯·贝叶斯的名字命名的。……越来越多研究者开始意识到,只有抓根于概率理论的贝叶斯理论才能确保从每个数据点中提取信息的最大化。学习就是要从每一个观察中提取尽可能多的推断,即使这个推断是很不确定的。而这正是贝叶斯理论管用的原因。(P057)
- 推理的正确方法就是通过概率来推理,从而追溯每个观察结果最有可能发生的原因,无论观测结果多么微小。(P057)
- 《概率伦:科学的逻辑》(Probalility Theory:The Logic of Science)是统计学家杰恩斯(E.T.Jaynes)写的关于贝叶斯理论的一本非常好的著作。他在书中展示了所谓概率不过就是我们对不确定性的表达罢了。这个理论用精确的数学理论表述了当我们进行新的观察时,不确定性的演绎所必须遵从的规则。它是逻辑在概率和不确定性领域中的完美延伸。(P058)
- 成人的判断包括两个层级的观点:人类物种天生具备的知识(贝叶斯派学者称之为先验,通过进化继承的一系列可能假设),以及我们个人掌握的知识(后验:基于生命中积累的所有推理,修正后的先验假设)。这个观点终止了关于“先天与后天”的经典争论。脑的结构为我们同时提供了用力的始发工具和同样强大的学习机能。所有知识都必须基于两个部件:一是我们与环境互动前就存在的一组先验假设;二是一旦我们经历过真实数据,就能够根据后验可能性来区分这些先验假设的能力。(P060)
第二部分、人脑如何学习
如果机器具备这两种机制,学习就会非常高效:大量的假设空间、一组有多种设置可供选择的心理模型以及能根据外界接收到的数据来调整这些设置的精细算法。(P062)
人工神经网络用自己的方式做到了这一点,它把心理模型的表征委托给了数以百万计的可调联结。然而,这些系统在捕获快速、无意识识别的图像和语音时,还无法表征更抽象的假设,例如语法规则或数学运算逻辑。(P062)
人脑似乎在以不同的方式运作,即我们掌握的知识通过符号的组合不断增加。根据这个观点,我们刚出生时,脑中有大量潜在思想的可能组合。这种思想语言具有抽象假设和语法规则,早在学习之前就已经存在了。它产生了广泛的假设以得到检验。根据贝叶斯理论,检验这些假设时,我们的脑必须像一名科学家一样,收集统计数据,并且用这些数据来选出最适合的模型。
第3章:看不见的婴儿知识
外表具有欺骗性,尽管新生儿的脑还未成熟,但是它已经拥有了大量从悠久的进化历史中获得的知识。只是大部分知识都没有显现出来,因为它们无法从婴儿的原始行为中表现出来。认知科学家的大量创新和重大方法上的突破,为我们揭示了婴儿天生具有的各种能力,识别物体、数字、概率、面孔、语言……婴儿的先验知识范围非常广阔。
1、 物体感念
- 数百万年的进化似乎已经讲这项知识铭刻进我们的脑中了。早在几个月大时,婴儿就已经知道世界是由移动的连贯物体组成的,物体占据着空间,不会无缘无故地消失,也不会同时出现在两个不同的地方。某个意义上,婴儿的脑已经知道了这个物理定律:物体的移动轨迹在空间上和事件上都是连续的,不会突然跳跃或消失。(P064)
- 婴儿拥有大量关于外部世界的知识,但是他们一开始并不知道这一切。婴儿需要花几个月时间才能理解两个物体如何相互支撑。(P066)
- 请记住,当你因为宝宝第10次从桌子上丢下汤勺而感到绝望时,他们只是在做实验!像任何科学家一样,婴儿需要完整的系列实验来排除所有的错误理论,通常遵循以下的顺序:(1)物体在空中保持静止;(2)物体必须碰到别的物体才不会掉落;(3)物体必须在另一个物体上面才不会掉落。(4)物体体积的大部分必须在另个物体上面才不会掉落,以此类推。(P066)
2、数感
- 婴儿虽然不会数数,但他们从出生起就已经具备根据图像识别数量的直觉能力。(P067)
- 实验显示,计算是进化赋予人类以及其他许多物种的天生技能之一。(P068)
- 理解物体和数量的抽象概念时人类思想的根本,是我们生而就有的、带到这个世界的“核心知识”的一部分,正式这两种概念的组合促使我们形成了更加复杂的思想。(P068)
3、对概率的直觉
- 当前最流行的脑功能理论认为,人脑是一台会计算概率的计算机,能够操纵概率分布并运用它们来预测尚未发生的事件。(P069)
- 最近的一系列研究进一步表明,婴儿的脑生来具备进行复杂概率计算的所有机制。(P069)
- 生命伊始,我们的脑就被赋予了逻辑直觉。……婴儿在很大程度上可谓是刚出道的科学家,他们像优秀的统计学家一样推理,排除假设和最小可能性,并搜索各种现象背后的隐藏的原因。(P070)
- 婴儿的注视时长反映了其逻辑推理的投入程度。与成年人相同,婴儿的瞳孔会在他进行推理时放大。(P071)
4、关于动物和人的知识
- 婴儿看到动物自己移动并不会感到惊讶。实际上,对于他们来说,任务物体自行移动,甚至是三角形或正方形,都会被标记为“动物”。从那一刻起,一切都不一样了。这个婴儿知道,所有的生命体都不必依物理定律而动,它们的运动受自己的意图和信念支配。(P072)
- 婴儿不仅可以推断周围人的目标和意图,还可以推断他们的能力和偏好。(P072)
- P072 即使9个月大的婴儿也能分辨出故意伤害他人的人、不小心伤害他人的人、有意拒绝帮助他人的人以及没有机会帮助他人的人。。。。。一岁的孩子就能够判断出某个人是否正在努力教自己某件事。他可以分辨普通动作与以教授知识为目的的动作之间的区别。匈牙利心理学家捷尔吉·盖尔盖伊认为,一岁的孩子就已经具备了与生俱来的教学感知。(P073)
5、面孔感知
- 婴儿社交技能的最早体现之一就是对面孔的感知。对成人来说,最轻微的提示就足以触发其对面孔的感知:卡通脸、笑脸、面具……值得注意的是,这种对面孔的敏感在婴儿刚出生时就有了(P073)
- 许多研究者认为,这种被面孔吸引的现象在依恋的早期发展中起着直观重要的作用,尤其考虑到孤独症的最早症状就是避免眼神接触,这一点更加证实了以上假说。我们的眼睛容易被脸吸引,这一先天偏好会迫使我们学习如何识别它们。(P073)
6、语言本能
- 低龄儿童的社交技能不仅表现在视觉方面,也表现在听觉领域。口语对他们来说,就像面孔感知一样容易。正如史蒂芬·平克(Steven Pinker)在其畅销书《语言本能》中指出:“人类对语言具有明显的天赋,他们无法抑制自己学习和使用语言的能力,这种本能甚至超越了触碰到滚烫的物体表面时缩回手的本能。”我们不要误解这句话。显然,婴儿虽然不是生而就熟练掌握了词汇和语法,但他们拥有以最快的速度获得它们的能力。婴儿生而具有的并非语言本身,而是获得语言的能力。(P074)
- 生命第一年的语言环境影响了婴儿的这些早期天赋。婴儿迅速地注意到某些声音没有在他们的语言中使用,例如说英语的人从来不会发出法语中的元音u和eu,日语母语者无法分辨R和L的区别。在短短几个月的时间里(对元音来说是6个月,对辅音来说是12个月),婴儿的脑通过其原始假设对音素进行分类,并保留与他们生活环境中的语言相关的音素。(P075)
- 语言学家诺姆·乔姆斯基(Noam Chomsky)也许是对的,他推测,人类天生就具有一种“语言习得装置”,这种特殊装置在出生后的第一年被自动激活。正如达尔文在《人类起源》(The Descent of Man)中写的,语言“当然不是真正的本能,因为每种语言都必须被习得”,但是“获取语言的倾向是一种本能。”我们的天赋是学习任何一种语言的本能,这是一种不可抑制的本能,即使被剥夺了说话能力的人,也会在几代人之后自发发展出其他形式的语言。在聋人群体中,高度结构化的、具有普遍语言特征的手语从第二代酒开始出现了。(077)
第4章、脑的诞生
在精确的核磁共振成像技术出现后,我们才终于将人脑的早期组织可视化,与我们的预期一致,几乎所有成人的脑回路已经存在于新生婴儿的脑中。(P080)
1、婴儿的脑是组织有序的
- 在两个月大时,婴儿已经激活了与成年人相同的语音、词汇、句法和语义的层级结构。与成年人一致的还有,信号到达的皮层的层级越高,脑的响应就越慢,这些脑区就越多地在更高级整理信息。(P081)
- 当然,两个月大的婴儿还无法理解他们听到的句子,他们还没有发现单词和语法规则。即便如此,在他们的脑中,这些语言信息已经被传送到高度专业化的、类似于成人的脑回路中去了。婴儿之所以能快速学会说话和理解语意,可能是由于他们的左脑预先配备了一个专门探测语音各个方面(声音、单词、句子和篇章)的统计规律的回路。这是其他灵长类动物无法做到的。(P081)
2、语言通路
- 无须任何来自外界的干预,脑就会自动形成纵横交错的网络联结,其中几种是人类特有的。稍后我们会看到,学习可以进一步完善这个网络,但它的最初结构框架是先天的,在子宫内已形成。(P082)
3、皮层自组织
- 成人的皮层形态是基因组和早期生长环境的不断积累的记录。(P084)
- 胎儿的大脑皮层的褶皱是由于生化自组织过程而自发形成的,这个过程依赖于基因和细胞的化学环境,只需要极少的遗传信息,且完全不需要学习。(P084)
- 这个自组织的概念与经典理论完全不同。经典理论错误地将人脑视为一块白板,几乎不存在初始结构,而依赖于环境的塑造。与此观点相反,人脑发育出地图或数字链接基本上不需要数据。自组织也将人脑与目前统治人工智能领域的工程化人工神经网络区分开来。如今,人工智能实际上已成为大数据的代名词,因为这些网络非常需要数据,只能在获得千兆直接的数据后才能够变得智能化。但是,与它们不同,我们的脑不需要太多的经验。与之相反,脑的主要节点,即存储我们的核心知识模块,似乎在很大程度上是自发发展的,也许纯粹是通过内部模拟来发展的。(P088)
- 在出生之前,我们的核心脑回路就通过自组织形成,并利用系统内部生成的数据库进行自举。开始的基础工作大多数是从内部产生的,与外界世界没有任何互动;自由最终的调整是需要学习的,被从外界环境中接收的额外数据所塑造。(P088)
因为我们都拥有相同的初始脑结构,相同的核心知识和同样的学习算法是我们获得更多的潜能,我们常常最终共享相同的概念。每个人都有相同潜能——无论是阅读、科学还是数学,无论我们是盲人还是聋哑人。(P089)
简而言之,个体差异是真实存在的,但这些差异是程度上的而不是类别上的。仅在脑组织正太分布的极限情况下,神经生物上的变异才会最终导致真正的认知差异。(P089)
第5章、养育的作用
我持续强调了先天因素对脑回路的影响,即基因与自组织的交互作用。但是,后天养育也同等重要。脑的早期组织并不是永恒不变的,经验会改善机丰富它们。(P093)
1、突触的改变只发生在动物用来学习的回路中。(P098)
- 西班牙解剖学家圣地亚哥·拉蒙·卡哈尔的伟大发现让他获得了1906年的诺贝尔奖。他发现脑是由独特的神经细胞(神经元)组成,而非之前以为的网状组织。(P095)

- 神经元、突触以及它们所形成的微型回路是脑可塑性的材料硬件。每次我们学习时,它们都会进行调整。每个神经元都是一个独特细胞,带有它的“树”,被称为“树突”(左图上),用于从其他神经元处收集信息;每个神经元还有一个轴突(左图下),用于将信息发送到其他神经元。显微镜可以轻易分辨出树突棘,它呈蘑菇形,承载着突触,即两个神经元相连之处。当我们学习时,所有这些组成都会改变,包括突触的形状、数量和强度,树突棘的大小,树突和轴突分支的数量,甚至是包裹轴突并决定其传递速度的髓磷脂的层数。(P094)
- 诺贝尔奖得主、神经生物学家托马斯·苏德霍夫(Thomas Sudhof)的结论是:突触是神经系统的计算单元,是脑的微处理器。要知道,我们的脑包含了大约一千万亿个突触。它的复杂度是无与伦比的。(P095)
- 在人的一生中,我们的突触在不断改变,而这些改变反映出来的就是我们的学习。每个突触都是一个小型化工厂,这个工厂里的许多参数都会在学习过程中改变,包括囊泡的数量、大小,感受器的数量、效率,甚至突触自身的大小形态。所有这些参数共通影响着突触前终端被传递到突触后神经元的能力。它们还提供了存储我们学习到的有用信息的空间。(P096)
- 脑并不会记录我们生活中的所有事件。只有那些被认为最重要的事件才会被印刻到突触中。为了达到这个目的,突触的可塑性会被巨大的神经递质网络调控,比较重要的神经递质有乙酰胆碱、多巴胺以及血清素,它们会提示那些情境时重要且需要被记忆的。(P097)
- 每一点记忆的存储就是一场重建,记得就是尝试去回放过去经验发生时在同一个脑回路里产生的相同神经放电线路(P099)
2、营养是学习的核心要素,但突触可塑性有能力也有局限
- 神经元不是学习这场游戏中唯一的细胞“玩家”。随着学习的不断推进,细胞的整个环境也会发生变化,包括周围供给和治愈神经元的胶质细胞,甚至还为神经元提供氧气、葡萄糖及营养的血管和动脉网络。在这个阶段,整个神经回路及其支持结构都发生了改变。(P104)
- 我们学习时会发生大规模的生物变化:不仅神经元在引导书涂和轴突时会改变,周围的胶质细胞也会变化。所有这些转变都需要时间。每一次学习的经历都需要花上几天的时间来引发一系列生物变化。许多可塑性的专有基因必须要得以表达,才能让细胞制造出必要的蛋白质和细胞膜来铺设新的突触、树突、轴突。这个过程会吸收许多能量,一个小孩的脑最多会消耗50%的身体能量。葡萄糖、氧气、维生素、铁、碘、脂肪酸······大量多样的营养对脑的健康发布是必须的。脑不只靠心智的刺激来供给,在每秒内制造和消除几百万个突触,需要平衡的饮食、氧气和身体的运动。(P105)
- 对一个营养充足的脑来说,可塑性可以发展到什么程度?它能彻底改变脑吗?脑的结构会根据经验发生翻天覆地的变化吗?答案是:不会。可塑性是一个适应性变量,是学习的基础,但受到各种定义我们的基因的制约。它是固定基因组与独特经验的结合。(P107)
- 人脑会使用突触可塑性来进行自组织。首先,在没有任何环境信息输入的情况下,它会完全由内到外制造出活动规律,然后结合突触的可塑性来制造回路。在子宫中,脑、肌肉,甚至是视网膜在收到任何感觉输入以前,就已经展现出了自然活动(这也是胎儿会在子宫里面动的原因)。神经元是可以被激发的,它们可以自然放电,其动作电位会自行形成巨大电流穿过脑组织。即使在子宫里,神经元的随机动作电位形成的电流也会穿梭于胎儿的视网膜。虽然严格意义上说,它们不携带任何视觉信息,但在即将达到的皮层时,这些电流会协助形成皮层地图。因此,突触可塑性一开始在不需要与外界有任何互动的情况下便是活跃的。只有在第三个妊娠期,先天与后天的分界线才睡着发展完善的脑开始适应内外环境,并逐渐变得模糊。(P110)
- 即使在出生以后,与感觉输入无关的随机神经元放电形成的电流会继续穿梭于皮层。慢慢地,这个内源性活动在感觉器官的影响下发展起来。这个过程可以在贝叶斯理论框架中得到准确诠释。原始内源性活动代表了统计学家说称的先验假设:脑的期待,即在其与外界互动之前就有的进化假设。之后,这些假设逐渐适应环境信号,在出生几个月之后,自然神经活动便趋同于统计学家所说的后验假设:脑的概率分布变得越发与真实世界的统计数据相符。在脑的发展过程中,随着神经回路从感觉深入中积累数据,它所携带的内部模型会被改善。最终的结果是妥协,即从原始脑结构提供的所有先验假设中选取最佳模型。(P111)
3、童年早期是一个非常敏感的时期,语言学习要从早期开始着手
- 在许多脑区,可塑性只有在有限的时间内才会发挥最强性能,这段时间被称为“敏感期”。它在童年早期被激活并达到峰值,然后随着我们年轻的增长而逐渐减弱。整个过程长达几年,并根据脑区不同而表现不同。感觉区域的可塑性在一岁或两岁左右到达顶峰,而像前额皮层一类的高级区域,会在童年末期或青少年早期到达顶峰。可以确定的是,随着我们逐渐长大,神经可塑性会慢慢减弱,学习虽然不会完全停止,但会变得日渐困难。(P112 )
- 婴儿是学习语言的冠军,出生时,他们就能区分任何语言的所有音素。无论他们在哪里出生,有什么基因背景,他们只需要沉浸在语言环境里面几个月(可以是单语种、双语种、甚至是三语种),他们的听力就会与周遭的语言音系相适应。成年人则失去了这项卓越的能力,正如我们所见,说日语的人,在英语国家生活一辈子,也无法区分L和R的发音,永远会把right与light,red与led,以及elction与erection混淆。英国人和美国人也绝对无法区分任何印度语者都能轻松掌握的辅音T的齿音和卷舌音,或者芬兰语和日语的短、长元音,或者中文里面四个音调。(P115)
- 研究显示,我们在一岁左右便失去了这项能力。婴儿会无意识地把听到的东西进行数据汇编,并且脑会根据周遭人所用的音位的分布进行适应性调整。在12个越大时,这个过程汇聚起来,脑中有些东西就被冻结了,我们失去了这项学习能力。除非是在极其特殊的情况下,否则我们绝不可能被别人误以为母语是日语、芬兰语或印度语。我们的音系基本上完全固定。一个成年人将需要付出巨大努力来恢复区分外语发音的能力。一个日本成年人只有通过高强度和专注的恢复训练,首先将R和L的发音差异放大,然后逐渐减小放大的幅度,才能成功地恢复区分这两个辅音的部分能力。这就是科学家更倾向于用“敏感期”而不是“关键期”一词的原因。学习的潜力会减弱,但绝不会完全消失。在成年后,学习外语音素的剩余能力具有巨大的个体差异。(P115)
- 掌握外语音系的敏感期很快就会关闭,早在几岁时,一个孩子的能力就已经比一个几个月大的婴儿要弱得多。从层级上来看,高级语言处理,比如语法学习的敏感期,持续时间会稍长,但到了青春期时就开始关闭。(P116)再次强调,学习外语越早越好。(P117)
- 我们知道了生命早期第一年给幼儿提供语言环境的必要性。包括教给他们手语(手语是真正的语言,且掌握了手语的儿童后期发展会很顺利),或者通过植入人工耳蜗恢复幼儿的部分听力后,教给他们一门语言。研究再一次阐释了语言学习要从早期开始着手的重要性。(P118)
- 人类语音和语法的缺失为语言学习的敏感期提供了非常好的例子。这也是脑的模块化的清晰阐释。在语言的语法和语音停止发展后,其他功能,比如学习新单词及其意义的能力却终身存在。(P118)
- 生命前几年中脑可塑性更强的相关证据意味着,对儿童早期教育的投入应该成为重点。童年早期是一个非常敏感的时期,大部分儿童的脑回路最容易被改造。随着年龄的增长,突触的可塑性逐渐流失,使学习变得越加困难。但别忘了,神经回路的逐步固化正是使我们的脑能够维系对童年时期所学知识稳定追溯的原因。那些永久的突触标志最终定义了我们是谁。(P123)
第6章、脑的再利用
1、神经元在利用假说:教育就是对一个人现有神经回路的再利用(P130)
- 在我们出生时,脑的所有大型纤维束就都已经就位了。而脑的可塑性可以重组它们的终端联结。每当我们获取新知识时,数以百万计的突触都会发生可塑性变化。通过丰富孩子的环境,例如送他们上学,就可以极大地强化他们的脑,并让他们习得更多以终身受用的技能。但是,这些神经可塑性并非不受任何约束。它不仅在空间上收到约束(变化幅度大约只有几毫米),而且在时间上也收到约束——许多回路在几个月或几年之后就会被关闭。(P127 )
- 我们都需要锻炼记忆力———通过上学和学习阅读,记忆力会变得更好,而不是更差。(P128)
- 任何文化学习都必须有赖于改变已有神经结构的功能,以及对其特性的再利用。因此,教育必须通过利用我们神经回路的多样性以及人类特有的长时间的神经可塑性,来适应我们神经回路与生俱来的局限性。(P130)
- 神经元的再利用发生在个体的脑中,时间跨度要短得多,从几天到几年不等。对脑回路的再利用无法基因改变,只需要通过学习和教育,就能重新定位其功能。(P131)
- 每个脑区都有自己首选的神经活动状态,并忠于职守。每个脑区都把自己假设的空间形态投射到这个世界上:一个试图用直线拟合输入的数据,另一个尝试用地图表示它们,第三个则试图用一棵树来表示……这些假设空间先于学习而产生,并且在某种程度上使学习称为可能。当然,我们可以学习新知识,但这些新知识需要找到它们的神经元生态位,一个与他们天然的注视形态相适配的表征空间。(P134)
2、数学再利用了估算的神经回路
- 人类和猴子的顶叶和前额叶都包含用近似的方式表示数量的神经回路。在接受正规教育之前,这个回路就已经包含了可以对具体集合中物体的大致数量进行感知的神经元。那么,学习的作用是什么呢?在接受过数量比较训练的动物身上,其额叶中数字探测的神经元数量增加了。最重要的是,当它们学会根据阿拉伯数字符号,而不是仅仅依靠对近似的数的集合感知做判断时,这些神经元的一部分神经元会对数字符号产生选择偏好。对神经回路进行(部分)改造以适配数字符号,这是神经元再利用的一个很好的范例。(P135)
- 我们所有人,从小学生到数据界最高奖菲尔兹奖的得主,在我们的文化对数学进行建构的任何阶段,都在不断地完善特定回路的神经编码。(P135)
- 在数学里,感官经验并不重要,是思想和概念挑起了重担。(P136)
- 如果决定大脑皮层的是经验,那么那些通过触觉和听觉了解世界的盲人数学家们在研究数学时,会激活与正常人截然不同的脑区。与此相反,在神经元再利用假说的预测中,与数学相关的神经回路应该是固定的,即只有那些特定的,在出生时就已经存在的脑区域,才能通过重新调整自己的用途来承载这样的概念。这正是我们在扫描三位盲人教授的脑时所发现的现象。正如我们所料,当他们将一个数学陈述可视化并评估其真值时,他们与视力正常的数学家一样的顶叶和额叶回路被激活了。由此可见,感官经验时无关紧要的:只有这个神经回路才能与数学表征相适配。(P136)
- 奇偶性、负数、分数……所有这些概念显然都基于我们从进化中集成的对数量的表征模式。与数字计算机不同,我们无法抽象地操纵符号:我们总是将他们处理成具体的且通常是近似的量。这种模拟效应在受过教育的脑子中持续存在着,揭示了我们数量概念的古老根源。(P139)
- 近似数是构成数学的古老支柱之一。但是,教育也极大地丰富了这种原始的数量概念。当我们学会计数和计算时,我们习得的数学符号让我们可以进行精确的计算。这是一场革命:数百万年来,进化一直留于模糊的量。符号学习是变革的一个强大因素:通过教育,我们所有的脑回路都被再利用,使得我们可以处理精确的数量。(P139)
3、阅读再利用了视觉和口语的神经回路
- 早在儿童学会阅读之前,他们显然就已经拥有了一个复杂的视觉系统,使他们能够识别并命名物体、动物和人。他们可以识别并命名任何图像,无论其在三位空间中的大小、位置或方向是怎样的。阅读再利用了这种预先存在的、为图像命名的神经回路中的部分回路。识字的学习则涉及视皮层中的一个大脑区域。(P140)
- 对任何识字的人来说,位于我们脑中相同的位置(也可能有大约几毫米的差距)的这个脑区把识别一个单词分成两个步骤:它首先会识别出我们学习的字符,然后把字符与语言对应的脑区直接联结起来,把这些字符快速地转换为声音和意义。(P141)
- 孩子在六七岁左右,大脑皮层的功能特化还远未完成。一些脑区已经专门用于识别面孔、物体和地点,但也有许多皮层区域还没有专门用于识别任何特定的类别。我们可以想象他们逐步功能特化的过程:当还在进入一年级并很快开始阅读时,字母便侵入了那些功能还不太明确的脑区,并对其进行再利用。但与我最初的想法相反的是,字母并没有完全覆盖掉一个已经存在的面孔区域,后者会搬到隔壁,也就是大脑皮层中一个自由的区域中去。(P144)
- P146 随着年龄的增长,我们的视皮层似乎会逐渐固化,失去对新图像的适应能力。关键期过了之后,大脑皮层就越来越难以有效识别字母及字母组合。我和同事研究了两面成年后才试图学习阅读的人:其中一个人从未上过学;而另一人则因中风,视觉词区遭受了轻微的损伤,患上了失读症。我们在两年间定期扫描他们的脑,发现他们的学习进展非常缓慢。那位没有上过学的受试者最终发展出了专门加工字母的脑区,但并没有影响到面孔区域——面孔识别的回路已经铭刻在他的脑中,似乎不能再移动了。另一位中风的受试者却没有能在他的视皮层里再造一个新的“字母盒子”。他的阅读能力有所提高,但阅读速度任然很慢,与阅读初学者一样费力——作为一个成人,他失去了神经的可塑性。(P146)
- 要想深度地再利用我们的视皮层,称为优秀的阅读者,我们必须充分利用童年早期拥有最大神经可塑性的时期。(P146)
4、 所有的研究结果都非常一致:丰富儿童所处的环境有助于其构建更强的脑(P150)
- 支持资质先天论和支持后天论的两方都是正确的:孩子的脑既有遗传所带来的固有结构,又具有可塑性。刚出生时,所有的孩子都装备了一整套由基因塑造的特殊回路,这些回路本身是由物种数千万年的进化所形成的。这种自组织性使婴儿额脑对几个主要的知识领域有着深刻的直觉:控制物体及其运动的物理感觉;空间导航的技巧;对数量、概率和数学的直觉;对他人天生的热爱;甚至语言天赋。因此,白板假说使大错特错的。但进化也的确为许多学习机会敞开了大门,不是所有的事情都是由孩子出生时的脑决定的。事实恰恰相反:神经回路在几毫米的变化范围内,在很大程度上时对外界保持开放的。(P148)
- 在生命最初的几年里,基因会引导神经回路的过度生长:突触的数量是实际所需要数量的两倍。在某种程度上,神经回路的这种最初的过度生长是以一种我们还没有完全理解的方式,为我们基于对世界的认识所形成的心理模型开辟了一个巨大的空间。与成人相比,儿童的脑充满了各种可能性,能够在更广泛的领域探索各种假设。每个婴儿都对所有的口语、所有的文字、所有可能的数学保持开放——当然,前提是要在人类这个物种的遗传的限制性之内。(P148)
- 而且婴儿的脑还具备另一种与生俱来的天赋:它有强大的学习算法,能选择最有用的突触和回路,为机体提供第二层适应环境的能力。多亏了有用的突触和回路,在婴儿初生的几天里,脑便开始专门适应自己的结构。第一个被固化的脑区是脑的感觉加工区域:早期的视觉加工区在几年内就会成熟,而在不到12个月的时间里,听觉加工区就会聚焦在孩子母语中的元音和辅音上。随着各脑区可塑性的关键期一个接着一个过去,几年的时间足以让我们中任何一个人用母语习得一种特定的口语、文字和文化。(P149)
- 我们的学校时为了充分利用发展中的脑可塑性而设计的教育机构。教育的成功很大程度上依赖于孩子的脑的惊人灵活性,这样的灵活性使他们的脑可以对一些回路进行再利用,并重新引导它们去从事诸如阅读或数学训练这样的新活动。尽早入学接受教育可以改变人生:大量实践表明,那些家境不好的儿童假如能尽早的入学接受教育可能会受益终生,并且在许多领域都有所体现,例如较低的犯罪率,较高的智商和收入,以及更好的健康状态。(P149)
- 父母和家庭也有责任去尽可能地刺激孩子的脑,丰富他们的生活环境。所有的婴儿都是未来的物理学家,他们喜欢用下落的物理做重力实验,不过前提是我们得允许他们建造、修补、失败,然后重新开始,而不是几个小时都被绑在汽车安全座椅上。所有的婴儿都是喜欢数数、测量、划线、画圆以及组合各种形状的小小数学家,只要我们给他们尺子、圆规、纸和有趣的数学题。所有的婴儿都是天生的语言学家:早在18个月大的时候,他们每天就能容易地学会10-20个单词,但条件是得有人跟他们说话。家人和朋友必须满足他们对知识的渴望,随时随地地使用丰富的词汇、优美的句子来“喂养”他们。许多研究表明,儿童在3-4岁时的词汇量直接取决于他们在0-2岁里跟大人说话的数量。只让他们被动地听时远远不够的,主动的、一对一的互动必不可少。(P150)
第三部分、学习的四大核心支柱
人类在进化过程中出现了四个主要功能,将我们从环境中提取信息的速度最大化。因为这四大功能对我们心智结构的稳定性起着至关重要的作用,所以我把它们称为学习的四大核心支柱。
第7章、注意
- 为什么注意的这一机制会在如此多的动物物种中进化出来呢?因为注意解决了一个非常普遍的问题——信息饱和。我们的脑在不断地受到刺激的轰炸,几乎每秒钟都会收到数百万比特的视觉、听觉、嗅觉和触觉信息。最初,所有的信息都是由不同的神经元并行处理,但这些神经元不可能深入地加工它们,因为脑的资源有限。这就是为什么犹如金字塔的注意力机制,其组织结构就像一个巨大的过滤器,可以进行选择性分类。在每个阶段,我们的脑都会判断这样或那样的信息的重要性,然后只将资源分配给那些它认为最核心的信息。(P153)
- 选择相关信息是学习的基础。在注意力不集中的情况下,我们想从一堆数据中发现规律,就如同大海捞针一般。这是传统的人工神经网络速度如此缓慢的原因:它们浪费了大量的时间去分析数据所有的可能的组合,而不是在对信息进行筛选之后再聚焦的相关的部分。(P154)
- 现在任何复杂的人工智能系统都不再将所有输入与所有输出联结,因为它知道,当一个普通的网络被一个有组织的网络替代后,学习速率会更快。普通网络让每个输入的像素都有机会预测输出的任何单词,而有组织的网络会把学习分成两个模块,一个模块学习注意,另外一个模块学习命名那些被注意过滤后的信息。(P154)
- 通过有意识地注意,对物体进行感觉和概念加工的相关神经元的放电过程会被极大放大和延长,然后将信息传递到前额叶皮层,在这里激发所有的神经元长时间放电,这一过程的持续时间远远超出你的想象。如此强烈的神经冲动正是突触改变自身强度所必须的,这也被神经科学家称为“长时程增强作用”。当一个小学生有意识地注意到老师刚刚讲解外语单词时,他会允许这个单词深入到自己的脑回路中,直到信息进入了前额皮层。因此,这个单词更有机会被记住。处于无意识或没有被注意到的单词则主要被困在脑的感觉回路中,它们没有机会进入更深层次的词汇和概念表征加工阶段,因为无法实现理解和形成语义记忆。(P156)
- 这就是为什么每个学生都应该学会把注意力集中到什么地方去,以及为什么老师应该对注意力多加关注!如果学生不能关注正确的信息,他们就不大可能学到东西,因为作为一名老师最大的能耐就体现在能够不断引导和吸引孩子们的注意力,以便正确的指导他们。(P156 )
- 美国心理学家迈克尔·波斯纳(Michael Posner)把注意力区分成三个主要的系统:
- 警觉,指何时需要集中注意,并调试警觉水平
- 定向,指应该注意什么,并放大任何感兴趣的目标。
- 执行控制,指决定如何处理所关注的信息,选择与给定人物相关的处理过程以及控制它的执行过程。(P156)
1、警觉:脑的觉醒
- 第一个注意系统也是进化过程中最古老的系统,它告诉我们应该在何时注意观察。必需时,它会给我们发出警报信号以调动整个身体。当捕食者正在靠近,或者当一种强烈的情绪把我们淹没时,整个皮层下的所有神经核团立即提升了大脑的觉醒和警觉水平。该系统控制着神经递质,如血清素、乙酰胆碱和多巴胺的大规模和分散性释放。通过带有许多分支的长轴突,这些警报信息到达了整个大脑皮层,从而极大地调动了大脑皮层的神经活动和学习过程。(P157)
- 通过干预警觉系统也可以使成年动物产生大脑皮层可塑性现象。(P158)
- 电子游戏是一种能调动我们注意力机制参与其中方式,尤其是那些涉及生死的动作类电子游戏。通过调动我们的警觉和奖励系统,电子游戏极大地促进学习。(P158)
- 家长和老师经常抱怨说,现在的孩子沉迷手机、平板电脑、游戏机和其他电子设备,孩子们可以乐此不疲地从一项活动切换到另一项活动,但是失去了集中注意的能力,可是,这并不是真的。电子游戏非但不会降低我们集中注意力的能力,反而会逐渐提升这种注意力。电子产品将来能否帮助我们重新激活大人和孩子的突触的可塑性呢?毫无疑问,电子产品是一种强大的注意刺激物,这就是为什么我的实验室开发了一系列平板电脑游戏,它们是基于认知科学原理而开发的与数学和阅读相关的教育类游戏。(P159)
- 诚然,电子游戏也有黑暗的一面。众所周知,它们会导致社交孤立、浪费大量时间以及成瘾。幸运的是,还有许多其他的方法可以帮助我们激活警觉系统的功能,同时也调动脑的社会感知功能。那些能抓住学生注意力的教师、引人入胜的书籍以及让观众沉浸其中的电影和戏剧,可能都为刺激脑的可塑性提供了同样强大的警觉信号。(P159)
2、定向:脑的过滤器
- 美国心理学之父威廉·詹姆斯(William James)在他1890年出版的著作《心理学原理》(The Principles of Psychology)中就已经对注意的定向功能做了最好的界定:“数以百万计的外部刺激会出现在我的感觉中,但可能从未真正地进入我的经验。为什么呢?因为我对这些刺激不感兴趣。我的经验只与我愿意去注意的信息相关,只有那些我注意到的东西才能塑造我的思想。”(P160)
- 选择性注意存在于所有感觉领域中,即使在最抽象的感觉领域中也不例外。······我们脑中的任何表征都可以称为注意的焦点。(P160)
- 我们去注意就是去选择、过滤和挑选,这也是为什么认知科学家称其为“选择性注意”。这种形式的注意放大了被选择的信号,也在很大程度上缩小了那些被认为不相关的信号。这一机制的专业术语被称为“偏向性竞争”(biased competition),因为在任何适定时刻都有许多感官输入竞争着我们的脑资源,注意在强化所选择的项目的表征的同时,会削弱其他项目的表征,从而使竞争出现偏颇。(P161)
- 注意的过程包括抑制不想要的信息,而一旦这样做,我们的脑就会有看不见已经选择不加注意的东西的风险。(P161)
- 心理学家将之称为“注意瞬脱”(attentional blink)现象,即你的双眼也许一直是睁着的,但你的思维会“眨眼”,思维在一小会儿功夫里正全身心地投入自己的主要任务中,完全无暇处理其他任何事情。(P162)
- 在这类实验中,我们实际上产生了两种错觉。第一种错觉是我们没有看到那个单词或者大猩猩,这已经很糟糕了。第二种错觉比第一种更糟,那就是我们意识不到自己没有意识到,我们会确信自己已经看到一切!······意识本身的局限会导致我们高估自己和他人所能感知到的东西。(P162)
- “看不见的大猩猩”实验的确值得被人们知悉,尤其是父母和老师。我们在教育孩子时往往会忘记无知的状态是怎样的,都认为自己所看到的别人应该也能看到。因此,即使出于好意,我们也时常很难理解为什么一个孩子就是无法真切看到我们想要教会他们的是什么。但是“看不见的大猩猩”实验为人们提供了明确的信息,那就是看到的前提是注意到。如果学生因为这样或者那样的原因分心而不能集中注意力,老师的话就可能完全称为耳旁风。他们无法感知到信息,就无法学习。(P163)
- 正确的注意是学习成功的秘缺(P165)
- 好的教学效果需要我们将注意力一直放在孩子的注意的定向功能上。教师必须仔细挑选他们想让孩子关注的内容,因为只有那些可以持续引起注意的内容才会获得足够的注意资源,在脑中被表征出卖,然后被高效地学习。而那些在注意的竞争中落败的刺激物,几乎无法激发儿童突触的可塑性。(P165)
3、执行控制:脑的总机
- 第三个注意系统是用于决定我们如何处理所注意到的信息的。执行控制系统,有时也被称为“中央执行系统”。它是一个神经回路“大杂烩”,它使我们可以选择行动方案并坚持下去。执行控制系统包含大脑皮层的整个层级结构,主要位于前额叶皮层——大脑前额下方较大的皮层区域,约占脑体积的1/3.(P165)
- 全脑神经工作区(global neural workspace)就像是脑的路由器和信号员,负责决定如何并以何种顺序将信息传递给脑中许许多多的不同的处理器。在这个层级上,脑的思维活动是缓慢且连续的,因为执行控制系统一次只会对一条信息进行加工,因此无法同时处理两种思维活动,心理学家也将之称为“中枢瓶颈”现象。(P167)
- 实验结果再次证明,我们没有意识到自己的思维局限。(的确,我们怎么可能察觉到自己是缺乏察觉的,那很荒谬!)我们相信自己可以同时进行多任务处理的唯一原因是我们没有意识到它造成的巨大延误。因此,尽管所有证据都表明发消息是最容易让人分心的行为之一,仍然会有许多人边开车边发消息。电子设备的屏幕诱惑和同时多任务处理的神话是现代数字社会中最危险的谎言。(P168)
- 那经过训练之后我们能否把自己变成一个真正的可以一心多用的人,可以同时操作多个任务呢?或许可以,但只有在对两项任务中的其中一项进行了高强度训练达到了自动化之后才可能实现。自动化解放了有意识工作区:通过将一项任务做到了可以自动化进行的程度,我们就可以在无意识的情况下执行它,而不占脑的核心资源。(P168)
- 一个公认的基本原则是:但我们不得不同时执行多人认知操作的时候,在注意力的控制下,至少有一项认知操作被放缓了或被完全遗忘了。(P168)
- 由于注意分散会产生如此严重的影响,因此学会集中注意是学习能取得成效的一个核心秘诀。我们不能指望一个孩子或大人可以同时学两项内容。因此,教学需要关注到注意的极限,尤其需要仔细区分特定任务的优先级。任何分心都会延缓我们的学习进度或浪费我们的努力,因为如果我们试图同时做几件事,我们的中央执行系统很快就会跟不上节奏。在这方面,认知科学的实验结果与教育研究的结果是完美契合的。例如,现场实现发现,有过多装饰物的教室会分散孩子的注意,使他们无法集中注意。最近的另一项研究表明,如果学生被允许在课堂上使用智能手机,他们的学业表现就会退步,即使在课程结束几个月后再次测试他们当天的学习的内容,他们的表现仍然不佳。因此,为了获得最佳的学习效果,大脑必须排除任何干扰。(P168)
4、学会注意
- 执行注意大致相当于我们所说的“集中注意”或“自我控制”。重要的是,该系统并不是人生来就有的,因为这一系统需要在大脑前额叶皮层完全发育成熟时才能达到最优的功能状态,而前额叶皮层的发育可能需要历经15-20年才能完成。通过积累经验和接受教育,执行控制系统在整个童年和青少年时期缓慢发展,然后慢慢地学会了自我控制。脑的中央执行系统需要大量时间来系统性地选择合适的策略,抑制不恰当的策略,与此同时也要避免分心。(P169)
- 早在计算机问世之前,意大利女教育家兼医生玛丽亚·蒙台梭利(Maria Montessori)就注意到各种各样的实践活动可以培养幼儿的专注力。例如,在今天的蒙台梭利学校,让孩子们沿着画在地上的椭圆行走且要走到脚不离线,就是一种培养幼儿注意力的方式。一旦他们学会之后,教师就会给他们加大难度,例如让他们嘴里含着勺子上放一个乒乓球然后沿着椭圆轨迹行走。实验结果表明,蒙台梭利的方法对儿童众多方面的发展都有积极的影响。研究结果表明,玩电子游戏、冥想或学乐器等活动都对注意力的发展有益。对一个年幼的孩子而言,在协调双手的同时还要控制自己的身体、视线和呼吸是极其困难的。这就是为什么在小的时候学习音乐对脑的注意神经回路有较强的影响,它可以使大脑两侧前额叶皮层厚度显著增加。(P172)
- 执行控制训练甚至可以改变一个人的智商水平。这可能会让人感到惊讶,因为智商通常被认为是由遗传决定的,遗传通常才是儿童智力潜能的基本决定因素。然而,智商就像我们的其他能力一样,其实是一种行为能力,因此,他可以通过教育而改变。智商有赖于脑中特定的神经回路,而这些回路的突触结构是可以通过训练来改变的。以推理和解决新问题的能力为核心的流体智力对脑执行控制系统依赖性很强,因为流体智力和执行控制系统这二者调动了脑区中共同的神经网络,尤其是位于背外侧前额叶皮层上的神经网络。的确,流体智力的标准化测试类似于认知心理学用来评估执行控制的测试,二者都强调在不忘记总体目标情况下对注意力、专注力,以及从一项活动快速切换到另一项活动上的能力的测评。而且,事实上专注于工作记忆和执行控制的训练项目可以使流体智力分数略微提升。这与先前的研究结果一致,即尽管智力受到遗传因素的影响,但它也会因环境因素(包括教育)的影响而发生巨大的改变。······最近的一项元分析研究了教育对智力的影响,研究者得出的结论是,每在学校多上一年学,智商分数就会提高1~5分。(P174)
- 因为在默认状态下,脑倾向于为每一项任务形成特定技能,即技能是在逐个案例的基础上形成的。应对这一挑战的办法可能在于使我们的学习经验多样化。(P174)
- 所有这些教育干预似乎对家境不好的孩子最有帮助。(P175)
5、共同关注
- 所有的哺乳动物,当然也包括灵长类动物,都拥有注意系统。但是,人类的注意系统还有一个独特的特性———社交注意共享(social attention sharing),这种能力可以进一步加速我们的学习与其他灵长类动物相比,人类的注意和学习更依赖社会信号,因此我会关注你关注的东西,我会从你教我的东西中学习。(P175)
- 婴儿从很小的时候就开始注视人脸,尤其关注人的眼睛,因此,一旦听到了什么声音,他们的第一反应不是去探索这个场景,而是去捕捉与他们互动的人的目光。只有在建立了眼神接触之后,婴儿才会转向大人凝视的对象,这种非常了不起的社交注意共享能力也被称为“共同关注”,它决定了孩子学习到的东西。(P175)
- 在学习Wog这个词时,婴儿如果能跟说话者的视线专注这个词,那么他们通过几次尝试就能学会这个词。但如果知识通过扬声器重复播放这个词,即使这一读音与词语直接相关,婴儿也学不会。婴儿学习语音类别时也是这样的情况。(P176)
- 匈牙利心理学家盖尔盖伊·西布拉(Gergely Csibra)与捷尔吉·盖尔盖伊认为,教导他人和向他人学习是人类物种进化出来的最基本的适应功能。人类是一种拥有“自然教学法”脑回路的社会性动物,一旦我们注意到别人试图教给我们的东西,这一大脑回路就会被触发。全人类的成功至少可以部分地归功于我们进化出的与他人共同关注的能力。我们学到的大部分知识都来自他人,而非我们自己的亲身经历,因此人类社会的集体文化才能远超任何个体单独所能做到的上限。这就是心理学家迈克尔·托马塞洛(Michael Tomasello)所说的“文化棘轮”效应,就像棘轮可以防止电梯下降一样,社交共享也可以防止人类文化的倒退。每当有人有新的发现,这一有用的发现会迅速传遍整个群体。(P176)
- 社会互动是人类学习算法的重要组成部分,学习取决于我们对他人意图的理解。即使18个月大的婴儿也明白,如果你看着他们的眼睛,你是在试图向他传达重要信息。通过眼神交流,他们比其他人更有效地学习和更成功地进行归纳。(P177)
- 父母和老师要时刻谨记这一重要事实,因为你们的态度和视线对孩子来说非常重要。通过视线和语言交流来吸引孩子的注意可以确保他和你共享同一个注意对象,同时还会增加他们记住你想要传达的信息的概率。(P179)
6、教学是去关注别人的知识
- 教学是去关注别人的知识。没有哪个物种能像我们一样传授知识。原因很简单,那就是我们可能是唯一可以理解他人想法的物种,我们可以注意到他人心里在想什么,以及以为别人是怎么想的。这种推演能力是脑的典型特征,它在教学中起着直观重要的作用。教育工作者必须不断地思考学生不知道什么,并基于此调整自己的表达和示例,以便快速地增加学生的知识。一旦学生知道老师清楚地了解他们不知道什么,他们就会把老师的每一个动作都理解为正在试图向他们传授新知识。这个良性循环会一直持续下去:大人明白,孩子知道大人清楚哪些东西是他们不知道······这促使大人可以选择那些孩子可以听懂、可以类比的例子。(P179)
- 任何健康的教学关系都必须建立在双向的关注、倾听、尊重和信任的基础上。目前还没有任何证据表明,在人类外的任何物种中,存在这种学生和教师相互关注彼此心理状态的能力,这种能力被称为“心理理论”(theory of mind)(P180)
- 人脑有两种学习模式:一种是主动模式,我们像优秀的科学家一样主动对外部世界形成假设并对其进行测试;另一种是接受模式,我们被动吸收他人传递给我们的信息、且不再去亲自验证。······我们必须在两种学习模式之间找到一个平衡,学生必须专心听并对老师讲授的知识有信心,但也必须成为学习的主人,可以自主地、批判地思考。(P182)
第8章、主动参与
- 对世界进行主动探索是我们视觉功能得以正常发展的关键。(P183
1、被动的有机体无法学习
- 要学习,我们的脑首先必须形成一个关于外部世界的假设性的心理模型,然后将之投射到周围环境里,并将这个假设所得出的预测与从感官接收到的内容相比较,来检验假设。这一过程意味着我们必须是处于一种积极、投入和用心的状态。因此,动机非常重要,我们只有在有目标并且全身心投入其中的时候才能学得好。(P184)
- 主动参入不是指身体必须一直动。主动参入是在我们脑中进行的活动,而不是在脚上。只有当我们的脑在用心地、专注地以及积极主动地创造心理模型的时候,我们才能高效地学习。为了更好地理解新概念,主动学习的学生会不断地把概念用自己的词汇和想法重述出来。而被动的活着心不在焉的学生则不会从课堂中学到任何东西,因为他们的脑没有把关于世界的心理模型进行升级。这与身体的动作没有任何关系。两个看似都安安静静坐着的学生,它们内在的脑活动可能有巨大差异。(P184)
2、加工的深度越深,学习的效果越好
- 美国心理学家亨利·罗迪格(Henry Roediger)曾说:“把学习条件弄得再困难些,迫使学生投入更多认知努力时,常常能加强记忆效果。”(P186)
- 脑成像显示,记忆编码的初始阶段,被印刻在我们记忆中的重大生活事件就会与那些不留痕迹的日常琐事区分开来———前者已经在更深层次被加工了。当一个人看到一串词汇和图像时,通过扫描他的脑,我们就能预测哪些具体的刺激会被遗忘和记住。关键的预测因素是它们是否激活了前额皮层、海马以及海马旁回周边区域。这些区域的主动参与直接反映了这些词汇和图像在脑中的加工深度,它能预测信息在记忆中留下痕迹的强度。(P186)
3、发现教学法的失败
- 对卢梭和他的后继者来说,即使这一探索过程需要浪费几个小时也是值得的,让孩子自行去发现并建立自己的知识结构式最好的学习方式。(P188)
- 当放手让孩子自己去发现时,他们其实很难发现某个知识领域的主要抽象规则,因此他们几乎学不到什么。我们该对此感到震惊吗?我们怎么能认为孩子能在没有外力引导的情况下,在短短几个小时内就重新发现人类花了几个世纪才理解的规则?无论如何,发现教学法在所有领域都失败了。(P188)
- 发现教学法带来的最糟糕的影响:在未曾交给学生恰当的方法去触及某个领域中的更深层次的概念时,让学生误以为自己已经掌握了这个领域的所有知识。(P190)
- 总而言之,虽然让学生变得有动力、主动学习以及积极参入很重要,当这不代表他们应该被放任自流。构建主义的失败显示了进行直接的教学指导的重要性。老师必须为学生提供一个能逐步指引他们尽快掌握所有框架的有组织学习环境。最有效的教学策略就是引导学生去主动参入学习过程,同时老师在这一过程中为他们提供精心的指导。心理学家理查德·迈耶(Richard Mayer)在回顾这个领域的研究时说:“最成功的教学方法是去激发学生的认知活动而不是行为动作,是去进行教学指导而不是纯粹放任学生自己去发现,并且在课程设计上会有所侧重而不是全部随意探索。”一个成功的老师会从基础内容开始教,其教学顺序清晰、严谨。他们会不断监测学生的掌握情况,让学生建立起一个意义的金字塔。(P190)
- 每位老师都要记得,所有孩子的学习的基本机制是相同的———比起一心二用,他们更喜欢专注;比起被动听讲,他们更喜欢主动参入;比起虚伪的赞美,他们更喜欢细致的纠错;比起建构主义或发现教学法,他们更喜欢直接教学法。(P192)
4、好奇心以及如何去激发它
- 好奇心是有机体的基本驱动力,是一个促进我们去行动的推力,就像饥饿、口渴、需要安全感或渴望繁殖一样。好奇心在人类的生存中起到了什么作用呢?绝大部分动物(哺乳类动物,但也含许多鸟类和鱼类)都需要凭借好奇心的驱使来探索环境。······好奇心是促使动物走出舒适区学习知识的决定性因素。在充满不确定的世界里,信息是价值连城的,从达尔文进化论的角度来看,有时甚至必须以生存为代价来获取。(P193)
- 好奇心是驱使我们去探索的推力。从这个角度来说,它与食欲和性欲相似,不同点是,它是一种无形的价值说驱动的,即获取信息。的确,神经生物学研究表明,对我们的脑而言,发现先前不知道的信心本身就是一种奖励:它会激活多巴胺回路。还记得吗,这个回路在看到食物、药物和性对象时才放电。对灵长类动物,可能包括所有哺乳动物而言,这个回路不只是对物质奖励有反应,它还会对新信息有反应。有些多巴胺的神经元甚至会对未来可能的信息获得反应,就好像在期待新信息能给自己带来满足感一样。(P194)
- 与我们学习本领的不断提高一样,人类的好奇心似乎也在成倍增加。在进化过程中,我们发展出了强烈的好奇心,它被称为“认知性好奇心”(epistemic curiosity),即对所有领域知识的纯粹渴望,包括最抽象的概念。与其他哺乳动作相似,我们不仅可以通过实践,可以通过想象的实验进行玩耍与探索。当其他动物只探索周遭的物理世界时,我们会去探寻概念世界。人类还会体验到特殊的情绪感受,从而求知若渴。比如,在看到数学图形时,我们会为它的对称性及纯粹的美感而欢欣鼓舞,而一个睿智的定理比一块巧克力蛋糕更能打动我们。(P195)
- 欢乐似乎是人类特有的推动自身去学习的情绪之一。当我们突然发现自己原先的内隐假设是错误的时候,我们的脑会激活欢乐反应,促使我们彻底改变自己的思维模式。根据哲学家丹尼尔·丹尼特(Dan Dennett)的观点,欢乐情绪在社交互动时很有感染力,会把我们大家的注意吸引到一个出乎意料的信息上去。的确,在所有条件相同的情况下,学习过程中的欢笑似乎能增强好奇心并提高随后的记忆效果。(P195)
5、知道自己不知道,而想要知道:动机的源泉
- 好奇心是孩子试图理解世界并为之建造心理模型的动机的直接体现。每当我们的脑发现已经知道的与想知道的之间有一条鸿沟时,即存在一个潜在学习区域时,好奇心就会产生。任何时候,我们都可以从触及的各种行动中选择最优可能缩小这一差距并获得有用信息的那些行动。……好奇心就像是脑的调速器,是一个致力维持某种特定的学习压力的调节装置。它会将我们导向我们认为的能够学习的东西。好奇心的对立面是无聊厌烦,厌烦则会让我们对已知的东西,或根据过去的经验判断出不太可能让我们学到新知识的地方失去兴趣,甚至避之不及。(P196)
- 这个理论解释了为什么好奇心与惊讶或新奇程度并不直接相关,而是形成一个钟形曲线。我们对那些我们见过千万次的无聊事物没有好奇心。但我们也对太新颖、太令人惊讶或其结构太令人迷惑的东西没有兴趣,因为它们过于复杂会将我们推开。因此在太简单的感到无聊与太复杂的望而却步之间,人类的好奇心会自然地引导我们去往新的并且在我们理解能力范围之内的地方。但这种吸引力是不断变化的。当我们掌握了曾经对我们而言有吸引力的事物后,我们就失去了吸引力,我们又会将好奇心转向新的挑战。(P196)
- 同样的机制也解释了为什么我们有时候会因曾经感兴趣的领域太难理解而对其失去热情。我们的脑会评估学习速度,如果发现加工速度不够快,我们的好奇心就会被关闭。(P197)
- 大人的责任在于为孩子提供一个设计合理的教学层级,不断激励他们去追求新知识和新事物,逐渐引导孩子到达顶峰。(P199)
- 这个与好奇心有关的观点引出了一个有趣的假设,即为了让还在对事物感到好奇,他们必须先意识到什么是自己不知道的。换句话说,他们必须在小时候就具有元认知功能。“元认知”是对认知的认知,它是监控我们的思维过程的一系列高级认知系统。根据前文提高的好奇心的沟壑理论,元认知系统必须不断监督学习进度,评估哪些知识是我们已经知道的哪些是还不知道的,学习方式是对的还是错的、学习速度是比较快还是比较慢的,等等。元认知囊括了我们所知道的关于自己的思维的一切内容。(P199)
- P199 最近的实验再次确诊了,孩子从一岁开始,甚至更小的时候,就已经知道世界上有他们还不知道的东西。小婴儿在自己无法单独解决问题时就会向照顾者求助,知道自己不知道促使它们寻求更多信息。这是认知好奇心在儿童生命早期的一种体现,反映了我们难以抗拒的求知欲。
6、学校可能扼杀孩子好奇心的三个方法
- 第一、孩子失去好奇心可能是因为学校提供的认知刺激与他们的需求不匹配。······好奇心理论认为,不论孩子在学校的学习很超前还是落后,当他们感到挫败时,最重要的是通过提供有刺激性的,适合他们当下能力水平的问题,来重建他们对学习的渴望。他们首先会重新发现学习新东西的乐趣,然后他们的元认知系统会逐渐认识到自己是有能力学习的,从而把他们的好奇心推回到原来的轨道上。(P200)
- 另一个会让学生失去学习兴趣的原因是当他们好奇时却被处罚了。一个还在对探索的渴求会被太过死板的教学策略摧毁。······多巴胺系统所期待的以好奇心为基础的奖励,即学习新东西所带来的愉悦感,会在很大程度上被同一个回路接收到的消极信号所抵消。反复进行惩罚会导致习得性无助,这是一种压力及焦虑所引起的身心疲惫状态,研究表明它会抑制动物的学习行为。(P201)
- 第三个会阻止好奇心的因素是知识的社会传递。想想那两个同时存在于人类身上的学习模式:主动模式,即孩子像未来科学家那样不断实验、问问题;被动模式,即只是去记录别人交给他们的东西。学校通常只鼓励第二个模式,且如果孩子们总是认为老师永远都比自己正确,那么第二种模式甚至可能会阻碍第一种模式的发展。(P202)
- 最大限度地调动孩子的聪明才智投入到学习中,意味着要不停地问他们问题,刺激他们的想象力,鼓励他们自发地进行更深入的探索。······要鼓励孩子的主动参入还需要另一个必要条件:容忍孩子犯错并帮助他们快速改正。这是学习的第三大核心支柱。(P203)
第9章、错误反馈
每个人都应该学会愉快地犯错。思考就是从一个错误走向下一个错误。———阿兰《教育漫谈》
假如我们一开始就没有经历过失败,我们就不会取得进步。只要我们能得到反馈,知道我们该如何改进,我们就不会再犯相同的错误了。这就是为什么错误反馈是学习的第三大支柱,同时也是最具影响力的教育参数之一:我们所获得的反馈的质量和准确性,决定了我们可以学得多快。(P207)
1、惊讶:学习背后的驱动力
- 两位美国研究者罗伯特·雷斯科拉(Robert Rescorla)和艾伦·瓦格纳(Allan Wagner)提出了下列假设:人脑只有在感知到它所预测的和实际所接收到的信息之间有差距时才会去学。没有感知到错误的话,学习是不可能发生的:“有机体只有在事件违反了他们的预期时才会去学习。”换句话说,惊讶是学习的基本驱动力之一。(P208)
- 雷斯科拉和瓦格纳的理论很好地解释了经典条件反射学习范式。其工作原理如下所示:(P208)
- 大脑通过计算感觉输入的加权总和来做出预测
- 大脑算出它所预测的和它实际接收到的刺激之间的差异,即预测误差,这是该理论的一个基本概念,它测量的是与每个刺激相关的惊讶程度。
- 大脑用这个惊讶信号来纠正内部表征,让内部模型根据刺激强度、预测误差进行调整。这个规则保证了下一次预测会更接近实际值。
- 这个理论实际已经包含了我们学习的三大核心支柱:只有当大脑选择了适当的感觉输入(注意),利用它们来产生预测(主动参与),并评估预测的准确性(错误反馈)时,学习才会发生。(P208)
- 雷斯科拉和瓦格纳在1972年提出的这个理论非常有先见之明。这实际上与后来在人工神经网络中被广泛应用的“差量规则”(delta rule)很相似,两者都是误差方向传播规则的简化版本,目前几乎用于所有的监督式学习系统中(在该系统中,对于神经网络应该做出的反应会给予明确的反馈)。此外,在以奖励为基础的机器学习中(告知人工神经网络错误的程度),类似的规则依然可以运用:人工神经网络可以预测奖励,而预测的奖励和真实的奖励之间的差异则可以用来更新内部表征。(P209)
- 我们可以确定,今天的硅基学习机其实是直接受到了神经科学的启发。正如我们在前面看到的,人脑可以做得更好:为了从每个学习片段中提取尽可能多的信息,它会使用一种思维语言和统计模型,而这些模型比当前的神经网络要精细得多。不过,雷斯科拉和瓦格纳的基本思想仍然是正确的:脑试图预测它所接收到的输入信息,并且根据惊讶、不可能性或错误的程度来调整预测。学习的目的就是去设法让不可预测的事情变得更少。(P209)
- 先学会的规则会阻碍后一个规则的学习。(P210)
- 如果以为对学习而言最重要的是犯很多错误,那就错了,就像沙多克斯一家仓促地使用999999次火箭发生实验失败一样。最重要的是得到明确的反馈,减少学习者的不确定性。(P211)
- 没有惊讶就没有学习,这一基本规则现在似乎已经在包括人类婴儿在内的所有生物中得到了证实。记住,惊讶是婴幼儿早期技能习得的基本指标之一:他们会长期地盯着那些像变魔术般呈现给他们看的违背物理、算数、概率或者心理学法则的令人惊讶的事件。其实他们并非仅仅是在盯着令人惊讶的东西看,他们显然也是在学习。(P211)
- 美国心理学家丽莎·费根森(Lisa Feigenson)做了一系列的实验,结果表明只要孩子认为一个事件是不可能或不可信时,学习就发生了。······换句话说,他们观察到的不可预测的场景的性质,决定了他们后续如何行动去调整他们的假设。这正是错误反向传播理论说预言的:每一个意外事件都会导致我们对外部世界所形成的内部模型的相应调整。(P211)
2、脑中充斥着错误信息
- 传输错误信号在学习中扮演着如此重要的角色,几乎所有的脑区都可以传输错误信号。(P212)
- 在某个脑区无法解释的输入信息都会传递到下一个更高级的脑区尝试理解。我们可以把大脑皮层想象成一个庞大的多层预测系统,每个系统都试图解释输入信息,并且与其他系统交换剩余的错误信息,以期能做得更好。(P213)
- 多巴胺回路不仅能对实际的奖赏做出反应,还能够持续不断地对其保持期待。多巴胺能神经元位于腹侧被覆盖的小细胞核中,它不仅会对性、食物、饮水说带来的愉悦产生反应,还标志着预期奖励和实际获得奖励之间的差异,即预测误差。因为,如果动物在无任何预兆的前提下得到了奖励,比如一滴意料之外的糖水,这种惊喜就会导致神经元兴奋。但如果奖励出现之前就有信号可以预测它,那么同样的糖水就不会引起任何反应。现在是信号本身引起多巴胺能神经元的活跃:学习使神经元反应更加接近预期奖励的信号。(P214)
- 由于存在这种预测学习的机制,任何信号都可以称为奖赏的载体,并触发多巴胺反应。(P214)
3、错误反馈并不等于惩罚
- 我们如何才能最大限度地利用好神经元不断交换的错误信号呢?为了促使孩子或者大人有效地学习,他们的环境(无论是服务、学校······还是电子游戏)必须给他们提供快速而准确的反馈。当学生收到详细的错误反馈,准确地告诉他们哪里出错了,他们应该做什么,他们就会学得更快更容易。通过对错误提供快速精准的反馈,老师可以给学生提供他们说需的大量信息以帮助他们去改正错误。在人工智能领域,这种被称为“监督式”的学习方式是最有效的,因为它能让机器迅速识别故障的来源并自我修正。(P215)
- 而有一点很重要,这种错误反馈与惩罚是无关的,我们不会惩罚人工神经网络,我们只是告诉它哪些反应是错的。我们给它提供最大信息量的信号,一点一点地让它知晓错误的性质和标志。(P215)
- 计算机科学和教育学确实看法一致,澳大利亚教育专家约翰·哈蒂(John Hattie)所做的元分析研究清楚地表明,学生获得的反馈的质量是他们学业能否成功的决定因素之一。为学习设定一个明确的目标,并且让学生循序渐进地达到这一目标,而不是夸大他们犯的不可避免的错误,这是成功的关键。(P215)
- 在一个正误是非题的判断选择中,当学生听到“你是对的”和“你是错的”时,学到的知识量应该完全相等。但是我们不要忘记了,孩子并不是完美的逻辑学家。对他们来说,推断出“如果我选了A,被认为是错了,那么正确答案一定是B”的附加思维过程并不是那么简单直接。其实学生毫不费力地抓住了关键信息:我搞砸了。事实上,当进行这个实验时,成年人成功地从奖励和惩罚中提取了等量的信息,但是学生却没有:他们从成功中学的东西远比从失败中学到的要多得多。因此,让我们为他们免去这种痛苦,尽可能给他们中性的丰富的反馈信息。请不要把错误的反馈与惩罚相混淆。(P216)
4、分数时错误反馈的糟糕替代品
- 如果缺乏详细的、有建设性的评估,分数本身就不能算错误反馈的来源。分数不仅不精确,而且常常被推迟几个星期才公布,这时候,大多数学生早就忘记了是什么内在推理误导了他们。(P217)
- 分数同时也是非常不公平的,尤其是对那些跟不上进度的学生来说,因此考试的难度通常每周都在提高。(P217)
- 数学焦虑症是一种公认的、可测量的、可量化的综合症。有数学焦虑症的学生,其脑中的疼痛和恐惧回路会被激活,包括位于脑的深处的杏仁核,它与负面情绪有关。这些学生并不比其他人笨,只是他们曾体验到的情绪海啸摧毁了他们的计算能力、短期记忆能力,尤其是学习能力。(P218)
- 因为压力和沮丧会阻碍孩子的学习,所以,把差成绩作为一种惩罚施加给孩子,会严重阻碍孩子的进步。从长远来看,这也会改变他们的人格和自我形象。美国心理学家卡罗尔·德韦克(Carol Dweck)对这种心理倾向的负面影响进行了大量研究,这其中包括将一个人的失败(或成功)归因于一个人的人格中固定的、不可改变的方面———她称之为“固定型思维”(fixed mindset),比如“我数学不好”“外语不是我的强项”等等。她将这一观点与所有孩子都有能力取得进步的正确观点———她称之为“成长型思维”(growth mindset),进行了对比研究。她的研究成果表明,在所有其他因素相同的情况下,思维在学习中起着重要作用。坚信任何人都可以进步,这本身就是进步的源泉。(P218)
- 培养学生的成长型思维并不意味着要以培养自尊为借口,告诉每一个孩子他是最棒的、最好的。相反,这意味着要关注他们的日常进步,鼓励他们参与课堂讨论,奖励他们的努力······事实上,还要向他们解释学习的基础:所有的孩子都必须通过努力,必须试着回答问题,即使错了也没有关系,因为犯错之后的改正错误是学习的唯一途径。(P218)
5、自我检测
- 如果分数很难奏效,那么把与犯错相关的科学知识融入课堂的最佳方法是什么?答案很简单。首先,必须鼓励学生参与课堂讨论,给出回应,主动提出假设,不管他们对自己的想法有多么的不确定。其次,他们必须马上得到可观的、非惩罚性的反馈,使他们能够改正自己的错误。(P219)
- 定期测试可以使长期学习的效果最大化,可以增强你的记忆。测试直接体现了主动参与和错误反馈原则,因为参加测试会迫使你直面现实,去巩固你所知道的知识,并且认识到哪些知识是你还不知道的。(P219)
- 美国心理学家亨利·罗迪格及其合作者在一系列著名的实验中得出的:测试越多次,你就越能记住你要学的东西。(P220)
- 要想把信息变成长时记忆,很有必要先研读学习材料,然后进行自我测试,而不是把所有的时间都纯粹花在学习上。(P223)
6、黄金法则:间隔学习
- 为什么学习和测试的交替会产生这么好的效果呢?因为这种方式利用了教育科学发现的最有效的学习策略之一:间隔训练。这个黄金法则是说间隔训练总比集中训练效果好。确保长时记忆得以保持的最佳方法是进行一系列的学习,其间穿插测试,且间隔越长越好。(P223)
- 当你有规律地间隔复习时,你可以将你的记忆效果提升3倍,因此不要试图一下就学会所有的东西。所有的音乐家都知道这个简单的原理:以一周为例,每天练习15分钟要比在一天内练习2小时的效果更好。(P224)
- 为什么间隔学习策略如此有效?脑成像研究表明,把问题集中地塞进一个时段中去解决会减少它们所引起的脑活动。也许是因为重复的信息逐渐失去新奇性。一方面,重复似乎也会让人产生一种知识错觉,一种由于工作记忆中的信息尚存而产生的过度自信:它似乎可以随时提取出来,我们已经把它记在脑海中了,所以不知道再努力学习有什么意义。另一方面,间隔学习会增加脑活动:它似乎通过禁止工作记忆中的简单存储,迫使相关脑回路更努力地工作,从而产生了必要难度(desirable difficulty)的效果。
- 经验法则是以你所期望的总的记忆留存时间取20%作为间隔长度来进行复习。例如,如果你想让记忆保存10个月左右,那2个月后就拿出来复习一次。效果是显著的:每隔几周就温习某节课所学的内容,几个月后能记住的内容就会增加3倍!为了尽可能长时间地记住这些信息,最好自己逐步增加时间间隔:从每天复习一遍,到一周,一个月,然后一年之后再复习······这种策略保证了在所有时间点上都达到最佳记忆存储效果。(P224)
- 最重要的是,间隔学习似乎在我们脑的所有可用的记忆回路中选择了会使遗忘曲线变得最慢的那个回路,也就是说,它可以把信息投射到最远的未来。(P225)
- 事实上,过去我们对记忆的认识都是错误的:它不是一个只是缅怀过去的系统,而是一个将信息传递到未来去的系统,以便我们日后可以提取它。(P225)
- 哈尔·帕施勒研究总结:第一,把某一知识点分散到几节课中去,学习效果会更好。第二,对于一些学习科目来说,只是几天或几周后复习一遍是不够的。如果你想长久地记住一些东西,你应该至少花几个月时间不断温习。(P225 )
- 只要知识还没有被完全巩固,脑就会继续学习。只要存在不确定性,错误信号就会继续在我们的脑中传播。最初的不太确定的答案与随后的100%确定的信息之间的差异可以作为一个有用的反馈信号:它标记了一个我们可能会犯的错误,他们可以从中学习。(P226)
第10章、巩固
- 此时此刻,就在你解读我的这段文字时,对于任何一个3-8个字母的单词,你的脑花费的时间都是相同的。从顺序逐个识别字母到视觉字形区可以同时处理单词所有字母,平均需要3年左右的时间。(P227)
- 巩固存在于脑的所有区域。从缓慢的、有意识的、费力的加工转变为快速的、无意识的、自动化的专业技能,我们的脑永远不会停止学习。即使掌握了一项技能,我们仍然会过度学习它。自动化机制将我们经常使用的操作“编译”成更高效的程序,再将它们转移到我们意识之外的其他脑回路中,这些加工过程可以相互独立地展开,而不会干扰正在进行中的其他操作。(P228)
1、释放脑资源
- 无论我们是学习打字、演奏乐器,还是开车,我们的手势动作最初都是由前额叶皮层控制的,缓慢地、有意识地,一个接着一个地做出这些手势。然而,熟能生巧,随着时间的推移,所有的费力和笨拙都消失了,我们可以边谈论或思考其他事情边训练这些技能。反复练习之后就可以将控制权交给运动皮层,特别是基底神经节,它是一组皮层下回路,负责记录我们自动的和例行的行为。(P229)
- 为什么自动化如此重要?因为它释放了大脑皮层的资源。记住,顶叶和前额叶皮层就像一个普通的执行控制网络,会造成认知瓶颈,它无法同时处理多项任务。当我们脑的中央执行系统专注于一项任务时,所有其他有意识的决策都会被延迟或撤销。因此,只要有一个心理操作没有通过过度学习实现自动化,仍需要付出努力,它就会占用宝贵的执行注意力资源,使我们无法专注于其他事情,所以巩固是必不可少的,因为它使我们宝贵的脑资源可用其他用途。(P229)
- 要想取得进步,阅读和计算这些对我们最有用的心智工具必须成为我们的第二天性,通过潜意识来毫不费力地发挥作用。假如没有通过巩固打好自动化心智运作的基础,我们就不可能抵达教育金字塔的顶端。(P229)
2、睡眠的关键作用
- 我们已经知道,有规律地建地学习会更有效,与其集中一天死记硬背整堂课的内容,不如分时段安排学习。原因很简单,我们的脑会在晚上睡眠阶段巩固白天学到的东西,这是过去30天来最重要的神经科学发现之一。睡眠并不是一段不活动的时期,也不仅仅是在清理白天脑积累的废物。恰恰相反,在我们睡觉时,脑仍然在活跃,它按照一种特定的算法运行,重演它在前一天记录的重要事件,并将它们转移到我们记忆中存储起来。(P230)
- 白天刺激的增加会导致夜间脑的可塑性激增。(P231)
- 不同的睡眠阶段对学习说发挥的作用尚未完全确立,但似乎深度睡眠可以巩固和类化知识,心理学家称之为“语义记忆”或“陈述性记忆”;而快速眼动睡眠期间,脑活动接近觉醒状态,会强化视觉和运动的学习,即程序性记忆。(P231)
3、沉睡的脑会重演前一天的轨迹
- 脑成像显示,在睡眠期间,我们在前一天使用过的神经回路会被重新激活。(P233)
- 大量实验结果证实:脑在睡眠后的活动发生了变化,白天学到的一部分知识得到了强化并转移到更加自动化和特定的回路去处理。(P234)
- 大部分证据表明,睡眠中的脑不会吸收新的信息,它只能重演已经发生过的事情。掌握一项像学习一门新语言这样复杂的技能,唯一有效的方法就是白天多加练习,晚上睡觉时重新激活和固化我们所学到的东西。(P235)
4、睡眠期间的发现
- 只有睡眠才会产生真正的洞察。(P236)
- 夜间巩固并不仅限于强化现有的知识。白天获得的知识不仅得以存储,而且还以更抽象、更普遍的形式被重新编码。夜间神经元的回放无疑在这一过程中扮演着重要的角色,从而增加了大脑皮层最终发现合理规律的概率。此外,神经元以20倍速放电压缩信息。高速回放意味着在清醒时,激活间隔较大的神经元在夜间的序列中相邻。这种机制似乎是收集、合成、压缩信息和将原始信息转化为有用的、可开发的知识的理想选择,这真是人工智能巨头戴密斯·哈萨比斯(Demis Hassabis)对智能的定义。(P236)
- 请记住,我们的脑包含大量的内部模型,能够重新合成各种各样的真实的心理图像、现实的对话和有意义的推理。在清醒状态下,我们调用从外部世界获得的感官数据来选择最适合我们周围世界的模型,以适应环境。在这一阶段,学习是一个自下而上的操作,当我们面对内部模型的预测时,意外传入的感觉信号会产生错误信号,这些错误信号会沿着大脑皮层的层级向上攀升,并在每一步调整统计权重,从而使我们自上而下的模型逐步变得准确。(P237)
- 新的观点是,我们的脑在睡眠状况的工作方向相反,即自上而下。在晚上,我们使用生成模型合成新的、意料之外的图像,我们的脑的一部分在这些从零开始构建的图像上训练自己。这种强化的训练使我们能够完善自己的向上攀升的联结。因为生成模型的参数和它的感官结果都是已知的,现在更容易发现它们之间的联系。这就是我们越来越有效地提取隐藏在特定感官输入背后的抽象信息的原因。睡了一夜好觉之后,最细微的线索都足以确定现实的最佳心理模型,无论它多么抽象。(P237)
- 根据这一观点,梦不过是一组经过强化的图像训练。我们的脑依靠对现在的内部重建以增加白天必然有限的经验。睡眠似乎解决了所有学习算法都面临的一个问题:训练可用数据的缺乏。为了学习,目前的人工神经网络需要大量的数据集———但是生命太短暂了,我们的脑不得不利用白天收集到的有限的信息。人们发现睡眠可能是脑以一种加速的方式模拟无数事件的解决方案,而这些事件是人穷尽一生都难以真正体验到的。(P237)
- 当我们的心理模拟引擎运行时,它有时会遇到意想不到的结果,这有点像一个棋手,一旦掌握了规则,就可以花费数年时间来探索结果。······这就是我们的思维模拟器能提供的一种推理,无论是白天还是黑夜。我们能够生成如此复杂的心理场景的事实,突显了我们脑中存在的一些列非同寻常的算法。当然,我们在白天学习,但是夜间神经元的回放会增加我们的潜能。这可能确定是人类物种的秘密之一,因为启发性数据表明,我们的睡眠可能是所有灵长类动物中最深、最有效的。(P238)
5、睡眠、童年和学校
- 婴幼儿时期是我们学习算法的黄金期,也是学习任务量最繁重的时期。实验数据表明,在相同的时间内,孩子的睡眠效率是成年人的2~3倍。经过高强度的学习后,10岁的孩子比成人进入深度睡眠的速度要快得多,他们的慢波更强烈。实验显示,让孩子研究一个序列性的知识后去睡觉,第二天精神焕发地醒来后再检测,结果显示他们比成人发现了更多的规律。(P238)
- 在学龄前,即使是短暂的午睡也能增强孩子对上午所学知识的记忆。为了获得最大的益处,睡眠应该在学习过后的几个小时内进行。然而,这种益处只存在于经常午睡的孩子身上。既然脑会根据白天的刺激自然调节孩子的睡眠需求,那么强迫孩子睡觉似乎没有什么用处,当我们应该鼓励哪些有需要的孩子午睡。(P239)
- 美国儿科学会(American Academy of Pediatrics)强烈建议把推迟早上上学时间作为应对青少年肥胖、抑郁,甚至交通事故的有效措施。(P240)
结论、教育与神经科学的“联姻”
- 教育学和医学一样,是一门建立在或应该建立在精确的科学知识基础上的艺术。———让·皮亚杰《现代教育学》(P241)
- 认知心理学、神经科学、人工智能和教育科学的最近进展使我们拥有了当下关于人脑如何学习的系统认知:(P241 )
- 新生儿不是一块白板。早在生命的第一年,他们就已经拥有大量关于物体、数字、概率、空间和人的知识了。
- 孩子的脑不是一块顺从地吸收其环境里的架构的海绵。还记得四肢瘫痪的巴西盲人故事家费利佩和盲人数学家尼古拉斯·桑德森吗?他们的故事告诉我们,感觉输入可以被阻断或缺失,但是不会因此破坏孩子对抽象概念的理解。
- 大脑不仅仅是一个等待输入来塑造我们的可塑性的神经元网络。所有的大型回路在出生时就已经存在了,无论大脑的可塑性多么不可或缺,它也只能细化我们神经联结的最后一毫米。
- 学习不是通过简单地接触数据或听讲座来被动地进行的。相反,认知心理学和脑成像研究向我们表明,儿童是刚出道的科学家,会不断地提出新的假设。大脑是一个时刻警惕的器官,通过测试它投射到外部世界的模型来学习。
- 错误不是差生的标志。犯错是学习的组成部分之一,只有当我们的脑发现它的设想与现实之间存在差异时,才会调整自己的模型。
- 睡眠不只是一段脑的休息时间,它是我们学习算法不可或缺的一部分。在这段时间里,我们的脑会循环播放它的回路,以10~100倍的速度强化我们白天的经历。
- 最新的学习机器远没有超越人脑。至少目前,我们的脑仍然是所有信息处理设备中最快速、最有效、最能节能的。作为一台真正的概率机器,它成功地从一天中的每一个时刻提取了最大量的信息,以一种我们还不知道如何在计算机中再现的方式,在我们睡着时将其转化为抽象知识和普遍知识。
- 在计算机芯片与神经元、机器与人脑之间的普罗米修斯之战中,后者仍占据优势。可以肯定的是,原则上脑的机制没有机器不能模仿。事实上,我在这里展示的所有想法,计算机科学家都已经了如指掌,他们的研究明显受到神经科学的启发。然而,在实践中,机器还有很长的路要走。为了改进机器的性能,他们将需要我们在这里回顾的许多要素:允许概念灵活重组的内部思维语言;根据概率分布进行推理的算法;好奇心的功能;管理注意力和记忆力的有效系统;以及可能扩大训练集并增加发现机会的睡眠/觉醒算法。这种类型的算法已经开始出现,但它们距离新生儿的表现仍有几光年的距离。脑在与机器的对决中仍占据上风,并且,我预测这种情况还会持续很长一段时间。(P243)
- 13条可以带回家以挖掘儿童潜力的信息。太多的孩子没有充分发挥他们的潜能,因为他们的家庭或者学校没有为他们提供理想的学习条件。(P243)
- 不要低估孩子的能力。婴儿在出生时就拥有一套丰富的核心技能和知识。物体概念、数感、语言、对人及其意图的了解······这些基本技能将在他们以后的物理、数学、语言和哲学课程学习中再次被挖掘。我们要多利用孩子早期的这些直觉。他们学的每个单词和符号,无论多么抽象,都必须与他们的先验知识相联结。这种联结将赋予他们所学的内容意义。
- 利用脑的敏感期。在生命的最初几年,每天都有数十亿个突触被创建和消除。这种令人兴奋的活动使孩子的脑特别容易接受知识,尤其是语言。我们应该让孩子尽早接触第二语言。我们还应该记住,脑的可塑性至少会延续到青春期,在这个时期,外语沉浸可以改变脑。
- 丰富孩子的生活和学习环境。孩子的脑是最强大的超级计算机。我们应该尊重它,在孩子很小的时候就为脑提供正确的数据,单词、建筑游戏、故事、拼图······与孩子进行所有你认为深奥的话题的探讨,用专业准确的词汇回答他们的问题,向他们传达我们对世界的理解。给孩子提供一个丰富的环境,特别是语言环境,最大限度地促进他们的脑发育,延长他们的脑可塑性。
- 打消“每个孩子都不一样”的观念。认为每个人都有不同的学习风格的想法是错误的。神经影像研究显示,我们都依赖于非常相似的脑回路和学习规则。阅读和数学的脑回路在我们每个人身上几乎都是一样的,仅几毫米的差距——即使是盲童也是如此。我们在学习中都面临着相似的障碍,可以用同样的教学方法克服他们。个体差异,如果存在的话,更多地是孩子现有知识水平、动机和他们学习的速度的差异。谨慎判断孩子当下的水平,以便选择最合适的问题。但最重要的是,确保所有孩子都学会每个人都需要的语言、文字和数学基础。
- 培养孩子的专注力。专注力是学习的门户,如果信息没有先被注意力和觉知放大,那么我们机会不会记住它。老师应该成为吸引学生注意力的大师,并将他们的注意力引导到重要的事情上。这意味着要小心地消除所有让孩子分心的因素:插图过多的课本和过度装饰的教室。
- 保护孩子的活力、好奇心,参与意愿和自主性。被动的学生学不到东西。让他们更活跃,激发他们的聪明才智,让他们充满好奇心,不断产生心的假设。但不要指望他们能自己发现一切,要通过结构化的课程来引导他们。
- 让每一个上学的日子都变得愉快。奖赏回路是脑可塑性的重要调节器。通过奖励他的每一次努力来激活它们,让每一个小时的课堂都变得生动有趣。没有孩子对物质奖励无动于衷,他们的社会脑区对微笑和鼓励的反应也是一样的。被赞美的感觉和对自己进步的意思本身就是奖励。要消除阻碍学习的焦虑和压力,尤其是在数学方面。
- 鼓励努力。愉快的学习体验并不等同于“毫不费力”。相反,大部分有趣的学习,如阅读、数学或演奏乐器等,都需要多年的练习。认为一切都很容易的信念可能会让孩子以为,如果他们不成功,他们就是笨蛋。要向他们解释,所有的学生都必须努力,但他们努力的时候,每个人都会进步。要保持一种成长的心态,而非一成不变的心态。
- 帮助学生深入思考。大脑处理信息的程度越深,我们的记忆力就越好。永远不要满足于肤浅的学习,要着眼于更深层次的理解。记住亨利·罗迪格的话:“让学习条件变得更困难,从而要求学生投入更多的努力,这往往会增强记忆力。”
- 设定明确的学习目标。当学生清楚地知道学习的目标时,当他们看到他们可以支配的一切都朝着这个目标汇聚时,他们就会学得更好。清楚地告知你对他们的期望,并将重点放在实现目标上。
- 接受并纠正错误。为了更新他们的心理模型,我们的脑区必须交换错误信息。因此,犯错是学习的必要条件。我们不要惩罚错误,而要通过详细但无压力的反馈来迅速纠正它们。根据教育捐赠基金会(Education Endowment Foundation)的综合报告,教师提供给学生的反馈质量是推动学业进步的最有效杠杆。
- 定期练习。一次性学习是不够的,孩子需要巩固他们所学的东西。使其成为自动的和潜意识的反射性知识。这样的自动化状态可以解放我们的前额叶和顶叶回路,让他们参与其他活动。最有效的策略是腾出空间来学习,每天腾出一点点空间。间隔练习可以让信息永久印在记忆中。
- 让学生睡好觉。睡眠是我们学习算法的重要组成部分。我们的脑在每次睡觉时都会受益,甚至在我们打盹的时候也是。因此,让我们确保孩子睡得又长有深。为了最大限度的利用脑在夜间无意识的工作,在入睡前学习一节课或重读一道题可能是一个绝妙的诀窍。由于青少年的睡眠周期发生改变,所以我们不要太早叫醒他们。
- 只有更好地了解自己,我们才能最大限度地利用我们脑所配备的强大算法。(P247)
- 未来教育中家长的角色也应该有更重要的位置。他们是儿童发展的主要参与者,他们的行为早于学校教育的开始,晚于学习教育的结束。家是还在有机会通过工作和游戏扩展他们在课堂上学到的知识的地方。家庭学校每周开放7天,因此比起学校,家庭可以更好地充分利用清醒和睡眠、学习和巩固的每一次交替。学校应该在家长培训上投入更多的时间,因为这是最有效的干预措施之一:训练有素的家长可以成为老师的宝贵队友,也可以成为孩子困难的敏锐观察者。(P248)
第三部分:我的行动:
- 完成读后感,这是向好书致敬的方式。本书的读后感尤为难产,对大脑的触动太多,想法肆意,从读完到写完差不多5个月,我想某个时候这本书应该会读第二遍,结合实践写第二篇读后感。
- 读《人工智能:一种现代方法》,这也是我读《AI3.0》的读后感 https://book.douban.com/review/15148100/ 中的行动之一,书早买了很厚,一直没有行动,学习人工智能就是最好理解学习和理解大脑的方式,甚至没有之一。
- 精读论文《attention is all you need》,这既是对人工智能的理解,也是对大脑注意力机制的深入理解
- 读完《理解大脑》,这也是我读《计算机与人脑》的读后感https://book.douban.com/review/14760658/ 的行动之一,读了一个开头,了解越多越能感受到需要在大脑的科学常识上有更深入的学习和理解,知其所以然。
- 读完《贝叶斯的博弈:数学、思维与人工智能》和读《贝叶斯分析》,第一本也是我的《大脑传》读后感https://book.douban.com/review/14506137/ 的行动之一,之前读了一部分,本书中说“数学家及计算机科学家很早以前就已经从理论上说明了在不确定性面前推理的最佳方式。这一精准理论被称为“贝叶斯”,是以其发明者托马斯·贝叶斯的名字命名的(P057)”又撩起我想读的欲望。
- 读《脑与数学》和《脑与阅读》,这是本书作者的另外两部著作,如书中所言:“要想取得进步,阅读和计算这些对我们最有用的心智工具必须成为我们的第二天性,通过潜意识来毫不费力地发挥作用。假如没有通过巩固打好自动化心智运作的基础,我们就不可能抵达教育金字塔的顶端。(P299)”
- 读蒙台梭利的《童年的秘密》,书中所言:“实验结果表明,蒙台梭利的方法对儿童众多方面的发展都有积极的影响。(P172)”,家里小朋友在上蒙氏学校, 之前很粗浅的了解一些,本书多处提到蒙台梭利,同时前不久看到Elon Musk也在搞纯正的蒙台梭利教育学校Ad Astra Montessori https://mp.weixin.qq.com/s/ACLUl_tKD8wYgBi9kiwWAg ,需要系统化的学习和了解一下了
- 读《大脑健身房》,在《 斯坦福抗疲劳法》[5]中说:“大脑(中枢神经)是为了让身体运动而形成的,这种构造从原始时代至今并没有发生太大的变化。” 我感觉学习新运动是最好的健脑方式,很想深入了解运动和脑的关系。
第四部分:参考资料
- [0]、你们经常说的学术“大牛”,到底什么才是大牛?https://mp.weixin.qq.com/s/4rfFZPsOYKig1DNsBhrOjQ
- [1]、《大脑传》读后感:向最先进的大脑学习 https://book.douban.com/review/14506137/
- [2]、《计算机与人脑》读后感:冯诺依曼的必修课 https://book.douban.com/review/14760658/
- [3]、《埃隆·马斯克传》读后感:比幻想世界还精彩的现实世界 https://book.douban.com/review/15478510/
- [4]、Open AI CEO Sam Altman:提高工作效率的秘诀 https://mp.weixin.qq.com/s/62eTVsOi2OzggZ8sYIoq4Q
- [5]、《斯坦福抗疲劳法》读后感:疲劳是身体和大脑在呼唤更正确的生活姿势 https://book.douban.com/review/15650120/
- [6]、《苦涩的教训》:搜索和学习是最通用的方法 https://mp.weixin.qq.com/s/yc6-cozLFbWL1E14Nz_lQg
- [7]、2018年贝索斯致股东的信:保持企业内部高标准 https://mp.weixin.qq.com/s/lK_0B6htnPrV1xoDaLY0bg
- [8]、儿童发育过程DNS https://mp.weixin.qq.com/s/CJ6765zVzV0mhbUAPnCglA
- [9]、Elon Musk追求最大真实性的人工智能极其关键,AI不应被教导说谎 https://mp.weixin.qq.com/s/r6y_-6g7KRvvwixyxnV8uQ
- [10]、Paul Graham 两万字新文:如何取得杰出成就 https://mp.weixin.qq.com/s/31iL-Kbs4KrqpgrERVRNzQ
- [11]、数字大脑研究的未来十年:技术与计算交叉点的神经科学愿景 https://mp.weixin.qq.com/s/OeyDr3_r_R1DwWwHbG5qmg
- [12]、艾宾浩斯遗忘曲线 https://mp.weixin.qq.com/s/V3vVesZbYiiNxmO4rB-Gcg