《语言本能》:一万字全网最全解析
这篇书评可能有关键情节透露
《语言本能 (the language instinct)》是一本打着科普读物旗号的学术专著。他的作者史蒂芬・平克(Steven Pinker) 于1982年到2003年于MIT的脑与认知科学系任教,于2003年任职哈佛大学心理学教授,并在之后获得名誉教授头衔。MIT,“语言先天派”的语言科学家们的聚集地,Pinker可谓一员猛将。他在本书中通过详细解释乔姆斯基的理论,阐述语法,语音,大脑在语言方面的先天机制,主张“语言是一种人类本能,而非后天教化产物” 。为了全面系统地总结《语言本能》并给出自己的看法,我打算从这三个角度入手:1. 乔姆斯基的句法结构理论, 2. 先天论"人生而能言"的证据, 3. 难以抉择的语言争论
1. 乔姆斯基的句法结构理论
乔姆斯基认为,语言和人类的其他器官一样,需要从生物学和数学的角度去进行机制上的研究。他通过晦涩的句法结构的分析,去理解人类语言的先天机制 --- 而如同书中所说,外行人闻其名而不知其理论内容,“将乔姆斯基近25年来的著作束之高阁,书脊完好无损,书页从未翻动”。他认为,人类语言作为一种离散(discrete)组合系统,设计之精巧主要在两个方面: 1) 根据句法规则,将单词组成短语和句子; 2) 依据词法规则,将更小的元素组成单词。
1.1 原则-参数理论 (principles and parameters theory) (pp.102-107) 句子由不同的短语组成,短语又分为名词短语和动词短语。在这种理论下,名词,动词,介词和形容词的区分被打破,用统一变量X来表示;X-bar理论阐述短语和其他单词之间的关系。X-bar理论可以用短语树形结构图来表示,它并非是一种符号游戏,而是针对于我们大脑所设语言规则的一种假设:是这套规则掌握着我们的语法表达。另外,虽然存在一套超级规则限制着我们的语句表达,但是不同的语言之间,仍会存在语序差别。比如,日语和英语的差别在于中心语位置在前或在后。因此,我们可以将这些变量当作附加条件,语言学家们称这个条件作参数(parameter)。
1.1.1 名词短语 短语可以指涉世界上单一的事物或行为,而短语的意义取决于中心语 (head) 的意义。其次,中心语和它的论元(扮演角色,argument)构成次级短语(subphrase, 可写作V-bar或者N-bar),次级短语可用于描述对象与对象之间的关系。随后,短语中可存在一个或多个修饰语(modifier, 或者可叫作adjunct),它和论元不是一回事。最后,还有指示语 (specifier/SPEC),通常SPEC是一个实施者。
1.1.2 动词短语 动词可以被理解为是一个小独裁者,它决定了超级规则中所提供的哪些插槽可以得到填充。换句话说,主语和实施者必须得到动词的允许。比如,我们如何分辨“人咬狗”和“狗咬人”,这需要通过分辨动词来完成(在拉丁语中,是通过给被实施者结尾加上后缀来分辨的;而英语中则是靠动词)。
1.1.3 功能词短语 除了名词短语和动词短语之外,还需要有整个排列结构,将其转化为一个或真或伪的命题。功能词(function word)可以理解成是小型配件,里面包括冠词,代词等。功能词壁垒森严,而实词如名词却可以无上限添加(注:Pinker称,这就是为什么想在英文里添加中性代词如“hesh”,“thon”的努力以失败告终的原因)。
1.1.4 功能词 除了这些,我们还有更加复杂的句子,比如被动句。也是为了方便短语树状图的使用,乔姆斯基假设一种能够将深层结构(deep structure/ d-structure)映射转换为表层结构(surface structure/ s-structure)的转换规则(transformation)。这种转换规则下,由于转换操作而移动的短语会在其空出的位置上留下一个语迹(trace)。Pinker指出这样做的意义在于:"正是由于语迹的存在,表层结构才能囊括必要的信息,从而还原句子的意义,而原来的深层结构只是为了调取心理词典中的正确词条,本身不起任何作用(pp.120)。"
1.2 单词 Pinker在书中谈及的单词组成主要是以英文为主,而个人觉得和中文还是存在一定差别,因此在这不多加阐述。简单来讲,一般单词是由词根和词缀组成,而词汇的变形是根据英语单词的中心语来决定,中心语一般是指单词最右侧的语素;而还有一些单词并没有中心语,则词汇变形不同。除去这些繁杂的单词分类变形之外,Pinker指出,如果我们去测量现代儿童的词汇量,会发现他们是好几个莎士比亚。比如,普通高中毕业生所掌握的词汇数量在6万个左右;也就相当于孩子在醒着的时候是一个行走的“吸词器”。这样行走的吸词器到底是如何顺利发展的呢?—— Pinker举出了一个非常著名的例子:当土著人看到飞奔的兔子大叫“GAVAGAI“时,其他外地人为什么会偏向于把“GAVAGAI“理解为“兔子”,而不是“飞奔“等词汇?——这是因为人类大脑中先天就具备分辨物体,种类和运动的机制。更进一步,幼儿可以幼儿可以分辨无数的单词,是因为:假设世界上存在M种物体和N种行为,幼儿不必学习M乘以N个概念,而是学习M+N个概念即可。
2. 先天论"人生而能言"的证据
所以语言的先天后天之争到底结论是什么?我们可不可以通过模仿人类的语言机制,造出现代的智能语言机器?那我们必须先来看看争吵的两边都在说些什么:
2.1 语言争论 后天派学者主张,语言作为一种可习得的能力,是通过个体与外界环境的互动来逐步获得的。因此,语言是一种社会教化和规范,文化因素和社会因素至关重要。反之,先天派学者认为,语言能力是人类通过演化得来的本能 (instinct)。无论是乔姆斯基还是Pinker,他们都主张语言是一种人类与生俱来的生物学机制。因此,当我们研究语言本能时,应该着眼于语言背后的精密设计,就像研究蜘蛛结网,或者研究其他的人类器官一样。首先,Pinker给出两个证明后天学派错误的反例。在新几内亚,还生活在石器时代的土著人的语言的精细度和其他现代国家的语言并无显著差异。另外,在合乎语法的比率方面(正确使用其语法中的规则),黑人,劳工阶层和中产阶级,专家学者之前也无显著差异。甚至,后者低于前者。其次,Pinker列举孩子的语言发展和父母的教养并无直接关联的理由,来驳斥行为主义提倡的模仿理论(即孩子学习语言是通过模仿父母和周遭他者的说话方式)。两个都是大名鼎鼎的科学论证:克里奥尔化(creolization) 和输入贫乏论证(the argument from the poverty of the input)。
克里奥尔化(creolization) 由皮钦语Pidgin转化而来。皮钦语,指的是在大西洋的奴隶贸易和南太平洋的苦力劳动语境下,种植园主把不同语言背景的劳工聚集在一起进行奴役。劳工们为了互相交流,发展出了一种临时用语叫作皮钦语,其中包含了各式的词语,缺乏一定的语法规则。在这样的环境中,如果把刚开始学习母语的孩子放在皮钦语的环境中,孩子们会给皮钦语注入更加复杂的语法,从而创造出一种新的语言,叫作克里奥尔语。而且,语言学家们发现,从皮钦语到克里奥尔语的转化往往只需要一代人(在成年手语者和儿童手语者群体间,同样也被证实出现了类似的克里奥尔化)。
另一方面,输入贫乏论证 (the argument from the poverty of the input),指的是与刺激-反应理论所主张的不同,儿童并非完全通过模仿父母的语言刺激去习得语言。因为很多句子在儿童成长过程中是第一次出现,那么如何得以习得初次出现的句子?(这个论证对于行为主义盛行的当时可谓引起巨大波澜,但是对于此论证的科学实证却并不全面系统。)
2.2 语音理解机制 我们是如何知觉外界声音的?Pinker称,语音理解就好像人类的第六感,听觉信息都是“人们听到的声音,和实际的声音并不相同”。而人类的语音理解十分美妙和神奇,因为要想将一串离散信号(数字信号)和一串音流(模拟信号)相互转换是很困难的。具体来讲,声音是空气震动,而每一个语音都需要人类多个器官(肌肉)的配合。这是一种协作运动,而如果我们只关注在面部器官上,其实可以把不同的音素通过矩阵的形式表示出来。具体来讲,我们可以通过以下三个方面总共对应若干音素:
- 发声器官:喉头,软腭,舌面,舌尖,舌根,双唇
- 气流状态:摩擦,闭塞,通畅
- 器官状态:软腭是否张开,喉头是否震动,舌根是否紧张,双唇是否撮起
2.3 句法剖析器(parse) 句法剖析器和我们学英语时上课讲的分析主谓宾不同,它的定义是:当我们理解语言时,对句子结构进行分析处理的心理机制。句法剖析器是基于乔姆斯基句法结构之上的,通过短语树形结构图,用符号代表句子理解的路径。书中(pp.204-207) 中用详尽的例子进行了解释说明,可以将英文句子转变称简单的符号串。那么,如果人类内部存在句法剖析器,它与字串机 (word-chain device),还有所谓人工智能的语言处理器有何异同?Pinker所指的字串机,学名叫作有限状态机 (finite-state)/马尔可夫模型 (Markov model)。字串机如同其名,包含一堆单词词汇,可以从有限的单词中创建出无数的组合。当我们处理语言信息的时候,会先从某个列表中选取那个单词,紧接着在下一个列表中选取另一个单词(出现率高的etc),形成一个句子。与人类不同的是,它们记忆存储简单,但决策难,尤其是在处理语迹时;而人类的记忆是在7到9的范围内波动,决策快速。人工智能的计算机语言处理,模仿了人类语言处理的过程,大致可分为两种:
- 人类根据树形图,计算出每种可能性的意义,然后筛除可能性不大的选项(AI模仿人类,这种叫作宽度优先搜索,breadth first search)
- 人类每次都在做类似赌博的方式,然后以这种假设向前推进理解(AI模仿人类语言理解方式,管它叫作深度优先搜索,depth firtst search)
然而,句法剖析器并非毫无弱点。人类在理解洋葱句时(俄罗斯套娃的句式,比如三个has嵌套在一起的句子)异常艰难。有学者主张这是因为人类的短期记忆容量太小 —— Pinker否定了这一点,因为“记忆过载”和“难以卒读”完全不同。另一种说法是,人类在理解语言时,给每个短语类型标记一个号码;当某种短语类型需要被标记两次以上时,没有足够的空间去进行标记,因此短语变得难以理解。
2.4 儿童的语言发展 本章中给出了详细的幼儿到儿童阶段的语言发展和相关实证。首先,我们知道幼儿生下来不久就具备分辨音素的能力(能够分辨母亲和他人语音;分辨母语和其他语言要素的能力)。他们必须在生后的日月中,慢慢学会发音的过程:移动哪块肌肉可以发出什么样的声音;发出一连串的声音时,舌头应该放在什么位置,距离最短等—— 这是一项需要反馈学习。一岁半前后是幼儿的语言爆发期(burst),这个期间幼儿的语言能力(词汇等)呈爆发式增长。除此之外,语言发展是存在临界期的 (一般在6岁):如果在临界期前没有被暴露在充分的语言环境下,那么孩子的语言理解会迟缓甚至发展成为语言障碍(这样的例子在上个世纪屡见不鲜)。可为什么临界期会存在呢?心理学家发现,人类一旦学习完第一门语言,这样一套习得系统就显得多余,变得过于耗费能量。比如,大脑需要消耗身体1/5的氧气,卡路里和磷脂质。
这样的语言发展也有不少脑科学研究。我们发现,婴儿在出生之前,几乎所有的神经元都已经形成;但是大脑皮质(负责心智运算的领域)的厚度却在生后一年内极速增长。在人类的整个童年时期,脑白质都在不断生长以服务于更长距离的神经连接,而且传输速度变快,且具有绝缘作用的髓鞘。另外,婴儿的神经突触在2岁开始减少,并一直持续到青春期。
2.5 脑和基因科学研究的间接证据 我们已经通过无数的脑损伤案例,证明了语言(无论是语音还是手语)是人大脑左半球的工作。更具体来讲,大脑外侧裂是人类负责掌管语言的区域,大致可分为两个互相关联的脑区:布洛卡区(Broca's area)和韦尼克区(Wernickes's area)。区域也可进一步划分(到脑部更深处)。比如,像忘名症(anomia),就是患者可以正确地使用名词短语,但是无法将名字调取出来,放到短语中去——更细分的脑区掌管更精细的语言理解。同时,基因也被发现会对处理语法产生影响。然而,另一方面,这些科学研究有两方面的问题。第一,存在两位病人的病变区域一样,但是引发的语言障碍却不同;或是病人的病变区域不同,但是引发的语言障碍却相同的棘手情况。第二,此类研究都是基于刺激-反应研究范式,1)语言是一项多官能合作的任务,涉及到听觉,视觉等多个回路,难以分辨明确的刺激和反应关系;2)大脑活跃区域和语言处理实验课题虽然呈现高相关性,但是相关关系不代表因果关系;他们都只是间接的实验证据。
2.6 语言的演化 世界上之所以出现不同的语言,Pinker主要列举了以下三个要素。有意思的一点是,我们或许可以通过乔姆斯基的句法结构,用符号来表征不同的世界语言,从而使得不同语言之间可以进行比较。Pinker称,通过基因/语言谱系的假设,我们甚至可以推测晚期智人的发展历史he地理上的推移。换句话讲,人类学和人类进化生物学有帮助,语言可以帮助我们追溯不同种族的历史发展和地理分布。
- 语言革新/变异(如基因突变)
- 语言遗传(如基因遗传)
- 地理隔绝(如生活在新几内亚石器时代的土著人)
3. 难以抉择的语言争论
乔姆斯基在1957年发表的《句法结构(syntactic structures)》,无论是在行为主义盛行的当时还是现在,对心理学界都产生了巨大影响。他强调人类的语言能力是先天的,语言的研究偏向于自然科学,它应该与研究其他的人类器官的方法类似,应用数学和生物学。除去乔姆斯基新颖却晦涩的语法分析,曾和他一样在麻省理工任教的教授Pinker于1994年发表了第一版《语言本能(the language instinct)》。Pinker同样认为,我们生下来就有一套语言系统,这套系统规定了我们的句法结构。除了句法结构的分析外,他还列举了认知行为科学的研究,脑科学研究和基因研究等来阐述他的观点。即,在孩子生下来很小的时候,就具备了辨别多种语音音素的能力--- 而这正是语言发展的基本前提。(注: Pinker在本书中只是在讲 说,和听,两件事。写作和阅读作为后天能力,并未被划入讨论。)
以乔姆斯基为首的语言科学,主张的是人有一套关于句法的先天机制。这个机制和我们平时上课所学的英文语法或中文语法等不同;它是世界通用的,人类大脑中预先设计好的句法。此句法也不指主谓宾结构的分析,而是以短语为单位去分析。具体来讲,我们刚出生就具备了这套句法结构(即原则-参数理论, principles and parameters theory),然后通过所在的母语环境,对参数进行些微调整。也就是说,“人类出生时各项有关语言的参数都处于未经过设置的默认状态,等待着环境作为出发参数设定的条件(引用自《思维:关于决策,问题解决与预测的新科学》)”。比如,我们通过调整参数,来表征特定语言(日语/英语)的不同语序。
有了这套句法机制,我们便可以从心理词典中调取专门的词汇(名词,动词,助词等),然后填进句法结构里。为了方便表述和理解,研究者们会用短语结构树状图来可视化句法结构。而树状图之内,动词权力大,它决定了施动者和被施动者的关系,是给树状图施加限制的;名词无限多,因为人类可以无限地造出新的事物和对应的名词。树状图间,可以一整个短语插入合适的树状图位置中。除此之外,还有语迹(trace)等概念来解释,人是如何处理倒装句等句式,又是为何难以理解洋葱句一类的句式的。
3.1 普遍文法与相关质疑 我在最初了解到乔姆斯基的理论时,实在非常喜欢它的简约:几个简单的符号公式就可以表征出所有人类的语言,太神奇了!然而,在阅读的过程中,我会发现事情并不像想象般简单 —— 除了公式外,我们需要设定不同的参数,还要注意不同的动词带来的变化。另外,虽然乔姆斯基派学者主张“如无必要,勿增实体”,但不同语言中还是会存在不同的特例,需要研究者去增加附加项---仍然避不开冗余性。同时,反对乔姆斯基句法结构理论的学者们,可以通过找出个例来反驳他。而只要找到一种语言是不符合这个公式的,就会全面驳倒乔姆斯基的语言理论 —— 这样一来,乔姆斯基派和反对派间的斗争便有些“烦闷无聊”:一方试图找出反例,另一方通过对反例的再次解释进行驳斥。
提到针对乔姆斯基语言学理论的驳斥说法,不得不提一本小书叫作《思维:关于决策,问题解决与预测的新科学》。其中的第4章“递归和人类思维:为什么毗拉哈语里没有数字(recursion and human thought: why the PIRAHA don't have numbers)” 是语言学家Daniel L. Everett对乔姆斯基的驳斥。具体来讲,就是Everett通过自己30余年调查毗拉哈语的经验,发现此种语言是没有递归的—— 递归是普遍文法(universal grammar)的基础。若果真如此,毗拉哈语就成了乔姆斯基-平克语言本能论的特例。换句话说,递归虽然是人类思维的重要特征,但乔姆斯基派学者给予了它过高的,至高无上的地位。于是,两派的争论就变成了:-“毗拉哈语里明明有递归!” “不,它没有!”- “你看,你现在的论文和你以前的论文前后矛盾!” “那是因为我学识增加了!”-“别的研究里可以看出来毗拉哈语有递归!” “我研究了30年得出的结论,你行你上啊!”
3.1.1 作为“特例”的毗拉哈语 让我们再次询问:“世界上到底存不存在没有递归的,有限语言?” —— 对此,Everett说道,如果生活的环境有意限制你能够说的话题数量,而这种限制不仅因为环境限制所带来的眼界宽窄,还因为当地文化中明确的价值导向,那么很有可能会发现有限的语言。毗拉哈人不会查数,毗拉哈语里没有数字,而计数制是建立在递归至上的(Gordon, 2004)。对于毗拉哈语没有递归的原因,Everett强调,毗拉哈人有特定的思维模式,就是不去讨论未发生的事情;而作为西方文化,他本人自己,都经常靠没有客观存在的“想象力”进行思考,然后发出语言 —— 他强调文化环境对人类施加的限制。 —— 在我看来,这当然是个有趣的讨论,但却不足以构成一个争论(argument)。因为“我不能”和“我不去做”本身是两回事。不能因为文化所施加的限制,就去否定先天语言机制的存在。如果对乔姆斯基派和Everett“反乔姆斯基派”做个总结,那就是《思维:关于决策,问题解决与预测的新科学》中的这样一句话:
他们(chomsky)认为递归起源于语言,然后渗透到了其他思维过程中;而我认为递归本就是大脑的思维方式之一,它可以渗透也可以不渗透到人类的语言中。递归不像是语言的必需属性,当然更不是语言独有的属性。《思维:关于决策,问题解决与预测的新科学》
3.1.2 无从得知的心理词典 另外,在Pinker的《语言本能》中虽然非常清晰地阐述了乔姆斯基的理论:普遍文法 (universal grammar, UG) 和生成文法 (generative grammar);但“心理词典”作为一个必备的前提概念,其具体内容和相关研究却在书中却鲜有提及。阅读完《语言本能》后,我只知道心理词典是类似心理版的词典,人类可在其中提取所需词汇;而这个心理词典到底是如何形成并一步步发展起来的,它和句法结构之间的语言处理过程(或链接过程)是如何;它有什么样的限制,有没有认知神经科学研究的直接证据 —— 却无从得知。
3.1.3 第二语言学习(SLA) 和普遍文法 对于乔姆斯基学派如何理解第二语言学习者,我也存在疑问。《语言本能》中举出了普遍文法确实存在的实例,比如皮钦语和手语的更迭;但我作为一个多语言学习者,是在语言的临界期之后才开始学习日语和英语。那么,如果句法结构是在人类当中普遍存在,我在这个学习过程中,还会犯上述句法结构的错误吗?——若按照乔姆斯基的理论来思考,则我不会犯普遍文法的错误,因为句法结构的原则是普遍的。而我大概会犯参数(parameter)的错误,因为不同的语言间的参数不同。可实际是怎么样的呢?关于“第二语言和UG是什么关系”的问题,我去读了点Lydia White的书 <Second language acquisition and universal grammar>(下图)。White是第二语言学习和乔姆斯基普遍文法的著名研究者,在这本书中她说普遍文法(UG)引导且限制了第二语言的学习过程,UG和语言能力相关,但UG并非语言获得的理论;第二语言学习和母语学习是两个不同的过程。
3.2 关于乔姆斯基理论的验证和应用的疑问 《语言本能》花了很多篇幅来解释乔姆斯基的语言理论,但其余章节的展开叙述却让我感到不能解决我所有的疑虑。比如,我们需要用认知神经科学的方法论,去在人类大脑中找到实证,证明作为语言科学基本理论的普遍文法和生成文法。然而,《语言本能》中仅提出了简单的比较研究,比如,患有某种语言疾患的人们和正常发展的人们进行比较后发现,大脑在处理语言类讯息(或者更进一步,处理语法时),大脑局部的特定领域的活跃度有显著差异。然而,这样的方法论存在2类问题:
- 语言是一项多官能合作的任务,涉及到听觉,视觉等多个回路,难以分辨明确的刺激和反应关系;大脑活跃区域和语言处理实验课题虽然呈现高相关性,但是相关关系不代表因果关系,它们都只是间接的实验证据。
- 大部分研究的范式是刺激-反应模式,即一个实验者提示某种实验刺激,被试则给出一个反应。但是,这种范式可以理解为因果颠倒的描述科学。比如,当一个科学家A问,某个事物X的内部表征(association) 是什么时,另一个科学家B会通过描述这个表征(連合)的特征来回答(“这个表征是由a-b组成的”)——可这是到底是表征(連合)产生了a-b,还是a-b产生了表征,这很难解释。
对此,乔姆斯基给出的结论是:“除了将语言科学与生物科学靠近,或许没有其他更合适的方法。”
另一方面,关于乔姆斯基理论的实证证据,除去后天的语言学习者与母语语言学习者之间的比较外,那些先天具有发展障碍的儿童们,他们与正常发展的儿童之间,在句法结构方面又有何不同?而这种不同,又是如何应用到语言障碍者的支援上的呢?具体举例的话,比如发展障碍中的自闭症(autism),他们的人际交流能力是存在缺陷的。那么:
- 很多自闭症儿童的家庭会报告说,他们的孩子在刚生下来的一年内都是正常发育的;然而到了一年以后,孩子的语言能力突然退化,那就感觉像是“他在一点点从我们身边消失”—— 学术上称作退行(regression)。这种退行现象和乔姆斯基所主张的生成文法有什么联系吗?
- 如果“人生下来不是一张白纸”,而是有规定好的语言机制,那我们在支援先天具有语言类障碍的儿童时,应该采取一种什么样的治疗方式?我们应该如何把乔姆斯基的语言科学理论带入到实际的应用研究中去?除了研究有靶向性的药物以外,还有没有其他认知行为科学的支援方法?
简单查阅论文后,发现其中绝大多数是研究不同的先天性发展障碍者在语法使用方面的比较研究(比如自闭症和唐氏综合症间使用语法的差异etc),另外还有些很有趣的研究,比如:Does imitation facilitate the acquisition of grammar? Evidence from a study of autistic, Down's syndrome and normal children。最后,对于我提出的第二个问题,貌似并没有太多的研究可供参考。anyway,它们实在是太有趣了,就到这里!
本文同步发于本人公众号: 温舍1900 (会日常更新一些读书笔记和心理学,日本的相关内容)
参考阅读/引用资料
- Gordon, P. (2004). Numerical cognition without words: Evidence from Amazonia.Science,306(5695), 496-499.
- O’Grady, W. (2010). Emergentism. In P. Hogan (Ed.),Cambridge encyclopedia of language sciences(pp. 274-276). Cambridge: Cambridge University Press.
- Tager-Flusberg, H., & Calkins, S. (1990). Does imitation facilitate the acquisition of grammar? Evidence from a study of autistic, Down's syndrome and normal children.Journal of child language,17(3), 591-606.
- 《语言本能》乔姆斯基访谈录
- 《语言的科学》史提芬平克
- 《思维:关于决策,问题解决与预测的新科学》Edg