烟老和梦对《对伪心理学说不》的笔记(13)

对伪心理学说不
  • 书名: 对伪心理学说不
  • 作者: 基思•斯坦诺维奇
  • 页数: 254
  • 出版社: 人民邮电出版社
  • 出版年: 2012-1-1
  • 第1页 序言

    译者序

    心理学研究虽然涉及广泛的人的客观行为和心理现象,但作为心理学的研究对象必须满足“可检验”这一标准,超验的、超感观的问题不在科学心理学的研究之列。

    科学心理学所有的预测和解释都基于客观数据,所有的结论都具有概率的性质,有一定的适用范围和条件,干预方案也必须符合客观的心理和行为规律。因此,没有能够完美解释一切现象的心理学理论,也没有超出人类经验以外的干预和应用。

    弗洛伊德所构建的这些精巧的理论很难用实证的方法加以验证。

    主流的科学心理学已经在实证主义的道路上行进了很远。心理学是一门科学,必然要遵循科学的标准,即研究的必须是实证可解的问题;方法上要遵循系统的实证主义;研究结论要能够被重复验证,并能够经过同行评议获得认可。——这三条标准也是区分科学心理学和其他伪心理学的分水岭。

    心理学的研究因此也与操作定义、实验组和控制组、变量控制、数据统计等词汇联系起来,而不是个人化的体验及感悟、头脑风暴或纯粹的逻辑推导。

    是什么阻碍了公众了解和认知真正的科学心理学?

    ①大众的特殊期待。

    大多数心理学研究则针对的是群体的普遍行为规律,偏重于解释和预测,其研究结论都具有概率性和领域特异性,因此无法有针对性地、面面俱到地解决个体所有的心理问题。会失望。

    ②术语体系产生的阻碍。

    心理学作为科学,为了让研究者之间形成共识并利于重复验证,产生了一套严谨的术语体系。

    ③心理学许多基础研究确实和大众生活有一定的距离。首先是因为这些研究往往是控制十分严密的实验室实验,探讨的是最基本的生理、行为和机制,有些唤起特定反应的刺激可能在日常生活中几乎不可能出现;很多成果转化为实际的应用需要一段时间,有的研究发现甚至要几十年后才能体现出其应用价值。滞后性——毫无意义错觉。

    ④许多学院派心理学工作者的做法也难辞其咎。

    好的研究应当“现象为师”,即从社会生活现象出发去发现问题、做出假设、收集观测数据、进行验证,最终得出的结论也应该能在一定程度上解释或解决现实问题。

    但许多研究者往往是从概念出发,空对空地进行一些干瘪乏味的研究,结论的实用性和推广性十分有限;另外,学院派的心理学工作者普遍的一个问题是,醉心于研究而不注重或不善于将成果进行普及和推广。

    ⑤大众媒体在科学心理学的传播方面做的并不够好。

    序言:

    心理学也许比其他科学更需要批判性的思维能力,这种能力使学生能够辨别良莠,将真正的科学与其他伪科学区别开来。

    思维工具:

    ①将使我们能够对某些观点的合理性做出一个初步和总体的判断。②这些技巧提供了一些评估“专家”观点可信度的标准。

    2019-06-25 16:32:21 回应
  • 第1页 第一章心理学充满生机

    一、弗洛伊德问题

    许多刚入门的心理学学生会惊讶地发现,如果对APA(美国心理学会)会员中所有认同弗洛伊德精神分析的人数进行一下统计,他们的人数居然没有占到会员总数的10%,在另一个主要的心理学组织APS(美国心理协会)这一比例也不会高于5%。

    在现代心理学家所关注的大量研究主题、数据和理论中,弗洛伊德的工作只占其中极小的一部分,在这些研究和理论中占更大比重的则是近期5位诺贝尔奖得主所做的工作:

    大卫·胡贝尔、丹尼尔·卡尼曼、赫伯特·西蒙

    罗杰·斯佩里、托斯腾·维瑟、理查德·阿特金森

    弗洛伊德根据他得到的数据(个案研究和内省)建立了一套精细的理论,而这些数据并不足以支撑此理论,他专注于构建复杂的理论构建,但并没有像许多现代心理学家那样,保证这些理论建立在可靠、可重复的因果关系之上。

    二、现代心理学的多样性

    美国心理学基金会杰出教学奖得主亨利·格雷特曼将心理学描述为“一个松散地联合在一起的学术王国,它横跨了生物科学和社会科学两个领域。”

    心理学有着令人惊叹的广泛性和多样的调查方法,知道这一点对于理解心理学的本质至关重要。譬如美国心理学会APA有53个分支机构,每个分支都代表了一个特定的研究或应用领域,而分支机构中的每一个都是非常宽泛的研究领域,包含更小的不计其数的分支。

    三、多样性的含义

    构成心理学的不是一整套宏大的理论,而是许许多多不同的理论,每个理论仅能够解释行为的有限方面。心理学的多样性使得理论整合变得极为困难,事实上,在许多心理学者看来,“整合”本身就是“不可能的任务”。

    尽管如此,在过去的十年间,心理学的学科统一性有所增强,这要归功于进化心理学家的努力。这些研究者将人类心理过程视为服务于某些重要进化功能的机制,并试图以此来实现概念的整合。

    但基本上是极其困难的。

    物理学也被分为力学、热力学、光学、声学和电学。化学也被分为无机化学、有机化学、物理化学和生物化学。

    从内容上来看,现代心理学绝不仅仅是多个主题的简单统一体,人们必须在更高层次上寻找整合这一学科的因素。

    事实上,“心理学研究”这一术语要比“心理学”一词更能准确反映这一学科的多样性。而且用“心理学研究”能让学生不再惊讶于同一学科的不同领域取得科学进步的速度竟然如此迥异——一些领域在解释和预测行为方面取得了显著成就,而另外一些则是成果寥寥。

    四、科学的统一性

    仅说心理学是关于人类行为的科学,并不能将它和其他学科区分开来。(经济学家、小说家、法律、社会学、历史、政治科学、人类学或文学研究)

    应用性也不能证明心理学具有任何独特性。(帮助他人:社会工作、教育、护理、职业咨询、物理治疗、警事科学、人力资源以及语言矫正等。提供咨询:教育、社会工作、护理、神职工作、职业咨询)

    只有两点能证明心理学是一门独立的学科。①心理学研究采用科学方法来探究人类及动物的所有行为②从这一知识衍生出的实际应用是具备科学基础的。

    它试图向公众保证两点:①心理学中有关行为的结论都有科学证据②心理学的应用都来源于科学方法,并经过了科学方法的检验。

    心理学的首要特征——它是有关行为的、以数据为基础的科学研究。

    五、什么是科学

    科学,是一种思考和观察事物以便深入理解其运行机制的方法。

    科学的三个相互关联的重要特征:①应用系统的实证主义②产生公共知识③验证可解决的问题。

    1)系统的实证主义

    实证主义:基于观察的实践

    观察很好,而且很有必要,但是对于自然世界单纯的、非结构化的观察并不能导致科学知识的产生。

    科学观察被称为“系统性的”,是因为它是结构化的,所观察的结果能够揭示自然世界一些潜在的本质。

    2)公共性的、可检验的知识:可重复性和同行评审

    “公共性”指的是这样一个事实,即科学知识并不单独存在于特定个体的头脑之中。从某种重要意义来说,科学知识在没有提交给科学团体、接受他人批评和验证之前是根本不存在的。

    那些被认为隶属于特定个体思维过程中、不可接受他人审查和批评的“特殊”知识,永远都无法获得科学知识的地位。

    “可重复性”一项发现如果想在科学界获得公认,就必须以一种能够让其他科学家尝试相同实验并获得相同结果的方式呈现给科学团体。

    可重复性保证了特定发现并不是由于个别调查者的错误或偏差而产生的。

    正是相互联系使得科学累积性地发展。研究者不断在原有知识的基础上进行新的探索,力求超越已知。而这一过程的前提是先前的知识以一种适当的方式予以陈述,使任何研究者都能以之为基础来进行探索。

    “公共性的、可检验的知识”指的是我们可以将研究发现递交给科学团体,团体中的任何人都能对其进行重复检验、批评或拓展。

    当公众面对真实性可疑的科学发现时,一个屡试不爽、颠扑不破的标准就是,考察这些发现是否在得到认可的科学期刊上发表过,以及是否经过了同行评审?

    同行评审是指每一篇投到期刊的文章都要经过数位科学家的评审,并将批评意见递交给编辑(通常都是此期刊所覆盖的某一领域中有资深研究经历的专家),再由编辑权衡这些意见,确定这篇文章可以立即发表,还是需要进一步实验研究和统计分析之后再发表,或是因为有缺陷或价值太低而拒绝接受。大多数期刊在每期中都刊有编辑条例说明,因此很容易知道此期刊是否经过同行评审。

    并非所有经过同行评审的科学期刊中的信息都必然正确,但至少它已满足了同行批评和监督的标准。这只是一个最低标准,而非严格的标准,因为大多数学科领域中都会有几十种质量参差不齐的期刊。大部分科学观点在满足一些基本标准的前提下,都可以在某些地方以正规的方式出版。

    那种认为只有很小部分的数据和理论才能够在科学界获得出版的观点是错误的。

    出版物《心理学摘要》罗列了来自1000多种不同期刊的文章摘要。其中大部分期刊都设有同行评审。

    注意,发表只是一个最低标准,关键是,任何一种理念、一个理论、一项主张或疗法如果不能在有同行评审的学科文献中获得适当的收录,问题就很明显了。

    同行评审机制在不同学科之间有所区别,但是根本理念是相同的,同行评审是科学将客观性和公开评议标准制度化的一种方法。(另一种是重复验证)

    观点和实验要提交给其他评估者,经过一个仔细推敲的过程。只有通过这一严格过程的观点才算符合了公共验证的标准。同行评审过程绝非完美,但它对我们消费者来说是唯一的保护机制。

    3)实证性的、可解决的问题:科学家对于可检验理论的研究

    科学针对的是可解决的、可明确具体的问题。这意味着就其类型来说,科学家们所致力解决的问题是能通过现有的经验技术获得答案的。如果在当前所掌握的经验技术条件下,问题无解或理论不可验证,则科学家们将不会对它展开研究。

    “人性本善还是人性本恶?”“生命的意义是什么?”就不是实证问题,不属于科学领域。

    科学通过以下方式得以进步:提出理论解释世界中的特定现象,根据这些理论做出预测,实证地检验这些假设,基于检验的结果对理论进行修正。(通常次序为:理论→预测→检验→修正)。

    因此对于科学家来说,“可解问题”这个词的意义通常是“可检验的理论”。

    什么是可检验的呢?这一理论必须与真实世界中可观察的事件具有特定的关联。

    注意,有些当前无法解决的问题,在理论和经验技术更加进步的时候会成为可解的。这就是科学得以发展而新的科学得以诞生的方式。但对于“当前什么是可解的”这一问题,总是存在巨大分歧。因为涉及正处于模棱两可状态的问题,科学家们自己在这点上的意见都难以统一。因此,尽管所有科学家都认同可解性标准,但是他们对其特定应用可能存在不同的意见。

    在人们意识到可以以实证的方法来解答之前的几个世纪里,都只能被猜想而已。→随着这一认识的慢慢发展,心理学逐渐集合了来自各个领域中关于行为的各种问题→心理学科逐渐脱离哲学,并成为了一门独立的实证科学。

    认知心理学家史蒂芬·平克尔讨论了“未知”可以划分为“问题”或“玄谜”。如果是“问题”,我们知道其答案是能找到的,即使我们目前还没有答案,我们也知道它大概是什么样子。如果是“玄谜”,我们甚至不能想象答案可能会是什么样子的。

    五、心理学和世俗智慧:“常识”的误区

    我们每个人都有一套固有的行为模型,这些模型影响我们的交往以及我们如何看待自己和他人。事实上,一些社会、人格和认知心理学家正在探究这些内隐的心理学理论的本质。

    我们会很少清晰并有逻辑地表达我们的理论,相反,我们通常只有在特意关注它们或者发现它们受到某种挑战时,才会意识到他们的存在。其实,我们个人的行为模型并不像真正的理论那样具有内部一致性,相反,当我们觉得需要对行为做出解释时,往往搬出一箩筐关于人类行为的普遍真理、说教及谚语。

    这类谚语和俗话构成了对行为的固有“解释”,人们爱用它们,就是因为它们难以驳倒。不管发生什么事,都可以拿一条出来解释一番。难怪我们都认为自己是判断他人行为和人格的高手,天底下发生的事我们都能解释。

    心理学研究表明,在接受实证检验后,许多关于行为的普遍文化信念都被证明是错误的。

    譬如“工作经验对于高中生是有价值的。”是一个普遍信念。发展心理学们就打工对中学生行为、态度及学业成绩的影响进行了广泛研究。而研究后,“打工似乎有可能引发而不是阻止了某些形式的不正当行为。”

    世俗观念出现谬误的例子俯拾皆是。

    “心理学公理”:“虽然没有确凿的证据支持,却因不断的重复,改变了我们体验生活的方式,而被当成事实的那些信念。”

    世俗观念并不总是不受事实的制约。有时,当与之矛盾的事实广为人知时,世俗心理学也会改变。

    昨日的常识往往变成今天的谬论。毕竟常识就是“尽人皆知的事实。”

    心理学扮演着一种世俗智慧检验者的角色,常常难免和诸多根深蒂固的文化信念发生冲突。心理学往往是“传递坏消息的信使”,宣告原本为人们所接受的世俗观念再无立足之地。

    六、心理学是一门年轻的科学

    心理学总是处于两难境地,一方面,一些人反对把心理学称为科学,否认心理学可以建立关于行为的实证理论,另一方面,另一些人则由于惧怕心理学在某些行为领域揭示的真相会威胁到他们的信仰,而反对心理学家在这些领域进行研究。

    小结:心理学是一个主题非常广泛,但又相对松散的学科,它包含一些通常不被归入同一概念的众多研究主题,然而,它们都使用科学方法来理解行为,从而实现了学科的统一。

    科学方法绝非是指一套生硬的规则,而是指一些普遍的原则。最重要的三点是:①科学采用系统的实证主义的研究方法②它以可公开验证的知识为研究对象③它研究实证可解的问题,并产生可检验的理论。

    2019-06-25 19:25:53 回应
  • 第47页 第二章可证伪性

    一、理论和可证伪性标准

    科学理论的表述应该遵循这样的原则——从中得出的预测有可能被表明是错误的。因此,对某理论的新证据进行评价,必须使新的数据具有证伪该理论的可能性。这项原则通常被称为“可证伪性标准”。

    可证伪性标准主张,一项理论如果有用,它所做出的预测必须是明确的。理论必须两面兼顾,也可以说,这项理论在告诉我们哪些事情会发生的同时,应该指出哪些事情不会发生。

    如果不会发生的事情确实发生了,我们就得到了一个明确的信号——这项理论有问题:它可能需要修正,或者我们需要去寻找一个全新的理论。不管哪种方式,我们将最终有一个更接近真理的理论。相反,如果一项理论预测包括了所有可能观测到的数据,那么它将永远不能被修正,同时我们将禁锢在当前的思维方式中,失去了取得进步的可能。

    这就是说,一项成功的理论并不是可以用来解释所有可能的结果,因为这样的理论本身就丧失了任何预测能力。

    关于理论的常见误解:“噢,这只不过是一种理论。”这句话代表了外行人使用“理论”这个词时通常所指的意思:一项未经证实的假设,一个纯粹的猜想或直觉。这意味着一个理论与其他理论并无优劣之分。

    “理论”这个词在科学上指的不是未经验证的猜想。

    科学上的理论是一组具有内在联系的概念,它们能对一组数据做出解释,并对未来实验的结果做出预测。

    假设是从理论中产生的具体预测(理论则更加普遍和全面)。

    目前可行的理论是那些产生了一些假设,并且其中许多已经得到了验证的结论。因此这种理论的理论结构与大量的实证观察相一致。然而,当观察数据开始与理论中提出的假说相矛盾的时候,科学家们会尝试构建一个能为数据提供更好解释的新理论。(或者,在更通常的情况下,只是修正已有的理论)因此,目前在科学范畴内所讨论的,都是在一定程度上已经被证实了的、所做出的预测并没有与现有的数据相矛盾的理论。

    它们并非纯粹的猜想与直觉。

    二、敲门节奏理论

    越精细的预测在被证实的时候会给我们越大的触动。要注意,不管怎样,精细度的变化和可证伪性直接关联。预测越具体和精细,有可能证伪它的观测现象就越多。

    好的理论做出的预测总是会显示自己是可证伪的。坏的理论不会以这种方式把自己置于危险的境地,它们做出的预测是如此笼统,以至于总会被证明为正确的。

    事实上,当一种理论被置于“不可被证伪”的保护下,那么可以说它已经不再是科学了。

    三、弗洛伊德与可证伪性

    弗洛伊德的理论使用一个复杂的概念结构,在事后解释人类行为,但并不做事前的预测。它可以解释一切,但是波普尔认为,也正是这个属性使得它在科学上无用。它不做具体的预测。精神分析理论的拥护者在使这个理论成功地成为事后解释的丰富资源时,也剥夺了其所有的科学实用性。

    它在心理学的地位日益下滑,部分原因就是未能满足可证伪性标准。

    那些毫无用处的解释是诱人的,因为它们似乎能对事情进行解释。事实上,它们都是在事后对所有事情做出解释的。然而,它们提供的解释不过是制造了理解的幻觉。由于总试图在事后解释一切,它们也就堵死了前进的大门。

    只有当一种理论并不预测所有事情,而是提出具体的预测——提前告诉我们哪个特定的情形会出现时,该理论才会出现进步。当然,从这样的理论推导出的预测可能是错误的,但这是优势,而非缺点。

    四、不是所有的证实都等价

    许多人认为,一个好的科学理论就是被多次证实的理论。他们假设,被证实的次数是对理论进行评价的关键。但是,可证伪性原则意指,理论被证实的次数并不是最重要的因素。因为并不是所有的证实都是等价的。

    证实能否令人信服,取决于预测在何种程度上将自己暴露在可能被证伪的情景下。一个非常具体的、可能被证伪的预测,比20个不可证伪的预测拥有更强的说服力。

    波普尔经常指出,“这些(不可证伪的)理论拥有巨大的心理吸引力,其秘密在于它们能够解释一切事情。预先知道无论什么事情发生,你都能理解它,不仅给你智力上的掌控感,而且,更重要的是,让你拥有应对这个世界所需的安全感。”

    但是这种安全感的获得并不是科学的目标,因为对这种安全感的追求是以知识发展的停滞为代价的。科学是一套不断挑战原有信念的机制,在这种机制里,原有信念以一种能够被证伪的方式接受实证检验。这一特点往往使科学与所谓的世俗智慧或者常识直接发生冲突。

    五、可证伪性和世俗智慧

    心理学威胁到世俗智慧所提供的安逸感,因为作为一门科学,它不能只提供无法被反驳的解释。心理学的目标是对各种行为理论逐一进行实证检验和筛选。

    心理学不追求那类事后能解释一切,但事先无法做出任何预测的理论,不追求这种解释系统所带来的安逸感。它不接受那些被设计得永不可变、并代代相传的世俗智慧体系。

    现代思潮中有一种危险的倾向——认为应避免让一般大众知道世界的真正本质,一种无知的面纱是必要的,以防公众面对真相时手足无措。

    六、承认错误的自由

    科学家们发现,可证伪性原则的一个最具解放意义和最有用的启示是:在科学上,犯错并不是罪过。被证伪的假设为科学家们提供了信息,他们可以用来调整理论,使理论更紧密地数据相一致。

    哲学家丹尼尔·丹尼特曾说过,科学的本质就是“在公众面前犯错”。当数据与理论不符时,通过对理论进行不断地修正,科学家们最终构建起能更好地反映世界本质的理论。

    这也可以对科学之外的领域有所启示。当我们的信仰与观察到的事实相冲突时,我们最好是调整信仰而不是否认事实和坚持错误的想法,这样我们将会少遇到一些个人和社会问题。

    物理学家罗伯特·奥本海默认为:“每个人在训练自己的推理能力时都要学会这一点,当他回顾过去时会说“这个问题我当时没想明白”。生活中的人们也需要这种能力,即脸不红心不跳地说“我当时搞错了。”而科学能让认错每时每刻都发生。你注意到某些东西与你已经思考了很久的事情相冲突或不一致,它会触动你改变想法。这与人们没完没了地去寻找一些合理说法来为自己先前的错误辩解的做法完全不同。”

    在科学中犯错是正常的,对于科学进步来说,真正的危险是人类有一种固有的倾向,即避免让其信仰暴露在可能被证明是错误的情景之中。

    “一个真正开明的人愿意跟随证据的引导。开明的人愿意听从公正的调查,而非他自己的预测。科学方法是对世界的印证,而不是对我们自己的印证。”

    雅各布·布洛诺夫斯基在他的许多文章中指出,科学那种揭示世界真知的独特力量,并不产生于科学家们独特的德行。(即他们是完全客观的、他们在解释研究结果时从不带偏见等)。实际上,这种力量的产生是因为会犯错的科学家们身处一个证实与平衡的程序中。在这个程序中,总会有其他科学家提出批评并发现他们同行的错误。

    科学家和和其他任何人一样容易犯错,但认识到他们及其所属团体的犯错根源之后,他们设计出精巧的系统来约束自己,努力防止自身弱点和偏见影响自己的研究结果。

    心理学家雷·尼克尔森以一种更为幽默的说法道出相同的观点:科学家们的虚荣心实际上在科学进程中起着作用。“科学家对自己的想法抱有的批判性态度并没有在很大程度上导致科学的成功…更真实的情况是,每个科学家都积极地想要证明某些科学家所持有的观点是错误的。”

    七、想法不值钱

    某些类别的想法不值钱。

    生物学家和科学作家史蒂芬·古尔德对此有所阐述:

    “15年的月刊专栏写作生涯,让我收到各个科学领域非专业读者的海量来信...我发现一个常见的、同时是压倒性的错误观点。人们会告诉我他们提出了一项革命性的理论,它会拓展科学的边界。这些理论通常以单倍行距打印在几张纸上,内容通常是对最深层的终极问题的猜测一一什么是生命的本质?宇宙的起源?时间的起点?但是,这些想法不值钱。任何智力正常的人都能在早饭前想出几个这样的念头。科学家们自己也很容易就能想出来。但我们不这样做(或者说,我们只让它们留在自己脑子里),因为我们不能找到方法来验证它们,以决定它们的对错。一个既不能被证实也不能被证伪的可爱想法,对科学来说又有什么用呢?”

    包罗万象、复杂、“模糊”、能够用来解释一切的宏大理论——这种理论的建构更多是为了提供情感支持,因为他们没打算被改变或抛弃。

    古尔德告诉我们,这种理论对于科学目标是无用的,无论它们多么有抚慰功能。科学是创造性的过程,但是这种创造性需要让概念结构符合实验数据。这并不容易做到。那些如实解释真实世界的想法一点儿也不廉价。也许这就是为什么好的科学理论很难提出、而不可证伪的伪科学信仰体系泛滥的原因,因为后者容易建构得多。

    八、科学中的错误:逼近真理

    当然,虽然科学上的知识是暂时性的,由理论得出的假设可能是错误的,但这并不是说所有的一切都要被拿来检验一番。 科学中有很多理论已经被确认过无数次,它们被称为“公理”,因为它们几乎不可能被未来的实验推翻。我们不大可能在某一天 发现,血液不是循环的,或者地球并没有在环日轨道上。这些众所周知的事实并不是我们一直在讨论的假说。它们也不是科学家们的兴趣关注点,因为它们已经是确定无疑的。

    科学家只对已有知识范围之外的问题感兴趣:它们并不是确定无疑的。

    科学实践的这一面一科 学家侧重于已知事实的前沿,而忽视那些已经被充分证实的问题(所谓的公理)。

    为了推进知识的进步,科学家们必须直身处已知的前沿。当然,这里是很多事情都不确定的地方。但科学进步正是通过这个过程来实现的,即试图在已知的前沿减少不确定性。

    这种特点常常使得科学家被公众视为是“没谱的”。但这只是表面现象,科学家们只是对知识的前沿不确定 这使我们对于 事物的理解不断加深。 科学家们不怀疑那些被很多研究重复证实的事实。

    同样需要强调的是,当科学家通过观察法证伪一个理论或用一个新理论代替旧理论的时候,并不意味着他们要将先前用以建立旧理论的事实全都扔到一边。相反,新理论应该能够解释所有旧理论能解释的事实,还能够解释旧理论不能解释的事实。

    临床心理学家斯科特.利连费德(ScottLllienfeld,2005)向心理学专业的学生介绍了阿西莫夫的观点: 当向学生解释心理学知识本来就是暂时性的、可以被修正的时候,有些学生会错误地得出结论,认为真正的知识是不存在的。这种观点在某些后现代主义圈子里非常流行,它忽视了对不同确定程度的知识的区分。虽然绝对的肯定在科学中无法实现,但一些科学理论,如达尔文的自然选择学说,已经被极好地证实了,而其他一些理论,如支持占星术的理论,已经遭到了有力的驳斥。还有一些理论,如认知失调理论,仍处在科学争议当中。因此,科学理论是个确定程度不同的连续体:有些已经成为了确定的事实,另外一些则被完全地证伪了。对于科学问题,方法论上的怀疑主义并不产生完全确定的答案(原则上说,这些答案可能会被新的证据推翻),这个事实并不意味着知识是不存在的,只是说知识是暂时性的。

    小结 科学家们提到“可解的问题”时,通常指的是“可检验的理论”。“可检验的理论”的定义在科学上是非常明确的:这个理论是有可能被证伪的。如果个理论不可证伪, 并且和 自然界的真实事件没有关联, 那么它就是无用的。心理学里一直充斥着不可证伪的理论,这也正是心理学发展缓慢的原因之一。

    好的理论能够做出具体的预测,具有高度的可证伪性。相比于一个不精确的预测,一个明确具体的预测如果得到证实,会为产生这个预测的理论提供更大的支持。简言之,可证伪性原则的个含义就是,并非所有理论的验正都具有同样的价值。可证伪性越高,预测越具体,得到证实的理论就越受青来。即使预测并没有得到证实(比如它们被证伪了),可证伪性对于理论的发展也是有用的。一个被证伪的预测说明,原有理论要么应当抛弃,要么需要进行改变以解释不一致的数据。正是通过这种由被证为的预测所引发的理论修正,像心理学这样的科学才能逐步向真理逼近。

    2019-06-28 11:39:01 回应
  • 第67页 第三章操作主义和本质主义

    哲学家波普尔称其为“本质主义”。这种观点认为:从内在本质或者本质属性的角度对现象做出最终解释,才算得上是好的科学理论。支持这种观点的人通常也相信,无法对现象做出最终解释的任何理论都是无用的,这样的理论不能反映真实的内在情况,不能反映世界存在方式的本质。 彼得米德瓦( Peter Medawar, 1984) 曾写道: (确实存在)那些科学不能回答并且在科学发展的可预见的范围之内也不可能得到答案的问题。比如那些孩子们会提出的问题一-“终极问题”....我能想到的这样的问题有:世界是如何开始的?我们来到这世间是为了什么?生活的意义是什么? (然而,)即使科学不能回答终极问题,但也不意味着必须接受其他的答案;也不能理所当然地认为,既然这类终极问题能被提出,就一定能够被回答。就我们月前的理解力而言,这类问题是无从回答的。 (但是,最终)就它能回答的那类问题而言,科学的潜力是无穷的...没有什么可以阻挡或中止科学的发展,除了诸如缺乏勇气之类的道德方面的缺陷。 科学家之所以质疑那些自称为终极问题给出绝对答案的人、理论或者观念体系,一个原因就是科学家认为终极问题是无法回答的。科学家并不会宣称他们可以提供完美的知识; 科学的独特优势并不在于它是一个不会犯错的过程,而在于它提供了一种消除错误的方式,它能不断消除我们认识中的错误。再者说,自称完美或绝对知识的主张及做法,却往往会阻碍人们的探索。自由而开放地探索知识是科学活动的一个先夹条件。科学家们总是在怀疑那些号称已经找到问题最终答案的言论。 一、本质主义者喜欢咬文嚼字 本质主义者通常有一种表现:在探求知识之前,过于关注术语或概念的定义。 “但是我们必须首先界定我们的术语”是本质主义者常用的一个口号。“某理论性概念的真正含义是什么?”这种理念似乎意味着,当一个词被当做理论中的概念使用之前,我们必须对这个词的使用所涉及的所有潜在语言问题有一个全面而且清晰的理解。 而这正好与科学家的工作方式相反。在对物理世界开展研究之前,物理学家不会花费力气讨论如何使用“能量”一词,或者当我们讨论物质的基本组成时,“粒子”一词是否真正表达了我们要表达的本质含义。 在科学领域里,确定某概念的意义,是在与该术语有关的现象得到一定程度的研究之后,而非研究之前。 一个精确的概念性术语来自科学过程中固有的那种数据和理论间的相互作用,而不是关于语言用法的辩论。本质主义者让我们陷入无休止的文字争论,而许多科学家坚信这样的文字游戏使我们脱离了事物的实质。 二、操作主义者将概念和可观测事件联系在一起 “操作主义”只是这样一种思想:科学理论里的概念必须立足于可观测事件,或与可观测事件相关联,而这些可观测事件是可以被测量的。 将概念与可观测事件相联系的是概念操作性定义,这使概念公开化了。操作性定义使得概念从个人化的感觉和直觉分离出来,并且允许任何实施可测量操作的人对概念进行检验。 在科学领域里,定义一个概念靠的是一系列操作,而非单独的行为事件或任务。相反,一些差别细微的任务和行为事件通常聚合在一个概念上。 操作性定义促使我们认真地、经验性地思考我们如何定义一个概念,所谓经验性,是指要根据我们对真实世界的观察。 三、信度和效度 概念的操作定义要想有用,必须同时具备信度和效度。 信度是指测量工具的一致性。如果你对同一概念进行多次测评,是否能够得到相同的测量结果。它与常识的定义非常相似“任何总能够产生相同结果的系统所具备的一种属性。” 在科学领域中,一个操作性定义的信度以类似的方式来评估。如果我们多次测量同一概念得到的结果是近似的,那么我们就说测量工具表现出较高的信度。 但是对于一个操作性定义而言,仅有信度是不够的,信度是一个必要而非充分条件。作为一个好的操作性定义,操作必须被证明对于概念来说是有效的测量。 “结构效度”这个术语是指一个测量工具(操作性定义)是否测量了它本应测量的内容。 三、直接和间接的操作性定义 概念和可观测的操作之间的联系,在直接和间接性程度上变化很大。很少有科学概念几乎完全是通过可观测的操作来定义的。大部分概念的定义采用更为间接的方式。例如,一些概念的使用既取决于一系列的操作,又取决于它和其他概念之间的特殊关系。最后,还有一些概念不通过可观测的操作直接定义,而是通过它与另外一些概念间的关系来定义的。这种概念有时被称为“潜在概念”。 四、科学概念的引进 一个科学概念的定义并不是固定不变的,而是随着相关观测结果的不断丰富而发生变化。意识到这一点非常重要。如果一个概念的原始操作性定义在理论上被证明是无效的,那么该定义就会被抛弃,以另外一套定义的操作取而代之。 譬如现代心理学家很少使用类似“记忆”或“遗忘”这样的笼统概念,相反,他们测量那些可以进行明确定义的记忆子过程,如短时听觉记忆、符号存储、语义记忆以及情景记忆。传统的“记忆”或“遗忘”的概念通过更加明确的操作性概念得到了细化。 神经病学家诺曼·格什温德将这种区别描述如下:“我认为,在医学发展的历史中,你能够了解一件事,那就是:许多人认为,研究一个问题的方式就是首先定义这个问题然后再去研究它。这种想法被一次次地证明是错误的,因为你发现,只有先知道了答案,才能正确定义问题。” 哲学家保罗·邱吉兰德强调,在科学中,对概念的定义不是源于文字界定,而是源于与之相关的观察和其他概念: 要想完全理解“电场”这个概念,我们就必须熟悉这一表述所处的理论原则体系,它们会共同告诉我们,电场是什么、做什么。这是一个典型的例子。通常来讲,理论性术语的意义不是从单一的、具体描述其所适用的必要充分条件的定义中获得的,它们往往通过所在的理论原则体系而被间接性的定义。 随着科学概念的演进,概念常常与许多不同的理论体系交织在一起,并且获得多种操作性定义。这种情况的出现并不是因为概念本身出了问题。例如许多人认为心理学不可信,因为心理学中许多重要的理论概念——譬如智力,可以用不止一种方法来操作化和概念化。 五、心理学领域的操作性定义 人们对心理学产生误解的原因之一,就是心理学上所说的“预设偏见”。 我们每个人都有关于人格和人类行为的直觉理论,我们用它们来“解释”我们自己以及其他人的行为。我们所有的个人心理学理论里都包含着理论性概念(例如聪明、攻击和焦虑)。因此人们很自然会发问:为何我们必须接受一些其他的定义。尽管这种态度从表面上来看是合理的,但对于任何致力于理解人类行为的科学来说,它都是一个巨大障碍,也就是公众对心理学产生困惑的一个原因。 误解产生的最主要原因,也即媒体在准确呈现心理学成果方面最大的障碍,这就是,心理学中的许多专业概念都是用日常用语表达的。这些日常用语为大量误解的传播敞开了大门。 外行人很少意识到,当心理学家把“智力”、“焦虑”、“攻击”、“依恋”等词语当做理论性概念来使用时,它们的含义和大众平时所说的概念不一定相同。 那些定语常常具有高度技术性,通常具有特定意义,并且在许多方面都不同于这些术语在日常生活中的运用。例如,当我们听到“对大样本的认知任务进行因素分析所得到的第一个主成分”这段话时,许多人都意识不到它是术语“智力”的操作性定义。 譬如爱因斯坦相对论中的“相对性”一词被公众理解为“绝对是不存在的,因为任何事情都是相对的。”而事实上,爱因斯坦的相对论认为“尽管测量的实施者在测量时需要依赖他的参考物和参考系,但事实上他所测量的物理现象总有一个恒定的属性,这一属性超越了观察者的特定参考系。”爱因斯坦的相对论实际上是寻找物理现象的恒定属性的。 物理学家兰道指出,即使在物理学中,“模糊的词语选择也是造成某些误解的根源,科学家经常使用一些口语化的术语。他们为这些用语赋予特定意义,但没有经过正规训练的人是不可能想到这种意义的。” 操作主义不是心理学独有的,它是所有科学门类的特征。操作定义因此导致科学的公开化,而公开化是科学的关键特征之一。如果两个科学家对同一个操作性定义达成一致,其中一个人就可以用它去复制另一个人的结果。 一个科学家必须通过如下方式“知道”智力是什么意思:他必须精确的定义一种方法,使其他实验者能够以完全相同的方式测量这一概念,并且得到有关此概念的相同结论。就其明确性和精确性来说,这与日常交谈中为了实现相互理解而使用的模糊语言间有很大区别。 六、作为人性化力量的操作性定义

    在科学中,知识的正确与否并不取决于个体提出主张时自己的肯定程度。所有建立在“直觉”基础上的信念体系都有一个共同的问题,即当出现矛盾观点时,它们缺乏一种机制来判别哪个是对的,哪个是错的。因为人人都凭直觉认为自己是对的,但当大家的直觉观点发生冲突时,我们该如何决定谁是正确的呢?历史表明这种冲突的结果通常是权力斗争。 一些人错误地宣称,心理学的操作取向使人们丧失了人性,而且我们应该把我们关于人类的观点建立在直觉基础之上。心理学家唐纳德在1973年论证说,真正人性化的观点是将关于人类的理论观点建立在可观测的行为基础上。 因此,科学中人性化的力量就是让知识公开化,让任何有冲突的观点都能以一种双方都接受的方式得以检验。科学的公共性本质在很大程度上依赖于操作主义的理念,通过对概念操作化的界定,概念进入了公共的领域——任何人都可以对其进行批判、验证、改进或否定。 心理学概念不能以某些人的个人定义为基础,因为这类定义可能是不常见的、个人化的或者模糊的。由于这个原因,心理学必须摒弃所有对概念所做出的个人化定义,而坚持公众可以知悉的定义,这种定义用操作来界定概念,并确保了任何一个接受过适当训练并拥有适当设备的人都可以实施这些操作。 只有当概念以操作性定义为基础,并且不关注于本质主义者所讨论的文字意义时,这类具有公众可用性的知识才能够用来解决人类的问题。

    七、本质主义问题和对心理学的误解

    可是,如果将上述问题中的“地心引力”全部换成“智力”,奇迹就出现了,现在那些问题立刻被赋予了重大意义。它们看起来是那么自然和富有深意,它们就是在寻求一个终极答案。可是当心理学家给出和物理学家一样的答案,即“智力是一个复杂的概念,它的意义是由测量它的操作以及它与其他概念之间的理论关系来界定的”时,却会被鄙视和指责为回避真实问题。 “我们必须平静地接受现代科学的局限性,它并没有声称可以发现‘事物究竟是什么’”。 如果那些为人类本性问题寻求本质主义答案的人求诸于心理学,注定将会失望。心理学不是宗教,它是一个试图对所有行为作出科学解释的广阔领域。因此,心理学现在的解释是对行为的暂时性的理论的建构,就目前来说,这些建构在解释行为方面优于其他解释。这些建构在将来注定会被更好的、更接近事实的理论概念体系所取代。 八、操作主义和心理学问题的范畴

    概念有没有直接或间接地建立在可观测操作的基础上,是识别不可证伪的理论的重要线索。没有建立在可观测操作基础之上的概念,通常是为了拯救那些不能被数据印证的理论。

    “节省”原则:当两个理论有同样的解释的能力的时候,较为简单的理论(涉及更少的概念和概念性关联)胜出。原因是,拥有较少概念性关联的理论在将来的检验中会更具有可证伪性。

    深刻理解操作主义的原则,也有助于我们识别不具备科学意义的问题。

    预设偏见让许多人认识不到,这些辩解与要讨论的问题毫不相干。几乎每一个人都认为思考是发生在自然世界中的一个过程。但请注意,我们在讨论其他过程时,并不涉及“起源”的问题。一些事物的起源与它执行某一特定任务的能力是完全不相关的,思考的过程也是如此,一个事物能否思考并不依赖于这个事物的起源。

    图灵设计出著名的“计算机能否思考”的实验。他的测试启示我们,如果我们想要理性地讨论心理学概念,那么操作性定义是必需的;我们要以一种有条理的方式进行判断,而不仅仅根据我们自己对某个问题的偏见。

    观察人们讨论人工智能问题时所展示的思维方式,就能发现科学和非科学思维方式之间的区别。

    科学的方式是先发展一种合理的操作性定义,然后看我们可以从中得出哪些关于思考、计算机和人类的结论。

    与之不同的是,预设偏见主导了大多数人的思维。他们已经得出了某一结论,并且对于计算机和人类的表现之间已被发现的差异并不感兴趣。相反,一旦形成定势,他们就会绞尽脑汁地去找出各种理由,来巩固自己的这些想法,避免发生改变。于是,我们看到,正是预设偏见和非操作性的本质主义态度,让人们认定他们“就是知道”思维到底是怎么回事。这种态度使大多数人的直觉心理理论无法证伪,因此完全无用。也正是这种态度说明了为什么我们需要科学心理学。

    小结:

    操作性定义是利用可测量、可观察的操作来表述的概念定义。我们确信某个理论具有可证伪性主要途径之一,就是确定理论中的关键概念具备可用可重复性很强的行为观察来表述的操作性定义。操作性定义是让科学知识变得公开可检验的主要机制。这样的定义被置于公共领域,使其所界定的理论性概念能够接受所有人的检验,而不是像“直觉的”、非经验性的定义那样,只属于特定个体,检验它的机会并不向所有人开放。

    2019-07-07 15:22:59 回应
  • 第87页 第四章见证和个案研究证据

    在本章中,我们将为心理学信息的消费者建立一个非常有用的原则:个案研究和见证作为评估心理学理论和治疗的证据是毫无价值的。

    一、个案研究的地位

    个案研究的作用,很大程度上取决于科学探索在某个特定领域进展到什么程度。从个案研究或临床经验中获得的灵感,在特定问题的早期研究阶段或许比较有用,因为它们可以提示哪些变量需要进一步研究。

    个案研究在开启心理学新的研究领域方面起到关键作用。

    让·皮亚杰的工作中就是很著名的例子。皮亚杰的研究提出了一种可能性,即儿童的思维并不只是成人思维的简易版或低级版,而是有其自身结构的。皮亚杰关于儿童思维的部分推测已经被证实,但很多还有待证实。然而,对于我们这里的讨论来说,更重要的不是皮亚杰的哪些思想被证实了,而是要理解,皮亚杰的个案研究尽管没有证实任何事情,但它为发展心理学家的研究提供了难以置信的广阔领域。

    然而,当我们从科学研究的早期阶段步入更为成熟的理论检验阶段之后,情况就大不相同。由于个案研究在特定理论的检验中不能作为证实或证伪的证据,所以它在科学研究的后期不再有效。其原因就是:个案研究和见证叙述都是所谓的“孤立事件”,缺乏比较性信息,而这种信息对于排除其他可能的解释来说是必要的。

    见证叙述与个案研究相似,因为它们都是孤立事件。依赖见证叙述的问题在于,如果累积起来的见证能够为几乎每一种疗法提供支持那么它也就不可能用来支持任何一种特定的疗法,因为所有相互对立的疗法都有各自的见证。

    正如心理学家雷·尼克尔森在评论我们用以欺骗自己的认知过程时所说的那样,“江湖郎中的骗术往往得逞,是因为他们总能找到一些病人愿意为他们做见证,这些病人总是发自内心地告诉别人,他们自己的确从治疗中获益匪浅。”

    “其他可能的解释”这一理念,对于理解理论检验来说至关重要。实验设计的目标就是构建某一事件或现象,使其只能用某一种特定的理论来解释,而其他理论则解释不通。

    只有当我们收集的数据排除了其他可能的解释时,科学才能进步。科学为理论观点的自然选择创设了条件。有些理论观点经过实验检验存活了下来,而另一些则被淘汰出局,凡保留下来的都更接近真理。但是,这是个慢工出细活的过程,各种理论观点都必须经过细致审查,以便发现哪些更接近真理。

    但是,这一过程必须有所取舍:为支持某一特定理论所收集的数据,不能同时支持许多其他可能的解释。基于这一理由,科学家在他们的实验中设有控制组,或称为对照组,以期得到比较性信息。

    针对某个现象的孤证具有高度的误导性。

    二、为什么见证叙述毫无价值:安慰剂效应

    无论治疗是否有效,人们都会报告某种疗法曾经对他们有所帮助,这种倾向被称为安慰剂效应。

    安慰剂效应的概念在电影《绿野仙踪》中有绝佳的阐述。仙女并没有真的给铁皮人一个心脏,没有给稻草人一个大脑,也没有给狮子以勇气,但是他们都感觉更好了。

    实际上,直到近一百多年,医学才发展出较多具有确凿疗效证据的治疗方法,因此有人曾经这样说:“本世纪以前,整个医学史只能说是安慰剂效应的历史罢了。”

    安慰剂效应在抑郁症治疗中是29%(即29%的病人服用安慰剂后报告症状缓解了)。一项研究建议,将安慰剂效应与当下流行的抗抑郁剂百忧解结合起来,将会最大限度地发挥药物自身的作用。安慰剂效应的效力是很强的,以至于曾有报告说有人对安慰剂成瘾,这些人需要服用剂量越来越大的安慰剂来保持他们的健康状态。

    当然,在有关药物治疗的实际研究中,安慰剂控制并不只是一个什么都不含的药片,而是含有当前认为最有效的药用成分。实验比较的目的在于揭示,新药是不是比当前最有效的药还要好。

    安慰剂效应在心理治疗中很常见。许多有轻度和中度心理问题的人,在接受心理治疗后说他们的情况有所好转。然而控制研究证明:这一康复比例中,有相当一部分是由于安慰剂效应和时间推移这两个因素共同作用的结果,时间推移通常被称为自然康复现象。大多数有效的治疗都是由于治疗效果和安慰剂效应以某种不为人知的组合而产生的效果。

    正如多兹指出的:“即使严重的疾病也有恶化和缓解的时候;关节炎和多发性硬化症就是典型的例子。甚至癌症也会莫名其妙的消失。”他同时也警告说,对于安慰剂的积极反应并不意味着病人的病是虚构出来的,他还警告,与流行的观念正相反,安慰剂是可以有害的:“安慰剂应能够通过证实或强化想象中的疾病来'诱发'慢性病,病人会对那些利用安慰剂效应的非科学从业者产生依赖。”

    在关于心理治疗效果的研究中,怎样合理地对待安慰剂效应控制组,往往令人颇费周折。但是,这些复杂的问题不是我们在这里所要关注的,理解研究者为什么要将药物治疗的真实效果与安慰剂效应及自然康复区分开却很重要。

    英国科学期刊《自然》的华盛顿记者史蒂芬·巴蒂安斯基在总结医学领域中的这些现象时说了如下一段话:

    科学回避个人化的问题,虽然这种倾向常常被归结为科学家应具备的冷静,但事实上,它确实是20世纪人类智慧的伟大战利品之一。科学家们深知,要探寻自然界的原因和结果,就必须排除个人的感觉及经验。健康科学曾经有过一个粗糙的阶段,人们生病有许多原因,大多数情况下,人们无论接受何种“治疗”之后,都会有所好转。各类庸医庸术之所以能够大行其道,凭借的就是那些对疗效满意的患者的见证叙述,这些活生生的例子,说明人们要跳出个人经验的束缚有多么困难。

    三、“鲜活性”问题 社会和认知心理学家已经研究了人类记忆和决策中的所谓“鲜活性效应”。当面临问题解决或决策情景的时候,人们会从记忆中提取与当前情景有关的信息。因此,人们倾向于利用更容易获得的、能够用来解决问题或做出决策的信息。对可获得性造成强烈影响的一个因素,就是信息的鲜活性。 问题在于,再没有比发自内心的个人见证更鲜活、更引人注目了,这都是一些已经发生的事或者是真实的事。个人见证的鲜活性常常令其他一些更可靠的信息黯然失色。 想想下面这个例子的荒谬之处吧。一个朋友开车20公里载你去机场,因为你要乘飞机坐一次750公里的旅行。分别的时候,你的朋友很可能会说,“一路平安”,这个临别赠言其实是具有悲伤的讽刺意味的,因为你的朋友在回家的20公里路上死于车祸的风险,要比你飞行750公里的风险高出3倍。这就是鲜活性问题,它解释了A对B的安全祝福存在着明显的不合理性,因为恰恰是A正处在更大的风险之中。 同样的,很少的人能够意识到,当他们驾车10公里去买一张彩票的时候,他们在车祸中丧命的几率要比他们获得头奖的几率高16倍。 一个研究人员哀叹道:将担心聚焦在“当下流行”的事件上,势必会误导父母的注意力,导致他们“忽视了他们本来能够施加更多影响的方面,例如学业成绩、看电视的坏习惯、吸毒和驾车安全等。” 四、单一个案的压倒性影响

    人们有这样一种倾向:即使能够获得更为精确的信息,人们的判断也常常受到某个突出例子的影响,对此心理学家已经进行了广泛的研究。

    作为一个社会成员,我们应该克服这种不相信数字、必须亲眼目睹才去相信的倾向。绝大多数影响我们社会的复杂因素都只有靠数字才能捕捉。只有当公众学会像重视图像材料一样重视以数字形式表达的抽象材料时,公众自己的立场才不会像屏幕上闪过的最新图像那样变化无常。

    总之,过于依赖见证证据的问题一直存在。此类证据的鲜活性常常掩盖了更加可靠的信息,并且混淆视听。心理学教师担心的是,仅仅指出依赖见证证据的逻辑谬误,并不足以让人们从一个更深的层次理解这类数据的缺陷。但还有一个方法让人们理解这个概念,这种方法的本质是以鲜活性来对付鲜活性,是以一种“以彼之道还施彼身”的方法来对付见证证据,让见证用自身的荒谬来击溃自己。

    五、了不起的兰迪:以彼之道,还施彼身

    巴纳姆效应。这一效应曾被心理学家广泛地研究,研究者发现,大多数成年人都会认为泛化的个性总结都是准确的,并且都是对自己独特的描述。

    许多众所周知的语句和措辞使很多人认为适用于他们自己。谁都能够将其作为一个个人化的心理“分析”提供给顾客,而这些顾客常常会为个人化的“性格解读”的“准确性”而感到震惊,却不知道其实每个人的解读都是一样的。当然,巴纳姆效应正是手相学和占星术的基础。巴纳姆效应还可以证明产生见证有多么容易,以及为何见证毫无价值。

    六、见证为伪科学打开方便之门

    在一个复杂的、科技化的社会中,一些能够影响千万人的决策会为伪科学的影响推波助澜。也就是说,即使你并不认同这些伪科学的观念,你也可能受到这些观念的影响。

    医学领域中的伪科学话题具有借鉴意义,因为在抨击伪科学,以及把正规的与不正规的医疗实践划清界限方面,医学界的各类组织都比心理学界表现得更为激进和勇猛。下面就让我们看看由关节炎基金会出版,曾被美国众议院老龄化问题委员会所引述的一套识别不道德药品推销员的指南:

    1.他或许会提供一种用于治疗关节炎的“特别的”或“秘密的”处方或设备。

    2.他会做广告,用的都是“个案史”和“满意患者”的见证。

    3.他或许会承诺(或者暗示)能够快速或轻松见效。

    4.他也许会声称知道关节炎的成因,并且说能够“清楚”你体内的“毒素”,同时促进你的健康。他或许会说外科手术、X光和医师所开的处方是没有必要的。

    5.他或许会指责“医学体质”故意阻碍了进步,或者迫害了他……但是他不允许他的方法以已有的或已获证明的方法来验证。

    除了宣扬见证叙述作为“证据”,伪科学的从业人员经常以指责他人有意要压制他们所获取的“知识”,以此试图逃避“公开可证实”这一科学的标准。这样,他们就有借口带着他们的“研究成果”直接走进媒体,而不是通过正规的科学出版程序将这些成果公诸于世。通常,这种伎俩在心理学领域中更为成功,因为相比于其他科学领域,媒体通常对心理学的正常科学机制缺乏尊重。

    媒体从来不会考虑去报道物理科学中未经证实的主张,但如果这类主张是心理学方面的,就会被当做正规的心理学话题加以报道,因为新闻记者早就被宣扬“心理学里没有规则”的伪科学洗了脑。然而,消费者必须意识到,电视和纸质媒体只要认为读者有需要,就会报道心理学领域中任何出格的主张,无论这些主张与已有证据之间是多么矛盾。最终的受害者是公众。

    有关神奇疗法的宣传助长了人们的错误希望,当希望破灭时,会给人们造成心理上的致命打击。

    我运用了生动例子来阐明观点,但是,是为了阐述观点,而不是为了证明观点。这里的关键是要区分两点:主张的提出和主张的交流。对于每个主张,我们都能问这样一个问题:它是不是基于鲜活的见证?这会产生四种可能的情况:

    1.一项主张基于鲜活的见证,同时依靠鲜活的见证来交流。

    2.一项主张基于鲜活的见证,同时不依靠鲜活的见证来交流。

    3.一项主张基于证据而非鲜活的见证,同时依靠鲜活的见证来交流。

    4.一项主张基于证据而非鲜活的见证,同时不依靠鲜活的见证来交流。

    2019-07-09 13:38:40 回应
  • 第110页 第四章

    相关性证据的局限性并不都像“烤箱”例子那样容易被识别。当因果关系对我们来说显而易见时,当我们抱有根深蒂固的偏见时,或者当我们的解释被理论定势所主宰时,就会很容易地把相关当做因果的证据。

    一、第三变量问题:戈德伯格与糙皮病

    糙皮病的历史说明,如果依据相关研究来制定社会和经济政策,必将使人类付出惨痛的代价。但这并不意味着我们永远不要使用相关研究的证据。恰恰相反,在许多场合,我们必须用到相关,而在某些情况下,只要有相关就够了。科学家们经常不得不使用不充分的知识来解决问题。重要的是,我们在运用相关性证据的时候要谨慎小心。像这种污水处理条件和糙皮病之间的相关,我们通常称之为“虚假相关”:相关的产生不是因为两个变量之间存在一个可以测量的直接的因果联系,而是因为这两个变量都与第三变量相关。

    有许多复杂的相关统计方法,例如多元回归、偏相关、路径分析(统计学的发展部分要归功于心理学家),这些复杂的统计方法能够去除其他变量的影响、提出公因子或定义协变量之后重新计算两个变量之间的相关。

    这些较为复杂的相关统计方法,能够排除第三变量的影响,但并不总是会削弱原有相关的强度。有时候,在排除第三变量之后,两个变量之间的原有相关仍然存在,这个结果本身就能提供一些信息。这样的结果说明,原有相关并不是由第三变量所导致的虚假相关。当然,并不排除其他变量也会导致虚假相关。

    二、方向性问题

    如果能够采用某种方式操作变量,并能够因之做出科学的因果推断,就没有理由仅凭相关证据做出因果推论。而让人苦恼的是,当涉及心理学主题时,仅根据相关就得出结论的做法却是普遍存在的现象,在心理学知识对解决社会现实问题愈发重要的今天,这种倾向所造成的损失也与日俱增。

    到目前为止,我们的讨论主要围绕变量间相关所涉及的两种误区。其中一种叫做方向性问题,已经通过眼球运动和自尊的例子进行了阐述。当变量A和变量B之间存在相关时,在断定A的变化引起B的改变之前,我们必须清楚因果关系的方向可能是相反的,即从B到A。第二种是有关第三变量的问题,此问题已经通过糙皮病的例子加以论述。两个变量之间的相关并不能预示任何方向上的因果,因为当这两个变量都和第三变量相关时,该相关还是会出现。

    三、选择性偏差

    在一些情景下,虚假相关很容易出现。这也正是选择性偏差非常容易出现的原因。“选择性偏差”这个术语指的是特定主体和环境变量之间的关系,当不同生理、行为、心理特点的人们选择不同类型的环境时,就有可能出现选择性偏差。选择性偏差造成环境特征和行为—生物特征之间的虚假相关。

    充满诱惑的相关性证据加上固有的偏见,就能够欺骗最聪明的头脑。

    尽管大多数的证据都无可辩驳地表明,如果不进行统计校正,选择性偏差会让州与州之间SAT成绩的比较变得毫无意义,但媒体和政客们仍在继续使用未校正的分数来达到他们的政治目的。

    来自临床心理学的例子可以表明,选择性偏差问题是多么地具有欺骗性和违背常理。研究数据有时会显示,接受心理治疗的人在各种成瘾症——如肥胖、吸毒、吸烟的治愈率方面,要低于那些没有接受过心理治疗的人。你想知道原因吗?原因并不是因为心理疗法使得成瘾的行为更加难以改变,而是因为那些寻求心理治疗的人的成瘾问题更复杂和棘手,而且很少能够自愈。

    总之,这一章提供给读者的规则很简单:提防选择性偏差的发生;当只有相关时,应避免因果推论。不可否认,复杂的相关数据里确实存在着有限的因果关系。同样不可否认的是,相关的证据有助于证明假设的聚合效度。然而对于心理学知识的消费者来说,宁可站在怀疑的角度,也不要被那些错误地暗示了因果关系的相关所蒙蔽。

    小结:

    本章的主旨是想传达这样一个理念,两个变量之间仅仅存在相关,并不能保证一个变量的变化就会导致另一个的变化,也就是说,相关并不意味着因果关系。在第三变量问题里,两个变量之间的相关并不意味着它们之间存在直接因果路径,因为相关的产生可能是由于这个变量或许都与未被测试的第三变量有关。事实上,如果潜在的第三变量也经过了测量,就可以用相关统计,如偏相关来评估第三变量是否决定了这种关系。让相关统计的解释变得困难的另外一个原因,就是方向性问题。实际上,如果两个变量有直接的因果关系,因果关系的方向是不能根据相关来判断的。

    在行为科学中,选择性偏差是造成诸多虚假相关的罪魁祸首。事实上人们在一定程度上选择他们的环境,并人为创造了行为特性和环境变量之间的相关。正如戈德伯格的例子所阐述的那样,确保选择性偏差不会捣乱的唯一方法,就是在操纵所有变量的情况下进行真正的实验。

    2019-07-10 15:57:16 回应
  • 第123页 第六章让一切置于控制之下

    一、斯诺与霍乱

    在这一章我们要讨论的是,斯诺和戈德伯格的故事是如何体现科学思维的逻辑性的。如果不能理解这种逻辑性,科学家们的所作所为看上去就会显得很神秘、怪异或是荒唐透顶。

    二、比较、控制和操纵

    科学思维最重要的特点很容易掌握,那就是科学思维所基于的理念是比较、控制和操纵。

    要想获得对一个现象更为深入的了解,科学家就要比较世界上存在的各种情况。没有这种比较,我们所观察到的都是一些孤立的事件,并且对这些孤立的观察结果也解释不清。科学家通过比较在不同条件下得到的结果,可以排除一些错误的解释,并证实正确的解释。通过比较,科学家可以排除许多先前被当做既定答案的理论。也就是说,他们试图在一个实验设计中尽可能多地排除错误解释。他们这么做的途径无外乎两种:要么是在实验条件下直接进行控制;要么在自然情境下观察,以便比较各种可能得解释。

    斯诺幸运地找到了一种自然情景,这种情景使得他能够排除其他的可能性。这种在自然情况下产生的“比较”条件并不多见。让科学家们坐在那里等待这类情况发生是十分荒谬的。事实上正相反,很多科学家都试图以一种区分各种不同假设的方式来重构世界。为实现这一目的,他们必须操纵被认为是诱因的变量(在斯诺的实验里是被污染的供水系统),然后在保持其他所有相关变量不变的情况下,观察是否会有不同的结果(霍乱的发病率)。被操纵的变量称为自变量,随着自变量变化而变化的变量称为因变量。

    因此,一个好的实验设计应该是这样的:科学家能够操纵他感兴趣的变量,并对其他可能影响实验的无关变量进行控制。

    戈德伯格不仅观察了自然发生的情景,还创设了特殊条件组,从而排除一系列其他可能性并获得实验结果,这种推论要比斯诺的方法更具有说服力。这也是为什么科学家要试图操纵一个变量并保持其他所有的变量不变的原因:为了排除其他可能性。

    三、随机分配与操纵共同定义了真实验

    类似斯诺这样的实验设计就无法排除那些更为微妙的虚假相关,这类虚假相关不像其他与社会经济地位有关的相关那样容易被看出来。这就是科学家倾向于直接操纵他们感兴趣的变量的原因。

    当操纵变量与一种叫做随机分配的程序(在随机分配中被试不能决定自己进入哪种实验条件,而是被随机分配到某一个实验组)相结合时,科学家们就能够排除那些可以归因为被试本身特征的解释了。随机分配确保被试在对比实验条件下的所有变量基本保持一致,随着样本数量的增加,它还能平衡掉一些偶然因素。这是因为被试的分配是由不带偏见的随机方法实施的,而不是由某个人的选择决定的。

    随机分配是一种将被试分配到实验组和控制组的方法,以保证每个被试有同样的几率被分到其中一个组。掷硬币就是一种决定某一被试分到哪一组的手段。实际实验中往往采用电脑生成的随机数字表。通过使用随机分配,研究者在研究之前就试图平衡两组的所有行为变量和生理变量,甚至是那些研究者没有进行专门测量或考虑到的变量。

    随机分配的效果如何,取决于实验中被试的数量。也许你会认为被试越多越好,也就是说,分配到实验组和控制组的被试的数量越多,两组间除了自变量以外的其他所有变量就越来越接近。但幸运的是,对于研究者来说,其实每组只需要一个相当少的人数(例如15~20人),随机分配就可以起到很好的效果。

    使用随机分配能有效避免由于两组方式所导致的系统偏差。这两组被试在所有变量上均得到匹配,但即使存在着一定程度的不匹配,随机分配也消除了实验组或控制组之间的偏差。如果我们了解一下“重复”这个概念,对于随机分配如何去除系统误差这个问题就比较好理解了,所谓的重复是指在各种环境下重复一个实验,看是否得到同样的实验结果。

    因此,随机分配程序有两个优点。一个是在任何实验中,样本的数量越大,随机分配越能平衡两组所有其他的无关变量。而即使在一些匹配得不是特别好的实验里,由于随机分配克服了系统误差,仍然可以让我们得出令人信服的结论——只要研究可以被重复。所以,尽管随机分配不能保证被试在任何实验中都保持完全的匹配,但它仍然是能够用来确保达到某种平衡的最好方法。

    四、控制组的实验性

    罗斯和尼斯贝特指出“没有使用较为正式的实验程序所获得的积极效果,要么是'安慰剂效应'的产物,要么是由于没有使用随机分配而产生的偏差。”

    罗斯和尼斯贝特还继续探讨了“当没有使用随机分配的时候,选择性偏差是如何产生虚假相关的。”这一问题。例如,如果一些病人被选做某种治疗方法的研究被试,他们可能会努力做一名好的参与者,或者他们拥有家庭的支持、积极的态度或者他们的家人对其病情更为关心,这些都有可能影响实验组与控制组的差别,而这与治疗方法的效果没有任何关系。

    五、聪明汉斯——神马的故事

    六、20世纪90年代的聪明汉斯

    自闭症是一种严重的发展性障碍,其表现是社交缺陷、语言发展的滞后及异常,以及活动和兴趣范围狭窄等。

    七、对变量分开考察:特殊条件

    戈德伯格与糙皮病的例子给我们上了重要一课,对于我们澄清有关科学进步的一些错误概念有很大的帮助,尤其是当其运用到心理学中的时候。世界上发生的任何事情通常都与其他许多因素有关联。为了对许多同时发生的事件所造成的因果影响分别进行考察,我们必须创设一些通常情况下不会出现的条件。科学实验将世界上原有的相关分割开来,以此来使单一变量的影响显现出来。

    心理学上的很多经典实验都需要将现实世界的自然关系分开考察,通过这样一种逻辑,就能看出哪个变量是决定因素。

    创设特殊条件来验证是否存在真正的因果关系,这种方法可以防止错误观念像病毒一样侵袭我们。

    简而言之,科学家们用创设特殊条件的方法来验证某种现象的假设是十分必要的。仅观察自然情景还远远不够,人们对下落的和移动的物体观察了几个世纪,却没有人得出关于运动和重力的正确原理和规律。直到伽利略和其他科学家们通过创设人工的条件来观察物体的运动之后,才得到了正确的运动规律。

    八、直觉物理学

    所谓直觉物理学就是普通人对物体运动的观念,有趣的是,这些观念通常与物体运动的实际情况恰恰相反。

    麦克科劳斯基的工作很好的说明,理解科学家这一做法有多么重要。尽管人们有大量关于物体运动和下落的经验,但对于运动的直觉理论都是相当不靠谱的。我们需要明白的是,外行人观念的不准确是因为他的观察是“自然的”,而不是像科学家那样进行实验控制。

    麦克科劳斯基的当代被试和中世纪哲学家有共通之处:两组人在现实世界里都有很多有关物体运动的经验,但是没有人特意创设一种条件,进行科学的操纵、控制和比较。

    再多的个人经验也不足以阻止人们产生关于物理运动的错误概念。

    九、直觉心理学

    哲学家保罗·丘奇兰德曾指出,如果我们关于物体运动的直觉(或世俗)理论都是不准确的,因此,也很难相信我们在人类行为这类更为复杂领域这类更为复杂领域中的世俗理论会是正确的:

    我们最初关于运动的世俗理论是相当混乱的,而且最终将会被更成熟的理论完全取代。早期我们关于宇宙结构和活动的世俗理论也十分离谱,它们之所以依然存留下来,只不过是作为一些历史教训,提醒我们自己可以荒谬到什么程度。我们关于火的本质、生命本质的世俗理论也都是十分荒唐的。由于我们大部分的世俗理论都被推翻了,所以你可以一直列举下去……但是与刚才列出的内容相比,人类的心智活动是一种更复杂和难以理解的现象。目前为止才算有了一些准确的认识,而当我们在其他方面都犯了错误的时候,想要在一开始就能正确地认识心理学知识,简直就是天方夜谭。

    生物学家E.O.威尔逊道出了丘奇兰德的推测为什么可能是正确的,原因在于:“大脑这部机器构造出来是用于生存的,而不是用来理解它自己的。因为这两个目的完全不同,大脑在没有接受科学知识时观看这个世界是零散的,它必须把注意力放在它所必须知道的世界的一隅,以便于能够生存下去。这也就是为什么甚至到今天人类了解汽车远胜于了解他们自己的大脑。”

    当我们审视有关人类行为理论的文献时,会发现丘奇兰德的思考是对的。例如,没有证据显示有宗教信仰的人比没有宗教信仰的人更无私。许多研究显示,笃信宗教的程度与参加慈善活动、帮助贫困的人或是不欺骗其他人这些行为之间没有直接关系。

    人类关于行为的直觉理论是有缺陷的,这就说明了为什么我们的心理学研究需要实验控制。只有这样,我们才能把我们关于人类行为的粗浅概念上升为准确的科学概念和体系。

    小结:

    实验方法的核心就是操纵与控制。在相关研究中,研究者仅仅观察两个变量的自然变动是否显示某种联系,而在真实验中,研究者要对被假设为原因的变量进行操纵,通过实验控制和随机分配来保持其他所有变量不变,然后来看这个假设变量是否会产生影响。这种方法排除了相关研究中出现的第三变量的问题。第三变量出现的原因是,在自然情景下,很多不同的事物都是相互联系的。实验方法就是用来分开考察这些自然存在的关联。它之所以能实现这一目的,是因为它以操纵一个变量(被假设是原因的变量)的方式分离出该变量,并保持其他所有变量不变。但是,为了区分这些自然的关联,科学家们经常要创设自然界里不会出现的特殊条件。

    2019-07-12 14:16:27 回应
  • 第144页 第七章但是这不是真实的生活

    ——“人为性”批评和心理学

    一、为什么自然性并非总是必要的

    正如上一章所述,科学实验的人为性并不是一种缺点,事实上,正是它使得科学方法具备了一种奇特的力量,可以让我们对世界进行解释。与人们通常所相信的观点不同,科学实验的人为性并不是偶然的疏忽,而是科学家故意为之。科学家之所以专门设置一些非自然发生的条件,是因为只有这样才可以将决定事件发生的许多相关变量区分开来。

    为了分析一种现象,经常需要创设非自然的极端条件。

    事实上,如果科学家完全禁锢在“自然”条件下观察,那么一些现象就不可能被发现。

    为了对宇宙有更深刻的理解,即使采用一些不常见的甚至是怪异的方法,也是合情合理的。

    心理学家使用的许多技术在公众看来是怪异的,很多人都不知道这些技术并非心理学领域所独有,只不过心理学家把这些科学方法应用到人类行为的研究上而已。事实上,在每一个学科的调查研究中,都能看到人们用一些类似的怪异方式来获取关于世界的认识。心理学家们却遭受了双面夹击,于是,当心理学家像其他所有科学家一样创设必要的特殊条件来对心理现象进行更有力、更精确的解释时,却遭到了诽谤。

    禁锢于真实生活条件会妨碍我们发现许多新事物。

    二、对“随机取样”的误解

    有时候,类似“这不是真实的生活”的抱怨源于对心理学实验研究目的的另一种误解,产生这种误解的原因是非常容易理解的。媒体的宣传使许多人对调查研究开始熟悉起来,特别是选举中的民意调查。现在人们对选举投票的一些重要特征越来越了解。

    具体而言,为了保证民意测验的准确性,媒体对随机抽样、样本代表性等概念更加关注。这种关注导致许多人错误地认为,随机取样和代表性是所有心理学调查研究的必要条件。因为心理学研究很少使用随机的被试样本,如果根据外行人所相信的随机取样标准,那么许多心理学的研究成功都会遭到诋毁,那些批评心理学研究无法反映真实生活因而是无效的论点也会受到强化。

    但只要想一下其他科学的情况,就很容易理解这种想法的荒谬。化学家从来没尝试过抽取化合物的随机样本,生物学家也不曾用细胞或组织的随机样本进行实验。大部分心理学研究也是同样的道理。并非每一个心理学调查研究都需要使用随机样本。因此,我们在此需要强调的重点是:随机取样和随机分配不是同一个事情。

    三、随机分配和随机样本的区别

    随机分配和随机取样两个词里都包含“随机”,许多人都误以为是一回事。事实上,它们是非常不同的概念,唯一相似之处在于他们都采用了随机生成数字这一点。然而其目的却大相径庭。

    随机取样涉及的是如何选择被试进行研究。如前所述,并不是所有研究都要求随机抽样,但当它成为必要条件时(例如在调查研究、市场调查或是选举时的民意调查中),我们则需要用一种方法从总体中抽取一个样本,这种方法要确保总体中的每一个成员都有同等机会被选为样本,这种方法要确保总体中的每一个成员都有同等机会被选为样本,被抽中的样本就成为随后调查研究中的被试。有一点非常重要,这种随机抽样的调查研究既可能是相关研究,也可能是一个真实验。只有使用了随机分配的方式,才有可能成为一个真实验。

    随机分配是真实验所必需的条件。实验人员将被试分为实验组和控制组,当每一名被试被分到实验组的机会和被分到控制组的机会相等时,则实现了随机分配。

    随机分配和随机取样不是同一回事,牢记这一点的最好方法是弄清楚四种组合:非随机分配的非随机样本,随机分配的非随机样本,非随机分配的随机样本,以及随机分配的随机样本。

    大部分心理学实验没有使用随机样本,因为没有这个必要。研究可以检验理论,我们所需要的只是一个方便取得的样本。如果一个研究中使用了随机分配的方法,那么它就是一项真实验,如果没有使用,那么它是一项相关调查。

    许多使用随机抽样的研究没有使用随机分配,那是因为它们只是调查性研究,旨在寻找关联——也就是说,这些研究属于相关调查研究。

    四、理论研究和应用研究的异同

    许多应用研究的目的是把研究结果直接与生活中特殊情景联系起来。对应用研究而言,预测必须是:研究与现实生活有“一对一”,应用研究的结果必须都能直接应用。

    选举投票中的民意测验就是应用研究的一个例子。研究目的是预测一个特定情景下的特定行为,在这个例子中,就是选举日的投票结果。由于研究结果是要直接应用于现实的,因此,样本的随机性和情景的代表性问题很重要。

    然而,把应用型心理学研究看做典型的心理学研究是错误的。心理学(或其他学科,就这一点来说也是如此)的大部分研究都有着不同于应用的目的。大多数研究的预测层次是从理论到特定研究情景的预测。大多数研究的结果只能间接通过理论修改而被应用,这些理论与其他科学规律共同应用于一些实践性问题。简而言之,大部分理论研究追求的是对心理过程的理论验证,而不是把研究结果推广到现实中的某一特殊情景中去。

    主要目的为理论验证的研究通常被称为“基础研究”。应用研究的目的是把数据直接应用于现实生活,但是基础研究则专注于理论验证。

    然而,仅仅根据某项研究是否有实践性应用来区分基础研究和应用研究,很可能会产生错误,因为这一差别常常会随着时间的增长而逐渐消失。应用研究的结果会很快得到应用。但是没有什么能比普遍的、准确的理论更具有实用性了。尽管很多科学家进行理论或实证研究的初衷并非解决具体的实践性问题,但他们发展出的科学理论或研究结果最终都解决了现实世界的许多问题。

    历史一再证明,(通过让科学家解决特殊的实践性问题)试图控制科学发展方向只能阻碍发展进程而非促进。具有讽刺意味的是,急于让科学家们解决实际问题,而不让其考虑“其他事情”的做法,被证明是最不切实际和目光短浅的。

    通向实际应用的道路是非常曲折和不可预料的。

    简言之,我们必须意识到,虽然一些研究是为了直接预测某一特殊情景而设计的,但大多数科学研究仍然是用于验证理论的基础研究。

    怎样把研究结果应用到现实生活中呢?从事应用研究和从事基础研究的研究者们对此有不同的回答。前者会这样回答:“直接应用,只要实验情景和将来要应用的情景有相当程度的相似性就可以了。”因此,被试的随机取样和实验情景的代表性都会影响结果的应用。

    然而,进行理论检验的研究人员是这样认为的:研究结果不会直接应用于现实生活,进行理论研究的目的也不是为了将结果用于具体的环境条件。因此,这类科学家并不关心研究的被试与其他群体有多相似,也不关心实验情景是否反映出某些真实生活的环境。这些研究结果不直接应用于某一特殊情景,而是应用于理论。这种理论,也许在将来的某一天,可以和其他科学规律相结合,共同解决某一特殊问题。

    注意力有限加工理论。

    这一信息加工理论是通过大量的实验验证(上百个实验室研究)建立起来的,开车使用手机提供了一个机会,正好可以用这理论来预测其可能造成的危害。

    海奇特的实验(暗适应)他并不关心他的实验情景是否符合现实世界的情况,而是关注是否能充分分离出他想研究的特殊视觉过程。

    海奇特的研究发现之所以有具有普遍性,并不是因为他的实验情景的性质是人工的或是自然的,而是因为根据这些研究结果可以建立一个有关基本视觉过程的理论,而这个理论可以与许多视觉现象相关联。他的研究揭示了人类视觉系统中各个部分之间的功能关系,而这恰恰是因为他的研究情景经过了人为的精确控制。如果这一理论模型是正确的,那么它应该能广泛地应用于各种情景,可以用来解释许多行为现象,即使所处的情景与发现这一理论的情景完全不同。

    换句话说,海奇特的研究结果通过对理论的研究而产生了间接的应用价值。

    五、心理学理论的应用

    大部分研究的目的是发展理论而不是预测具体环境下的事件,以及大部分研究的结果是通过理论间接应用的,而非在具体环境下直接应用。

    那么我们就会顺理成章地问:究竟心理学中有多少理论可以在现实中得到应用。也就是说,心理学理论的普遍性得到验证了没有?

    对于这一点,我们必须承认以往的记录是参差不齐的。但也必须清楚地意识到,这与心理学的多样性息息相关。一些领域中的研究确实在应用方面进展甚微,然而,其他一些领域则已经取得了十分瞩目的成绩,通过实验已经推导出了许多具有解释能力以及预测能力的原理。

    想想经典条件反射和操作性条件反射原理。这些原理及其详细论述的规律,几乎完全是从非人类被试的实验发展而来的,比如鸽子、老鼠,其实验情景也是高度人为化的实验室环境。然而,这些原理已经成功地用于解决人类各种各样的问题,包括自闭症儿童的治疗、大量事实材料的教学、酗酒和肥胖症的治疗、精神病院的病号管理以及恐惧症的治疗等等。

    这些应用所依靠的原理之所以能够被准确地提炼出来,是因为在实验室条件下,研究者们能够精确地细化环境刺激和行为之间的关系,而这一点在自然条件下是无法做到的,因为在自然情景下,许多行为之间的关系可能会同时起作用。

    事实上,“这不是真实的生活”的批评被错误地用来诋毁动物研究的成果——这种做法经常是由于政治的缘故。

    五、“大二学生”问题

    许多人质疑心理学研究成果的代表性,他们过于关注研究的被试,而不关心实验设计的细节。然而,心理学的许多领域中,研究结果更多受到后者的影响而非前者,例如知觉基本过程的研究。

    我们面临一个问题,有时人们叫它“大二学生问题”;即,因为大二学生在大量的心理学研究中做被试,因此这些研究所得出的结果是否具有推广性受到了质疑。心理学家关心这一问题,是因为它在某些研究领域中的确是个问题。尽管如此,我们还是要正确地看待它,并且应该知道心理学家对这一批评有几种合理的辩解。

    以下列出三点:

    1.这种批评不能说明研究结果无效,只是需要更多的研究来证明理论的可推广性。由于我们先前收集了大二学生的数据,即使从其他人群中获得了相反的数据,从而必须对理论做出相应的调整,也只会使理论更加精确,而不会完全否定它。即使在比较极端的情况下,重复的实验没有得出相同的结果,我们也只能说,建立在大二学生数据基础上的理论不够全面,而不能说该理论一定是错误的。

    2.在心理学众多领域里,大二学生问题不构成一个问题,因为所研究的心理过程是非常基本的过程(例如视觉系统),几乎没有人会相信视觉系统的基本构造跟被试样本的人口分布特征有关。

    3.许多研究结果得到了重复,这使我们确信这些结果在很大程度上可以推广到不同的地理分布中,并且在较小程度上,也能推广到具有不同社会经济因素、家庭变量以及早期教育经历中的人群中去。

    人们可能不太知道,如果密歇根大学的一名心理学家获得一项重要的研究成果,那么类似的实验将很快在斯坦福大学、明尼苏达大学、俄亥俄州立大学、剑桥大学、耶鲁大学、多伦多大学等大学进行。通过这种检验,我们将很快知道这项结果是不是由于密歇根州被试的独特性或特殊的实验环境所造成的。

    大二学生问题和关于代表性的批评大部分针对的是社会心理学,社会心理学经常用大学生被试在实验室情景中进行研究,并试图建立真实社会情景中的社会交往、群体行为和信息加工等理论。然而,即使在心理学的这一领域,也有证据表明,实验室得出的成果和理论,实际上确实预测出了不同类型的个体在各种情景下的行为。

    “武器效应”:如果一件武器出现在手边,会使得某个人更容易做出攻击性反应。这个发现源于实验室,是一个无代表性情景的典型例子。由于这一结果是人为情景的诱导产物,因此常被强烈地批评其具有误导性。但事实是这样的,各种实验条件下得出的结果都一样,用不同的方法测量攻击性所得的结果都一样,在欧洲和美国获得的结果一样,研究儿童和成人的结果一样,在实验室之外的现场研究中,被试不知道自己是在参与实验,得出的结果也一样。

    认知、社会和临床心理学家也研究了人类的各种决策行为。这个研究领域里大部分原始的研究都是在实验室里完成的,使用大学生作被试,并且采用高度人为化的任务。

    然而,从这些研究中得出的决策行为原则在很多非实验室环境都得到了重现。

    当然,并不是所有的心理学研究成果都能重现。相反,结果无法重现的实验经常出现,而它们往往比结果可以重复的实验更具指导意义。但是,在认知心理学中,重复实验的失败几乎很少是被试的独特性造成的。相反,大部分是因为实验刺激和方法的细微差异。通过仔细地分析要产生一个现象究竟需要哪些实验条件,科学家们对现象有了更精确的理解,这为建立一个更精确的理论奠定了基础。

    但是,如果实验结果没有被重现,那么心理学的研究成果如何应用?如果科学家们没有在所有的细节上达成一致,知识和理论并不完全站得住脚,那么如何证明这些结果的应用是合理的?

    这种对心理学发现的担心是很常见的,因为人们没有意识到,在其他科学中,结果和理论经常在完全确立之前就开始应用了。

    所有的科学理论都有可能被修订。如果我们在应用科学研究结果之前必须确定知识是完全正确的,那么应用就不会发生了。所有领域的应用型科学家尽最大努力使用最准确的信息,同时也会意识到这些信息有可能是错误的。

    六、正确看待“真实生活”和“大二学生”问题

    七、小结

    一些心理学研究属于应用型研究,它们的目标是把研究结果直接应用于特定情景。在这样的应用研究中,研究的目的是要将结果直接推广到自然情景中,样本的随机化和条件的代表性就显得尤为重要,因为研究结果将会直接得到应用。

    然而,大多数心理学研究不是属于这个类型,而是属于基础研究,用以验证有关行为潜在机制的理论。在大部分基础研究中,研究结果通过理论上的修正得到间接应用,从理论产生到应用于某些实践问题需要一段时间。

    在这种类型的基础研究中,被试的随机取样和情景代表性不是关键问题,因为这类研究的重点在于验证理论的普遍性。实际上,在用于验证理论的基础研究中,人为的环境条件是有意创设的,因为这有助于把研究的关键变量从所要控制的无关变量中分离出来。因此,心理学实验“不像是真实的生活”这个事实其实是一种优势而非缺点。

    2019-07-13 11:03:53 回应
  • 第161页 第八章避免爱因斯坦综合征

    一个特别典型的误解就是,媒体让公众以为,某一科学研究领域中的所有问题都能通过某个关键实验得到解决,或者是某一个重要的灵感成就了理论的进步,并彻底颠覆了先前众多研究者累积的全部知识。这种科学进步观非常符合新闻媒体炒作的胃口,在媒体的运作方式里,对历史的追溯就是呈现支离破碎、缺乏连贯的小型事件。

    一、关联性原则

    科学中的概念变化遵从关联性原则,而这一原则在艺术中并不存在,或至少说是极为罕见的。就是说,一个新的科学理论,必须与先前已确立的实证事实建立关联。新的科学理论不仅仅要解释新的事实,还要兼容旧的事实,这样才会被认为是一个真正的理论进步。新的理论可以以一种迥然不同的方式来解释旧的证据,但是它必须能解释得通。这些要求保证了科学在原有的基础上持续进步。除非理论解释效力的范围被拓宽了,否则真正的进步是不会发生的。

    如果一个新的理论解释了一些新的现象,但是没有解释大部分旧的事实,那它将不会被认为是对于旧的理论的全面超越,因此不会立即取代那些旧理论,而新理论和旧理论将会以竞争性的面貌并存,直到有一个能整合二者的新理论出现。

    二、消费者规则:警惕关联性原则的无效性

    科学发展的“跃进式”模式——我们可以称之为爱因斯坦综合征——让我们误入歧途,以为新的发现必定违反关联性原则。这一观念很危险,因为如果舍弃关联性选择,最大的受益者将是那些伪科学和伪理论的贩卖者。

    在伪科学家虎视眈眈的领域里,先前累积的事实数据看上去似乎是个巨大的绊脚石。然而事实上,这块绊脚石也无法阻挡这些伪科学家,他们有两种强有力的伎俩。

    ①解释数据前先将这个理论变得不可证伪,这样就令先前的数据毫无用处了。

    ②宣称先前的数据与他们的主题无关,因而不予考虑。为了实现“不予考虑”的结果,他们通常强调新理论呈现出“前所未有”的新颖性。类似“关于现实的全新观念”和“前所未有”这样的语句被频频使用。但实际上,真正的花招还在后面。“新理论”注定如此具有突破性,以至于源于其他理论测试的实验数据都被宣称是与之不相关的。只有能被新理论的框架所兼容的数据才会被考虑,也就是说,关联性原则被完全破坏了。

    三、“跃进”模式与渐进整合模式的比较

    事实上,很多科学领域的进步靠的都不是某一个突然的突破,而是由一系列不成重大影响的停顿及前进之前的反复所组成的。

    科学工作的不确定性是大部分公众所意识不到的。科学实验很少能完全确定某个东西,或支持某一理论从而排除其他理论。新的理论也很少能够全面超越所有先前存在的相互竞争的概念体系。很多问题的确定并不像科学电影里所描绘的那样,由一个关键实验所决定,而是要等到科学界逐渐开始有了共识,认为支持某种理论的证据比支持其他任何理论的证据要有力得多。

    科学家所评估的证据不是来自于某个设计得异常完美的实验的数据,与之相反,科学家往往需要去评估来自几十篇实验论文的数据,这些实验各有瑕疵,但都能提供部分答案。

    想想遗传学和分子生物学在过去一个世纪中的突飞猛进,这些进步的产生不是因为一个爱因斯坦式的伟人在关键时刻现身,然后搞定了一切。相反,数百个存在瑕疵的实验产生出来的数十种灵感和洞见,促成了现代生物学的整合。这些进步的发生,凭借的不是革命性地重构一些重大概念,而是几种都能站得住脚的不同解释进行长期与反复的交锋和对峙。经过十几年没有定论的实验、无数次的理论构思、争辩与批判,科学家们终于弄明白了基因到底是由蛋白质还是由核酸组成的。

    原子核的发现者恩斯特·卢瑟福强调了关联性选择的重要性,“科学家不能仅仅依靠一个人的观点,而是要依靠千万人的智慧。”

    卢瑟福的观点强调了另一种区分科学与伪科学的方法。科学总是遵循关联性原则,其特点在于众多个体的参与,而对这些的个体的贡献进行评判的标准,是看它在多大程度上加深了我们对自然界的了解。没有哪个单独的个体能够依靠其特殊地位来主导讨论。我们已经讨论过科学的这种公共性,相比之下,伪科学经常认为特定的权威和研究者才有接近真理的“特殊”机会。

    我们曾提出过两个理念,能为理解心理学的规则提供一个有用的情景。首先,科学上没有哪个实验是被设计得完美无缺的,对任何一个实验数据的解释都存在着不确定性。科学家们评估一个理论,往往不是坐等一个完美的或者关键的实验的出现,而是对大量局部存在瑕疵的实验的总体趋势进行评估。第二,许多科学在即使没有爱因斯坦的情况下也取得了进步。这些进步是蹒跚而曲折的,而不是通过伟大的“爱因斯坦式整合”那样的阶梯式跃进。和心理学一样,其他许多科学也都是由那些原本缺乏共同主题的知识不断累积和拼接而成。

    四、聚合性证据:在瑕疵中进步

    先前的讨论引出了一个证据评估的原则,这个原则在心理学中至关重要。它常被称作聚合性证据原则(或者操作聚合原则)。

    我们将探索两种方式来表述这个原则,一种是按照“瑕疵实验”的逻辑,另一种是按照理论检验。

    从极端上讲,导致一个实验出错的方式有无数种(或用术语来说,就是变得混淆)。然而在大多数情况下往往不会有那么多干扰性的关键因素。在某个特定领域中拥有丰富经验的科学家,往往很清楚什么是最关键的因素。因此,当对某一研究结果进行审查时,科学家总能察觉实验中的关键瑕疵。接下来,聚合性证据原则提示我们去审查相关研究文献所呈现的瑕疵模式,因为这类模式要么支持、要么否定我们想要做出的结论。

    安德森:“不同的方法很有可能涉及不同的假设,当一个假设能够通过众多基于不同假设的证伪检验时,我们可以说是得到了一个强有力的结论。”

    聚合性证据原则允许我们将结论建立在大量有些许差异的实验来源之上。这个原则之所以能让我们得出有说服力的结果,是因为这种方法所获得的结果一致性不大可能是由某个实验程序的特殊性所造成的。

    聚合性证据原则同样能以理论检验的形式加以表述。当一系列实验始终支持某个假定的结论,同时又能共同排除那些最主要的竞争性理论时,研究就具有高度的聚合性。尽管没有一个单一的实验能够排除所有的可能解释,然而一系列具有一定诊断效力的实验(如果所有数据都呈现某种特定趋势的话)就能产生一个极具说服力的结论。

    强调一下,没有一个实验能够检验所有的理论,但是汇总起来,一系列实验就能做出有力的判断。

    当一系列实验始终支持某个假定的理论,同时又能共同排除那些非常重要的竞争性理论时,研究就具备了高度的聚合性。尽管没有一个单独的实验能够排除其他可能的解释,但如果将一系列具有部分诊断性的研究按照上述例子中的方式加以汇总,就能得到一个比较有说服力的结论。

    最后,聚合性证据原则让我们摒弃一个误区,这个误区的形成是由于我们在第2章对于证伪性的讨论过分简单化所造成的。当时的讨论似乎让人觉得,当第一个与自己的理论相抵触的证据出现时,这个理论就算是被证伪了。然而事实并非如此,正如理论是被聚合性证据所支持一样,它也要被聚合性的研究结果所否定。

    五、心理学中的聚合性证据

    强调聚合的重要性的原因在于,心理学结论往往是建立在聚合性证据原则之上的。这个事实当然并不独特或罕见(在其他很多的科学中,结论也不是基于单一的、决定性的实验证据,而是基于众多结果不甚明晰的实验)。

    但这种情况在心理学中尤为突出,心理学实验的诊断性往往较低。也就是说,支持某一个理论的数据经常只能排除一小部分可能的解释,还遗留了许多有可能取代这种理论的“候补”理论。其结果是,只有收集并比较来自大量研究的数据之后,才能得到有说服力的结论。

    心理学实验具有高度模糊性的因素,因为其研究的问题涉及复杂的人类行为。心理学家应该承认,尽管心理科学已然存在并且在不断进步,但这种进步是缓慢的,并且许多结论往往都来自于令人感到折磨的长时间的统合和争论之中。

    在心理学中,我们必须像走钢索一样谨小慎微。例如,我们必须抵御这样的诱惑;当证据还不确凿时,就把某一假说当作已经证实了的理论来对待。与此同时,我们不应该对知识的不完整和最后结论有待探索等事情反应过度,并开始怀疑心理学究竟能否产生有说服力的结论。我们也不应该被“心理学不可能成为一名科学”这种非理性的主张所诱惑。根据这一立场,聚合性证据的原则可用来平衡对假设知识所做的过度诠释。

    实验室里也常常进行相关研究,而非实验室情景下也常常可以操纵变量。

    然而,所有这三种类型的研究都有其各自的缺陷,流行病学研究经常是相关性的,在变量之间存在虚假相关的可能性很高。实验室研究能被高度控制,但实验对象往往是动物而不是人类。医院环境下的临床实验在真正的治疗环境中使用人类作为被试,但仍有很多控制的问题,因为存在安慰剂效应和治疗病人的医疗团队的期望效应。但尽管每一种研究都存在问题,当来自不同方法的数据能较强地汇聚起来的时候,医学研究者们就能够做出有说服力的结论。

    六、科学共识

    用一个简单原理来总结:在评估心理学的实验证据时,心中要想的是“科学共识”,而不是“重大突破”;是“渐进整合”,而不是“大步飞跃”。

    七、研究方法和聚合性原则

    聚合性原则同样也意味着,我们应当乐于看到多种不同方法应用于各个心理学研究领域之中。因为不同的研究技术各有其优势和不足,用于获得特定结论的各种方法之间呈现一种相对的平衡是比较理想的。

    “旁观者现象”:一些人在看到他人处于危难之中时并不施以援手。

    “频率——效力效应”:一个陌生但看似有理的论断,不管是真是假,只要经过不断地重复,就会增加人们对它的相信程度。

    八、向更有效的研究方法迈进

    对于某个特定问题的研究,通常是从相对较弱的方法过渡到可以做出较强结论的方法。

    这个递进的顺序就是:从个案研究到相关研究,再到操纵变量。尽管并非每个研究领域都遵循这个渐进式途径(有时不同类型的研究同时进行),但这一向更有效方法迈进的进程的确是普遍发生的。

    有一个错误观念“相关研究在科学中没有什么用处”。的确,当一个因果关系的假说需要验证时,操纵变量的研究方法更受青睐。然而,这并不意味着相关研究对于知识的获得毫无帮助。

    首先,许多科学假设是以相关或者不相关的形式来表述的,因此这类研究是在直接验证这些假设。第二,尽管相关并不意味着因果关系,但因果关系一定包含相关。也就是说,如果一个相关研究不能肯定地证实因果关系的假设,那它可以起到排除这一因果假设的作用。第三,相关研究或许比它们看上去更有用,因为最近新发展的复杂相关设计可以让研究者做出有限的因果推论。

    然而,最重要的原因可能在于,有时出于道德或伦理的考虑,我们无法对一些变量进行操纵(例如营养不良或肢体残障)。而另外一些变量,诸如出生顺序、性别、年龄等,则因其无法被操纵而具有天然的相关性,涉及它们的科学知识也因此必须建立在相关证据基础上。

    九、不要对矛盾数据感到绝望

    聚合性原则的最后一个启示是,当一个问题的最初的研究结果看上去有些矛盾时,我们不应该感到绝望。

    证据融合过程就好比一个调焦过程。幻灯片的模糊影像就如同互相矛盾的数据,或者是那些支持多重假设的证据。

    这些矛盾只不过是因为我们对问题理解得还不够充分,这些矛盾还可能仅仅是偶然事件,或者源于不同实验在方法上的细微差异。

    在心理学和其他科学里,将来自不同研究的证据整合起来形成一个结论,已经能够通过一种更为正式的方法来实现,这就是一种叫做元分析的统计技术。

    在医学语境中,元分析就是:将许多临床实验的数据汇总起来,形成一个足够大的数据库,以消除困扰单个实验的统计的不确定性。元分析的最大优点,就是能从结果遍布的多个实验之中产生出一个明确的结果。

    使用元分析来确定心理学结论的有效性,和医学的情形是类似的。两个实验组的比较得出的效应,可以纳入一个常规的统计矩阵中,这个矩阵能进行研究之间的比较。接着,这些结果以一种标准化的方式加以统计整合。如果整合过程达到了一定的统计学标准,就能形成一个关于这些效应的结论。当然,在某些情况下,有可能无法确定的得出一个结论,这时元分析的结果就是非结论性的。

    美国心理学会的一支团队工作在心理学期刊上所做的关于统计方法的一番阐述,为本节内容提供了一个恰当的总结。这个工作团队说:“研究者不应针对单个研究的结果做出解释,就好像其他文献所报告的结果与之毫无关系似的。”不同研究结果之间达成聚合效应,才有利于推动科学进步。一个研究的结果也只有通过针对特定问题的诸多研究获得聚合性解释,才是有意义的。

    2019-07-16 15:53:04 回应
  • 第184页 打破“神奇子弹”的神话

    人的行为是由多重原因共同决定的。

    任何一个特定行为都不是由某个单独的变量引起,而是由许多不同的变量共同决定的。

    但人们常常忘记行为是由多重原因决定的,他们似乎要去寻找那颗所谓的“神奇子弹”——即他们感兴趣的、造成行为的唯一原因。

    和本书中谈到的许多其他原则一样,具备原因多样性的观念非常重要。

    一方面,它提醒我们不要过于依赖单一的原因解释。因为这个世界盘根错节,影响行为的因素也多样而复杂。虽然我们可以证明某一变量引起了某一行为,但并不代表已经发现了影响该行为的唯一原因,甚至是最重要的原因。为了对某种特定行为做出全面的解释,研究者必须探讨各种各种不同的变量对它的影响,并把这些研究结果整合起来,才能完整地描绘出所有与该行为有关的因果关系。

    另一方面,虽然说某个变量只是影响特定行为的众多因素之一,并且只能解释这一行为的一小部分,但并不是说这个变量就是无足轻重的。首先,这一关系可能具有深远的理论意义。其次,这一关系可能具有应用价值,尤其当这个影响变量是可以进行人为控制的时候,如前面提到的电视暴力降低1%,那我想没有人人为它是无关紧要的。总之,如果问题行为至关重要,那么懂得如何去控制其中一个哪怕非常小的原因也具有非凡的价值。

    总之,一个结果是由多重变量决定的这一事实,并没有降低任何一个与结果存在因果相关的变量的重要性——即使这一变量仅能让结果产生很小的变化。

    一、交互作用

    交互作用:当影响行为的一个因素和另一个因素共同起作用时,它们会对该行为产生与各自单独起作用时截然不同的影响。也就是一个自变量的影响效果依赖于另外一个自变量的不同水平。

    研究者们总结道:“这个研究结果支持了这样一个理论结构,即对于那些在社会经济条件较低的家庭中成长的儿童而言,先天的生理缺陷和后天不良的环境因素会成为他们发展中累积性危害因素。”

    同样地,另一项有关验证抑郁症的“体质——压力理论”的研究表明,消极生活事件与三种脆弱的心理因素共同起作用,导致罹患抑郁症的可能性达到最大。这三种因素是:归因风格(倾向于把消极事件归因为一些稳定的、整体的因素)、对自我作消极判断,以及对任何行为后果进行消极推断的总体倾向。

    原因多样化的概念可能比你最初设想的要复杂得多。不仅需要追踪并测量影响问题行为的种种可能因素,还必须考察这些变量是如何共同起作用的。

    二、单一原因解释的诱惑

    2019-07-19 12:01:28 回应
<前页 1 2 后页>