数据,真的是表里如一吗?你是否也在被“大数据”在控制着选择?
数据背后的真相,真的如它表面的信息一致吗?大数据,给你带来生活的便利,还是在逐渐控制你的思想,影响你的选择?
“如何解释数字背后的意义,取决于数字使用者的理念或需求”
---一样的数值,但表达者不同的背景、不同的目的,使用不同的表达方式,向看数据的人传递他们想让世人看到信息。所以,每个数字都包含表达者的私心。
数字能给予人们更形象化去了解某事。但数据本身却带有展示者的私心,单一数据不能证明一个观点,多维度数据才更有说服力。所以,不要仅仅看单一数据而下判断。
对于问卷调查,需要注意:
1.问卷需保持中立,不可作为引导选择,则该数据也失去准确性。
2.不能以偏概全,不能把某些群体排除在外,不能以某些群体来代表所有。
3.数据样本量过少,会影响数据准确性。
“相关性并不自动意味着因果关系,因为其中可能存在偶然事件、缺少某个因素,或关联是相反的”
---有相关性,只能多一个参考思考的方向,并不代表是因果。数据分析,需要多方面考虑,不能单看表面就代表结果。你永远都不知道“黑天鹅”什么来临,未被发现不代表不存在。
“而本应捕捉现实的数字,最后却取代了现实。”
---“大数据”给人们带来更“精准”的选择,但同时也在影响人们的思想,限制他们的选择,让人们跟随它们的“选择”而选择,让人们逐渐失去独立思考的能力。这个不是之前人们一直畏惧人工智能的点吗?但我们却一步步被“清水煮青蛙”,一步一步被控制着。
“算法并不存在好坏之分,而取决于人们使用它的方式。”
---这个便是贯彻全文,作者想表达的中心思想。数字没有任何意思,是使用者给予它们意思。
“如果你想要鉴别某种行为时不是滥用数据,了解认知偏差以及个人直觉很重要。不过,也许最重要的,你得弄清楚这个问题:这份数据由谁提供?数据的结果与此人存在利益关联吗?”
---面对一份数据,要学会保持清醒,要学会多方面思考。不要让数据牵着鼻子走。
“核对清单,当你看到数据时,该怎么做?”
- 这个数字是由谁提供的?
---要了解这个数据提供者的背景,这意味着这数据的使用者想让我们看到什么?
- 我对这个数字有什么感觉?
---无论你对这个数据有什么样的感受,接受它。并且用另外一个角度去寻找其他资料来源。
- 人们是如何将它标准化的?
---“尝试去搜索一下,假如用其他方法衡量这个概念,得出的数据结果会是什么样。”
- 数据是如何被采集的?
----不同的采集方式,得出得结果都会有不同。一份数据可能只适合某个群体而非所有。
- 数据是如何被分析的?
---不同的分析方法,都是为了数据使用者来表达他们观点,但事实是否如他们说表达一样呢?
- 数据时如何呈现的?
“数据的呈现方式经常出现的问题:
- 一个平均值:如果数据中存在着将其大幅拉高或者降低的异常值,则该平均值并不能完全反映整体情况的平均水平。
- 一个精确的数字:有各式各样的原因均能导致数字最终无法被十分精确地呈现出来。请不要被从表面上看起来很精确的数字欺骗。
- 一份排名:通常来说,在一份排名中的上下两个位次之间并没有什么太大的区别,因为其中存在不确定性。
- 一个风险:当你读到“患某种疾病的可能性增加了X%”时,如果你不知道这X%是什么的百分之X,那这句话其实没有什么意义。因为若是原本的可能性就很小,那么增加了百分之X之后的可能性依然很小。
- 一张图表:一个不合适的纵轴可能会扭曲整张图呈现出来的结果。请确保它没有受到国度的拉伸或挤压。“
说明 · · · · · ·
表示其中内容是对原文的摘抄