【笔记】用数据说谎容易,但是用数据说出真相却很难
0p 安德烈斯:用数据说谎容易,但是用数据说出真相却很难。
3p 无论什么问题,统计学都极少提供唯一“正确”方法。但是,基尼系数确实以一种便捷易懂的形式为我们提供了一个重要社会现象的一些宝贵信息。
8p 统计学的一个核心功能就是使用手中已有的数据进行合理推测,以回答我们还未掌握所有信息的“大”问题。简言之,我们能够使用“已知世界”的数据来对“未知世界”进行推断。
8p 统计学存在的意义就是简化,因此不可避免地会丢失一些内容和细节,任何一个数字工作者对此都要心知肚明。过分依赖会带来误导性的结论或导致不良行为。
11p 概率就像是武器库里的一件武器,需要使用者有较强的判断力。当然,有时候判断和赚断的界限就是那么模糊。
15p 战争是为了与真实存在的敌人作战,而不是与假想敌作战(唐纳德·拉姆斯菲尔德)。学习的意义不是做题和炫耀,而是用来认清我们的生活。
23p 数据越多,事实越模糊。信息过量的表格其实相当于什么都没有告诉我们。因此,我们需要简化。
59p 百分率不会说谎,但它们会夸大其辞。
62p 虽然“你无法管理你无法衡量的事物”,但你最好要保证你所衡量的,正是你努力想去管理的。
62p 学生父母的教育程度和收入会对孩子的成绩产生不可忽视的影响。
64p 提供有意义的信息与将这些信息浓缩成一个权威排名完全是两码事。在某些时候,统计学的功能仅仅是让数据看上去更顺眼。
68p 利昂·波特斯坦:人们喜欢看到简单的答案。什么是最好的?当然是第一名。
111p 蒙提·霍尔悖论告诉我们,对概率的本能理解有时候会将我们引入歧途。
117p 金融市场的潜在风险并不像抛硬币那么容易预测,VaR这样的模型所呈现出的“伪精准”会给投资者带来虚幻的安全感。
117p 失准的速度表对司机来说比没有车速表更危险:对于失准的测速表的信任或“参考”会忽略其他提示车速的不安全信息;但如果车里压根儿就没有车速表,你反而会小心地注意四周,寻找能够告诉你车辆当前行使速度的参照物。
134p 绝大多数的统计学书籍都想当然地以为读者使用的都是好数据,就像每一本烹饪食谱都觉得你不会购买不新鲜的肉和腐烂的蔬菜一样。但是,如果基础数据本身就有问题,那么再缜密严谨的分析也是徒劳。
136p 从直觉出发。就像从一锅汤舀出一勺进行品尝,如果之前搅拌得充分均匀,那么这小小的一勺汤足以告诉你整锅汤的味道了。
144p 发表性偏见:无论在医学还是其他领域,否定性的发现都显得单调乏味。
150p 如果把统计学比作侦探工作,那么数据就是线索。优质的数据就是好的线索,但首先我们必须熟悉到优质数据,而这要比看上去困难得多。
218p 并不是那些“权力越大、责任也越大”的压力置你于死地,而是那种等着上司给你布置任务,但自己又没有权力决定怎么完成、何时完成这些任务的压力把人压垮了。换言之,高官们所承受的风险远远小于其秘书,因为这些助理对自己的工作任务“缺乏控制力”。
218p 回归分析:在控制其他因素的前提下,对某个具体变量与特定结果之间的关系进行量化。也就是说,我们能够在保持其他变量效果不变的情况下,将某个变量的效果分离出来。
239p 样本越小,结果就越分散。
246p 不要用你的研究杀人。
292p 每一样东西都有一个重要的功能,每一样东西都能让我们的生活变得美好,但每一样东西如果被滥用都会造成严重的后果。
3p 无论什么问题,统计学都极少提供唯一“正确”方法。但是,基尼系数确实以一种便捷易懂的形式为我们提供了一个重要社会现象的一些宝贵信息。
8p 统计学的一个核心功能就是使用手中已有的数据进行合理推测,以回答我们还未掌握所有信息的“大”问题。简言之,我们能够使用“已知世界”的数据来对“未知世界”进行推断。
8p 统计学存在的意义就是简化,因此不可避免地会丢失一些内容和细节,任何一个数字工作者对此都要心知肚明。过分依赖会带来误导性的结论或导致不良行为。
11p 概率就像是武器库里的一件武器,需要使用者有较强的判断力。当然,有时候判断和赚断的界限就是那么模糊。
15p 战争是为了与真实存在的敌人作战,而不是与假想敌作战(唐纳德·拉姆斯菲尔德)。学习的意义不是做题和炫耀,而是用来认清我们的生活。
23p 数据越多,事实越模糊。信息过量的表格其实相当于什么都没有告诉我们。因此,我们需要简化。
59p 百分率不会说谎,但它们会夸大其辞。
62p 虽然“你无法管理你无法衡量的事物”,但你最好要保证你所衡量的,正是你努力想去管理的。
62p 学生父母的教育程度和收入会对孩子的成绩产生不可忽视的影响。
64p 提供有意义的信息与将这些信息浓缩成一个权威排名完全是两码事。在某些时候,统计学的功能仅仅是让数据看上去更顺眼。
68p 利昂·波特斯坦:人们喜欢看到简单的答案。什么是最好的?当然是第一名。
111p 蒙提·霍尔悖论告诉我们,对概率的本能理解有时候会将我们引入歧途。
117p 金融市场的潜在风险并不像抛硬币那么容易预测,VaR这样的模型所呈现出的“伪精准”会给投资者带来虚幻的安全感。
117p 失准的速度表对司机来说比没有车速表更危险:对于失准的测速表的信任或“参考”会忽略其他提示车速的不安全信息;但如果车里压根儿就没有车速表,你反而会小心地注意四周,寻找能够告诉你车辆当前行使速度的参照物。
134p 绝大多数的统计学书籍都想当然地以为读者使用的都是好数据,就像每一本烹饪食谱都觉得你不会购买不新鲜的肉和腐烂的蔬菜一样。但是,如果基础数据本身就有问题,那么再缜密严谨的分析也是徒劳。
136p 从直觉出发。就像从一锅汤舀出一勺进行品尝,如果之前搅拌得充分均匀,那么这小小的一勺汤足以告诉你整锅汤的味道了。
144p 发表性偏见:无论在医学还是其他领域,否定性的发现都显得单调乏味。
150p 如果把统计学比作侦探工作,那么数据就是线索。优质的数据就是好的线索,但首先我们必须熟悉到优质数据,而这要比看上去困难得多。
218p 并不是那些“权力越大、责任也越大”的压力置你于死地,而是那种等着上司给你布置任务,但自己又没有权力决定怎么完成、何时完成这些任务的压力把人压垮了。换言之,高官们所承受的风险远远小于其秘书,因为这些助理对自己的工作任务“缺乏控制力”。
218p 回归分析:在控制其他因素的前提下,对某个具体变量与特定结果之间的关系进行量化。也就是说,我们能够在保持其他变量效果不变的情况下,将某个变量的效果分离出来。
239p 样本越小,结果就越分散。
246p 不要用你的研究杀人。
292p 每一样东西都有一个重要的功能,每一样东西都能让我们的生活变得美好,但每一样东西如果被滥用都会造成严重的后果。
有关键情节透露