是時候知道我們不知道了
这篇书评可能有关键情节透露
評價我既想寫力薦又想寫很差。如之前的評論者們,力薦給原書的內容,很差給翻譯。
以下嚴格來說是讀書筆記,兼有評論,就扔在這裡吧。
先占個坑,慢慢添加。
本書要講的內容總結起來就是:人的腦子天生不懂邏輯、統計和概率。即使經過後天學習,直覺反應仍然跟沒學差不多。以下的錯覺每個人都有,包括我自己,所以代詞我都將用“我們”。
一. 關於代表性的錯覺。
對先驗概率不敏感。在沒有證據時,我們會適當地利用先驗概率,在有無用證據時,我們會忽視先驗概率。
對樣本規模不敏感。我們會忽略小樣本的平均值更容易偏離總體平均值這個統計規律。
相信小數率。我們相信隨機過程中的一小段也應該表現出隨機性的特徵。
對可預測性不敏感。在明知可預測性不高的情況下,仍然高估現有信息的預測能力。
對預測的信心主要依賴於所具代表性的程度。
對回歸平均的誤解。連續多次擲硬幣擲出正面后,對下一次出反面的信心大增。誤以為懲罰差表現有益,獎勵好表現有害,這時又忘了回歸平均。
關於便利性的錯覺。我們通過對人物和事件的熟識程度而非統計結果來判斷這類人物事件發生存在的概率。Why we do this ? Because it is convenient. 我們部落時代的祖先,如果經常聽說有夥伴被蛇咬,就可以很有信心地判斷自己被蛇咬的概率也很高,我們在叢林里走的時候就要小心長得像蛇的東西。這種判斷法在我們的祖先的時代,活動範圍小,接觸的人少的時代,可以節省腦容量。We have small brain back then.
容易想起來的事例會顯得概率較大。比如世界上的名人顯得比較多,雖然我們明知道這不是事實,但是我們每天聽到看到的都是他們的消息。
搜索集的有效性。按首字母找字比較容易,所以即使第三個字母為特定字母的詞較首字母為特定字母的詞多,我們還是覺得前者較多。
容易想像的事情顯得容易發生,而想像不到的事情會顯得不太可能發生。
我們在運用危險的邏輯:通常發生頻率高的事件能較生動較快地憶起,這樣的聯繫多了,我們就用結果等價于起因,儘管我們都知道命題為真推不出逆命題為真。
調整和初始化(anchoring)。
初始數據會使得推測結果產生偏向。即使初始遇到的數據跟推測的對象毫無聯繫。
我們過於相信小樣本體現出的“規律”,對所謂規律實際是隨機的結果毫無意識。
當做放回遊戲時,樣本總量被擴充為無窮大,這時樣本容量越大推測結果越可靠。
代表性擊敗law of 複合概率小於單一概率。描述越清楚,越顯得概率較大。
親眼見到的事情會顯得更可能發生在自己身上,儘管在這個大世界(unlike the tribla small world)這一點並不正確。這種傾向會使我們高估能看到的危險/機會的概率,低估我們沒親見的危險/機會的概率。
P(X)=P(Y)等價于P(X/Y)=P(Y/X)。這裡是等價關係發生的地方。我們卻認為只有推出而無反推存在。當明顯得X是Y的原因時,我們不認為Y可以推出X。
假陽性的false alarm:患病A的可能性為P(X),檢測結果為陽性的概率為P(Y),則假陽性的概率為:P(非X and Y)。問題:P(X /Y)是多少?
當P(X)<< 1,我們可以用P(非X and Y)來近似P(Y),用P(X) 來近似P(X and Y),其結果就約等於:P(X)/P(非X and Y)。如果P(X)也遠小於P(非X and Y),P(非X and Y)也相當小,則陽性卻沒病的概率相當大。比如:P(X)=十萬分之一,P(非X and Y )= 千分之一,Reasonable heh? 此時P(X/Y)約等於百分之1。Conclusion: Don't panic. Yet.
後面的越寫越難懂,或者是我閱讀能力太差,或者是翻譯的用詞不好。我能記得的最重要的兩點:1. 我們高估我們做估計的能力。2.我們低估極低概率事件發生的概率,且不理解先驗概率隨著新事件的發生被條件概率取代這一點。
以下嚴格來說是讀書筆記,兼有評論,就扔在這裡吧。
先占個坑,慢慢添加。
本書要講的內容總結起來就是:人的腦子天生不懂邏輯、統計和概率。即使經過後天學習,直覺反應仍然跟沒學差不多。以下的錯覺每個人都有,包括我自己,所以代詞我都將用“我們”。
一. 關於代表性的錯覺。
對先驗概率不敏感。在沒有證據時,我們會適當地利用先驗概率,在有無用證據時,我們會忽視先驗概率。
對樣本規模不敏感。我們會忽略小樣本的平均值更容易偏離總體平均值這個統計規律。
相信小數率。我們相信隨機過程中的一小段也應該表現出隨機性的特徵。
對可預測性不敏感。在明知可預測性不高的情況下,仍然高估現有信息的預測能力。
對預測的信心主要依賴於所具代表性的程度。
對回歸平均的誤解。連續多次擲硬幣擲出正面后,對下一次出反面的信心大增。誤以為懲罰差表現有益,獎勵好表現有害,這時又忘了回歸平均。
關於便利性的錯覺。我們通過對人物和事件的熟識程度而非統計結果來判斷這類人物事件發生存在的概率。Why we do this ? Because it is convenient. 我們部落時代的祖先,如果經常聽說有夥伴被蛇咬,就可以很有信心地判斷自己被蛇咬的概率也很高,我們在叢林里走的時候就要小心長得像蛇的東西。這種判斷法在我們的祖先的時代,活動範圍小,接觸的人少的時代,可以節省腦容量。We have small brain back then.
容易想起來的事例會顯得概率較大。比如世界上的名人顯得比較多,雖然我們明知道這不是事實,但是我們每天聽到看到的都是他們的消息。
搜索集的有效性。按首字母找字比較容易,所以即使第三個字母為特定字母的詞較首字母為特定字母的詞多,我們還是覺得前者較多。
容易想像的事情顯得容易發生,而想像不到的事情會顯得不太可能發生。
我們在運用危險的邏輯:通常發生頻率高的事件能較生動較快地憶起,這樣的聯繫多了,我們就用結果等價于起因,儘管我們都知道命題為真推不出逆命題為真。
調整和初始化(anchoring)。
初始數據會使得推測結果產生偏向。即使初始遇到的數據跟推測的對象毫無聯繫。
我們過於相信小樣本體現出的“規律”,對所謂規律實際是隨機的結果毫無意識。
當做放回遊戲時,樣本總量被擴充為無窮大,這時樣本容量越大推測結果越可靠。
代表性擊敗law of 複合概率小於單一概率。描述越清楚,越顯得概率較大。
親眼見到的事情會顯得更可能發生在自己身上,儘管在這個大世界(unlike the tribla small world)這一點並不正確。這種傾向會使我們高估能看到的危險/機會的概率,低估我們沒親見的危險/機會的概率。
P(X)=P(Y)等價于P(X/Y)=P(Y/X)。這裡是等價關係發生的地方。我們卻認為只有推出而無反推存在。當明顯得X是Y的原因時,我們不認為Y可以推出X。
假陽性的false alarm:患病A的可能性為P(X),檢測結果為陽性的概率為P(Y),則假陽性的概率為:P(非X and Y)。問題:P(X /Y)是多少?
當P(X)<< 1,我們可以用P(非X and Y)來近似P(Y),用P(X) 來近似P(X and Y),其結果就約等於:P(X)/P(非X and Y)。如果P(X)也遠小於P(非X and Y),P(非X and Y)也相當小,則陽性卻沒病的概率相當大。比如:P(X)=十萬分之一,P(非X and Y )= 千分之一,Reasonable heh? 此時P(X/Y)約等於百分之1。Conclusion: Don't panic. Yet.
後面的越寫越難懂,或者是我閱讀能力太差,或者是翻譯的用詞不好。我能記得的最重要的兩點:1. 我們高估我們做估計的能力。2.我們低估極低概率事件發生的概率,且不理解先驗概率隨著新事件的發生被條件概率取代這一點。