undefined

作者整篇文章中,提到了許多的例子,說明我們的直覺有時會偏頗,當從大數據的角度去看時,往往會看到意料之外的觀點。

 

一開始作者提到大多數的美國人,包括籃球教練和他自己,認為NBA球員大多數在貧困的環境下長大。但事實上真的是這樣嗎?

事實是中產階級的男性比貧窮男性更具優勢,推測有兩個可能原因,

1.窮人往往較矮,而身高對能否成為NBA球員有關鍵影響。例如:不到六呎的男性,每200萬人只有1人進NBA;但身高超過七呎,每5人就有1人成為NBA球員。

2.平均來看,中產階級比較可能教出有紀律、堅持不懈的孩子。例如:喬丹在12歲時因打架被退學,但他爸爸是奇異公司設備主管,媽媽是銀行家,喬丹生涯充滿家人為他指點迷津的故事。

 

也就是NBA球場上,像LeBron James這樣的球員,其實是少數而且很不容易的。

 

作者還舉了其他故事,當中我覺得有趣的是,「為何有些人誠實報稅,有些人會逃漏稅?」

規定是這樣,當申報的課稅所得為9000美元時,可以從政府那裏拿到一張退稅支票,一旦超過,會被扣額外的稅。

所以美國人會適時調整自己工作計畫,確保剛好符合9000美元的門檻嗎? 不是這樣的。

另外這類型的詐欺,在不同地區差異也很大,在邁阿密高達30%;在費城,比例只有2%。

 

結果顯示,有兩個因素影響了地區跟不誠實報稅的相關性,

1.相當多人口有資格申請稅額扣抵。

2.當地稅務專業人員過度集中。

 

這代表大多數人不知道如何申報來拿到最多稅抵,但只要你認識,或你知道有人認識稅務助理,就會大大增加妳逃漏稅的機率。

我覺得從這個觀點出發,彷彿可以看到人們在茶餘飯後交談時,得知如何逃稅的驚訝與興奮,蠻有趣的。

 

但如果都從大數據出發來觀察相關性,有可能讓我們倒果為因,例如作者提到「學校排名跟人們賺多少的相關性」。平均而言,工作十年後的薪水,哈佛大學比賓州州立大學的畢業生,薪水約高3.5萬美元。但這個相關性,並不代表因果關係。

 

實驗比較了背景相似且申請上同一所大學的學生,但最後有些人選擇不同大學就讀,結果發現這些學生的事業所得,和職場成就其實差不多。

特別的是,現實世界卻呈現許多誤導我們的觀點,會大量展示哈佛校友的成功案例,卻較少提到賓州大學校友的故事。

 

大數據可以幫助我們,找出問題背後重要的因子,但作者在文末也有提醒,過度依賴數據,也有可能過度推論了真實世界的情況(像overfitting的意思?),這是需要注意的地方。

 

一些想問的問題:

1.為什麼現實世界會選擇提供我們,不一定有因果關係的推論? 

2.那我們可以怎麼明辨這樣的推論是否合理呢?

arrow
arrow
    創作者介紹
    創作者 hao613.ee05g 的頭像
    hao613.ee05g

    皓祥的閱讀筆記

    hao613.ee05g 發表在 痞客邦 留言(0) 人氣()