要避免無所不在的各種陷阱與誤導,除了統計學知識以外,也要養成警覺的習慣,做出重要決定以前,先謹慎思考一番,不要輕易被看似有力的花言巧語蒙蔽。
有個流傳很廣,版本很多的老笑話「跳蚤的耳朵長在腿上」:如果把跳蚤的腿切斷,再叫跳蚤跳起來,跳蚤一定跳不起來,由此可知跳蚤的聽覺器官長在腿上。
稍微想想就知道大錯特錯,跳蚤有腿才能跳躍,沒有腿當然跳不起來,腿和聽力不需要有任何關係。雖然是笑話,這個笑話卻生動地提醒我們,一同發生、看似有關的兩件事情,關係也許不是表面上看起來那樣。
然而現實中,即使受過高等教育的人,也常常犯下「跳蚤的耳朵長在腿上」這類錯誤,甚至採用錯誤的推論,進而做出錯誤的決策。
現代的學術與產業應用中,大量運用「相關(correlation)」概念分析數據, 適用的範圍很廣,像是性別、生活習慣、年齡、居住區域等條件,都可以與收入、工時、健康狀況等特徵一同分析,得到像是「年齡愈高,罹患癌症機率愈高」之類的結果。只要搜集到足夠的數據,都可以做出相關性分析,而且一定可以得到結果寫成報告。在這個獲得大量資訊愈來愈方便的時代,相關性分析也相當流行。
但是兩者相關,不見得也有因果關係,「相關不意謂因果(correlation does not imply causation)」是統計學課程一定會教育學生的概念,可是當面臨千變萬化的現實世界時,卻不容易避免無所不在的陷阱。
有時候,相關性分析本身統計方法沒問題,卻是建立於錯誤的假設或取樣偏差上,因此會得到沒有意義的超展開結果。舉個很離譜的空想案例,一位統計方法很厲害,卻完全沒有地球人文常識的火星人,想研究先天遺傳與後天收入之間的關係,於是選擇比較北韓與法國國民,研究收入與遺傳的關聯性,發現真的有不少遺傳變異與收入高度相關!
北韓人收入低,是因為遺傳到一堆貧窮基因?這樣詮釋當然十分離譜,北韓低收入是國家與政治因素造成的,不論一個人的遺傳如何,只要活在北韓,很高機率收入高不到哪裡去。可惜這麼基本的道理火星人不懂,做出報告受到師長鼓勵以後,他更進一步搜集資料後計算出:遺傳上英國人與法國人的關聯性高,收入較高的關聯性也高;台灣人與北韓人遺傳上的關聯性高,收入較低的關聯性也高。
於是火星人得到結論:一系列關聯性分析指出,只要了解遺傳變異,就能預測收入高低!比較北韓與法國人找到的遺傳變異,可以用於預測其他區域的人的收入。
由於一開始的無知與錯誤假設,一連串分析愈來愈超展開,也愈錯愈離譜。這個火星人的例子乍看很可笑,但是在地球人的世界中,把空想案例的法國與北韓換成其他名詞,公衛、醫學、商業、行銷、媒體、政治等等領域,卻也存在許多相關性分析,透過花言巧語包裝的頭頭是道,實際上卻完全脫離現實。更糟糕的是,這類錯誤研究還會影響後續決策。
我們都活在非常複雜的現代社會,每天處理大量資訊,做出購物、醫療、投資、投票等各種決策。要避免無所不在的各種陷阱與誤導,除了統計學知識以外,也要養成警覺的習慣,做出重要決定以前,先謹慎思考一番,不要輕易被看似有力的花言巧語蒙蔽。
作者 / 寒波