社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

國會多數的立法笑話:台灣《財劃法》荒唐劇

立法院去年底,在國會多數的在野黨「卓越領導」下,強行通過了新版《財政收支劃分法》。這部法案堪稱台灣立法史上的奇葩,不僅完美演繹了何謂「無視專業」,更以其「神來一筆」的公式設計,成功癱瘓了國家財政,讓高達新台幣365億元的經費成為「立法僵屍」,動彈不得。 首先,在立法程序上,這部法案完全展現了什麼叫「效率至上」。不需要公開、不需要透明、更不需要專業審議,只需憑藉多數優勢,就能如風雷般通過。這種「多數黨專政」的奇景,充分體現了美國政治學者杜瓦傑「批判」缺乏公開、透明且專業的審議,憑藉多數優勢直接通過,徹底背離了民主立法的協商精神。 反觀那些「落後」的民主國家,例如:德國,財政法案的修訂總要經過冗長且無聊的專家委員會討論,還得確保什麼「科學性」與「公平性」,簡直多此一舉。台灣的在野黨以實際行動證明,國會不是為民謀福的殿堂,而是政治鬥爭的「最佳擂台」。 其次,該法案的內容設計更是荒謬至極。不僅在分配公式上「巧妙」地獨厚自家政黨執政縣市,更因其小學數學知識的貧乏,弄錯了分母基數,導致執行上窒礙難行。我們的在野黨更展現了「凡事賴給政府」的態度,好康的,趕快拿走,有問題中央解決,事權全部丟給中央。也就出現台北市長蔣萬安、新北市長侯友宜、台中市長盧秀燕明明每年將多出約三、四百億預算,卻為6、7億元的學校電費哭窮的「表演」。 令人匪夷所思的是,明明是藍白立委闖的禍,藍白16位縣市首長靖召開聯合記者會批評政府。搶著當領頭羊的台中市長盧秀燕批判政府要放下屠刀,認為政府刻意刁難公式的解讀。 真的是政府刁難公式解讀嗎?假設台中市長盧秀燕為激勵士氣,決定提撥1000萬元的績效獎金,要分配給市府內部的 20個局處(例如:法制局、交通局等)。獎金分配辦法白紙黑字寫著,各局處之分配比例,依據該局處的年度考評分數,占「各縣市全體局處」年度考評總分的百分比計算。問題來了,獎金的分配對象是市府內部的20個局處,但計算分母卻是各縣市全體局處,約莫440個局處。 結果主計處一算,發現20個局處的考評總分僅佔全部考評總分的4.5%,高達95.5%、955萬的獎金成了「幽靈獎金」。請問盧市長,你會跟主計處說,我們不要「拘泥」於分母,直接把這1000萬,按照那20個局處彼此間的分數比例分掉就好,不要故意刁難嗎? 最後,解方何在?在野黨胡亂立法,藍白兩黨就該負起全部的負責,哪有在野黨縣市首長嚷嚷著民進黨政府要全盤負責的道理。這就像是數學老師在黑板上出了一道錯到離譜的題目,結果還叫學生想辦法解出來,不然就等著考零分一樣。 這場鬧劇的始作俑者,正是國會中那群掌握多數的在野黨。請主動承認錯誤,立即啟動修法程序,並回歸專業,邀請真正的專家學者參與。行政院別傻傻當代罪羔羊,這筆爛帳,誰種的因,誰就該承擔果。 作者:秦靖  

民眾黨內亂的開始 ?

柯文哲又回家了,是不是民眾黨開始會有內亂 ?台北的政治達人不以為然,因為民衆黨內沒有人有那實力和意志,敢對「最高精神領袖」造反,包括所謂的「黨主席」黃國昌在內。 不分區立委「兩年制」柯文哲一定會實施,他說「這是對的事 !」—— 對的人當然要做「對的事」,才可表彰誰才是老大,是誰的話說了算!民眾黨也可度過了近兩年「挾天子以令(黨內)諸侯」,「假老大」的尷尬期 。 柯文哲要拿回黨的大權,要開全國黨代表大會?只要問一般黨員是誰比較像「領袖」?柯文哲 ?還是黃國昌 ?就可知曉。論語說:君子有三變,望之儼然,即之也溫,聽其言也厲。政治人格的總和,誰比較像「人君」?比較像有那麼一回事,會是那位咆哮,面紅而赤,會勒人脖子,「三姓家奴」的主席嗎 ? 以前有人說柯文哲沒有實實在在的「中心思想」,說的雖然是,人家至少有個樣子,人家會說「量子力學」。這下又被關了一年的潛移默化,雖然距離「曼德拉」的典範仍然遙遠,他一定可以開館授徒,跟小草們,談AI ,—— 康乃爾大學的那位法學博士行嗎 ? 民眾黨不分區立委「兩年制」明年一實施,黃國昌主席立即喪失「根據地」,不再有八名的立委同志的支援,國民黨傅堒萁總召要「摸頭」,可能要尋找另位英雄好漢的大好頭顱了!—— 誰說明年民眾黨的全代會,不會選出另一位「主席」? 那麼明年陪了夫人又折兵的民眾黨前主席,要何去何從 ?山不轉人轉,台中的盧媽媽不是正在廣發英雄帖,此處不留人,自有留人處。 黃主席策馬南下,義不反顧,帶著殘留的小草軍,投靠盧媽媽去耶!誰說2028年,痞子不再是另一條翻雲覆雨的英雄好漢。士別三月,可以刮目相看,可不要把人家看的太衰! 看來年,何人可以繼續咆哮,震天動地,何等人家可以自以為比天公高 ?—— 去它的民眾黨主席!去它的國民黨新北市 ! 作者 : 李隱

Ko Wen-je Returns: Will the TPP Descend into Chaos?

Ko Wen-je has returned home. Does this signal the beginning of turmoil within the Taiwan People’s Party (TPP)? Political insiders in Taipei do not think so. Their reasoning is simple: […]

看閱兵,學自律?

台北市和平高中的廖姓英文老師在課堂上播放中國「九三閱兵」影片,以「整齊劃一」之名對高三學生進行強調「自律」的重要性。當學生對教材的適切性提出質疑時,這位老師竟以「台灣就是太自由,不喜歡可以離開教室」作為回應。 如果整齊劃一、口號震天就是自律與紀律的最高體現,這位廖老師更應該給學生們觀賞北韓所有的官方影片。在那些精心編排的畫面裡,群眾何時該拍手、何時該落淚、何時該展現笑容,無一不是完美的整齊劃一。那樣的場面,難道就是廖老師所推崇的「自律」嗎?顯然不是。那是高壓統治下,個人意志被徹底抹除後,僅存的集體性神經反射。將這種源於恐懼的服從,美化為學生應當學習的「自律」,是對教育最大的侮辱。 閱兵所展現的,從來不是發自內心的自律,而是「槍桿子對著你」的絕對服從。這是一種外在的規訓,其本質是威權的展演,旨在震懾與恐嚇。我們的老師非但未能引導學生思辨其背後的權力關係,反而對這種以武力為後盾的「紀律」洋洋得意,並將其奉為圭臬。 如果中國閱兵所代表的集體性真能內化為人民的自律,又要如何解釋中國人民在國際間屢屢因旅遊水準而備受詬病與諸多層出不窮的失序行為呢?近日,松山機場便上演了一齣鬧劇,一名中國大媽因攜帶大量藥品回中國導致行李超重,需補繳3600元費用,竟當場情緒失控、脫鞋坐地哭鬧耍賴,這難道是閱兵場上那種「自律」的延伸嗎?此外,從在義大利米蘭機場因行李超重而躺地打滾,到在日本民宿留下滿室垃圾,再到因班機延誤而在外國機場鼓譟唱國歌,這類行為早已讓「中國遊客」成為一個充滿負面標籤的群體。連中國官方都不得不設立「旅遊不文明行為記錄」來試圖約束亂象。這些鮮活的案例,無一不在嘲諷著那種將外在規訓等同於內在品格的淺薄論調。 最諷刺的,莫過於廖老師面對學生質疑時脫口而出的那句「台灣就是太自由」。台灣的自由,保障了學生擁有獨立思考、提出質疑的權利,也正是這種所謂的「教學自由」,讓一位缺乏民主素養、混淆服從與自律、面對質疑只會驅趕學生的老師,得以安穩地站在講台上,向我們的下一代灌輸如此扭曲錯亂的價值觀。而允許這樣的教學繼續存在,才是對台灣教育最大的不自由。 作者:宜和蓒  

Recent Posts

國會多數的立法笑話:台灣《財劃法》荒唐劇

國會多數的立法笑話:台灣《財劃法》荒唐劇

立法院去年底,在國會多數的在野黨「卓越領導」下,強行通過了新版《財政收支劃分法》。這部法案堪稱台灣立法史上的奇葩,不僅完美演繹了何謂「無視專業」,更以其「神來一筆」的公式設計,成功癱瘓了國家財政,讓高達新台幣365億元的經費成為「立法僵屍」,動彈不得。 [...]

More Info
民眾黨內亂的開始 ?

民眾黨內亂的開始 ?

柯文哲又回家了,是不是民眾黨開始會有內亂 ?台北的政治達人不以為然,因為民衆黨內沒有人有那實力和意志,敢對「最高精神領袖」造反,包括所謂的「黨主席」黃國昌在內。 不分區立委「兩年制」柯文哲一定會實施,他說「這是對的事 !」—— 對的人當然要做「對的事」,才可表彰誰才是老大,是誰的話說了算!民眾黨也可度過了近兩年「挾天子以令(黨內)諸侯」,「假老大」的尷尬期 。 [...]

More Info
Ko Wen-je Returns: Will the TPP Descend into Chaos?

Ko Wen-je Returns: Will the TPP Descend into Chaos?

Ko Wen-je has returned home. Does this signal the beginning of turmoil within the Taiwan People’s Party (TPP)? Political insiders in Taipei do not think so. Their reasoning is simple: […]

More Info
看閱兵,學自律?

看閱兵,學自律?

台北市和平高中的廖姓英文老師在課堂上播放中國「九三閱兵」影片,以「整齊劃一」之名對高三學生進行強調「自律」的重要性。當學生對教材的適切性提出質疑時,這位老師竟以「台灣就是太自由,不喜歡可以離開教室」作為回應。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way