社會觀察 x 獨立評論 x 多元觀點 x 公共書寫 x 世代翻轉
   
首頁 >> 吶喊廣場 >> 偽陽性誤判太多,調降p值門檻就好?
 

偽陽性誤判太多,調降p值門檻就好?

 
2017/9/24     寒波
 

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波



關鍵字 : 社會, 統計,

分享此文章
 

關於作者


寒波 
 
 
 

相關文章


 
2018/1/21 雲鶴

知識份子的美麗與哀愁

 
2018/1/21 楊庸一

「今日你以台大為榮,明日台大以你為榮」

 
2018/1/20 吳傳立

幹話無極限的資訊時代與言論自由

 
 

留言


沒有迴響

本文不開放迴響。

精選文章

川習會的中美矛盾是戰略,不是貿易!

「看不見」的貧窮                            

統測落幕後,苦無人知的高職生!

軍公教有三種!

鬼島勞工實錄—未來你有錢也找不到師傅

不該發生的空難 - 機師憶空難調查報告

才買屋入住,一生積蓄就震掉了 — 從地震看租購選屋的眉角

八仙樂園爆炸案:缺乏常識造成的災難

眷村子弟的悲哀和奮鬥

彰化縣民輪替後的哀與愁

敲醒台商的中國夢

新文明病:儲物症(Hoarding disorder)似正在增加

華爾街之狼 — 金錢是罪惡,還是德性?

熱門文章

從教室到街頭:科大教師的命運

學校行政大逃殺

年終綁績效,私立科大超血汗!

王育敏:這樣的不分區立委,你還要嗎?

[轉] 中共要掌控對台「制空制海權」

勞基法爭議,學生們憑什麼走上街頭?

蔣公銅像 上網拍賣 創造多贏局面

蔣經國:再怎麼美化造神都只是個獨裁屠夫

才買屋入住,一生積蓄就震掉了 — 從地震看租購選屋的眉角

知識份子的美麗與哀愁

蔡政府想推行的是「計劃經濟」?

[轉] 台灣所謂的「農民曆」 來自德國人編製

龍團隊螺絲若鬆,小心年底陰溝裡翻船

你能忍受自己血汗稅金被集體分贓嗎?

民進黨,是你不懂胖虎!?

從『歐陽妮妮、娜娜事件』,我們看到了什麼?

Gogoro電池技術規格化,是圖利廠商還是產業發展?

選票利益與理念價值的拔河!

小嫻婚變中,重構的「女性形象」!

生氣的魔術師

多少論文發表後,從來沒有被引用?

在面對新版的勞基法,移工將如何發聲呢?

霹靂布袋戲為何失敗?

白狼說,「醒醒吧!中華民國根本沒有了」

讀博士,請多想學術以外的路

[轉] 國民黨要靠「經國牌」站起來?

從〈勞基法〉看戒嚴一代的勤勞經濟觀

「時代力量」只是劃出一道光芒,暗夜中的流星?

比特幣衝上17萬後 — 破解網路買幣第三方詐騙

中式民族主義讓強國人智商降低