社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

正面迎戰

台灣軍備與中國新式軍備若進入正面衝突,結果高度可預期:短期內以「高強度、飽和打擊、關鍵節點癱瘓」為主軸,戰場首先不是灘岸決戰,而是資訊、指管通情、空海軍基地與後勤節點的存續。多個公開兵推與研究都指出,開戰初期飛彈與遠程精準火力會大量消耗守方的機場、港口與地面防空資產,迫使防禦轉向分散、機動與韌性維持,並把核心目標從「逐件攔截」改為「維持作戰功能」。 中國是否有辦法用導彈破壞台灣重要基礎建設。能力層面,解放軍的火箭軍、巡弋飛彈與精準打擊鏈條,確實具備對固定且可識別目標造成嚴重破壞的潛在能力;其演練也多次呈現「模擬打擊關鍵基礎設施」的訊號。 但「能破壞」不等於「能達成戰略目的」。基礎設施分為可快速修復與難以修復兩類:電力、通訊、交通樞紐即使被擊中,仍可能透過備援、繞路、快速搶修與分區供應恢復部分功能;相反地,若長期反覆打擊、結合網攻與封鎖,才更可能把社會運作壓到臨界點。RAND 對台灣民防與韌性研究強調,戰時關鍵在於供電、通訊、物流、醫療等體系的「持續運作能力」而非零損。 台灣國防報告也把「韌性、備援、整體防衛」作為重要方向,反映官方已將「被打仍能運作」視為必備假設。 台灣是否武裝以備就可以和共軍打仗。答案是:台灣能打,但「打得贏」取決於戰型與外部變數。若是全面登陸入侵,防衛的可行路徑是以不對稱方式提高解放軍跨海投送成本,把戰局拉長,讓其後勤與政治承受不起。CSIS 兵推多次出現「代價巨大、勝負取決於介入與補給」的結論,顯示台灣單靠傳統對稱軍備很難在火力與產能上長期對拚,但能透過地面防禦、機動火力、海空拒止、分散指管與民防韌性,讓入侵變成不可承受的賭局。 因此,互戰的現實結果更可能呈現三點:第一,初期基礎設施與軍事節點受損顯著,社會成本高;第二,台灣若能維持指管、分散戰力、快速修復與持續補給,就能維持拒止;第三,戰爭走向會被封鎖強度、外援速度、國際制裁與資訊戰效果共同塑形,而不只是單純的飛彈交換。 蔡文邦  

China’s Claims Over Taiwan and the Question of Force

China has consistently asserted that Taiwan is part of its territory and that reunification is inevitable. This position is not new, but in recent years Beijing has repeated it with […]

民進黨退此一步,即無死所 !

對於藍白黨的欺壓,干法亂紀,民進黨退無所退,退此一步,即無死所 ! 民進黨不要再存婦人之仁,「與人為善」,可不要以當年蔣經國金言「打落牙齒和血吞」為念,非到失敗不輕言失敗!—— 你們真的不知道你們還剩下甚麼?眼前的一塊鬆土,再退一步,就是懸崖峭壁! 你們不要希望綠營廣大羣眾會再當你們的「保鑣」、「禁衞軍」、「青鳥」,只要以台灣為名,一呼百應,會再拉你們一把!人若不懂得「自助」,還希求他人幫助?即使心存仁厚,以「自由民主」為至上價值的台灣人民,也會心灰意冷! 你們這幾年來是不是吃的太肥厚了,行動失能,好吃好吃,所以「爭權奪利」,禍起蕭牆,看得出還有「理想」的依存嗎?是不是需要學習習近平主席的「莫忘初衷」,以敵為師,來警告和激勵你們! 台灣人民等著看,只剩下「不副署」、「不公告」唯一的憲政救命繩索,民進黨會不會仍然「該硬不硬」,跟人家搓圓仔湯,與人為善嗎 !容忍比自由重要,君子雖可欺之以直,當「偽君子」又何妨 ? 你們不懂得自己也就罷了,你們可不要不懂得你們的敵人,要繼續「大仁大義」,再說百次千次,總有一次敵人會回心轉意,那就等著萬劫不復的命運 :不要相信民進黨某大人物的妖言「台灣人民不選我(民進黨),選誰?」 世變日急,萬物再迅速變動中,台灣人民可不會再「命定的」跟著你們,他們一定會另找新機。香港的「民主黨」內外交迫,不得不「解散」:殷鑑不遠,雖是老話,民進黨真的有人會放在心上? 民進黨諸位大公貴人,生死存亡之際,記得另個史實:南宋的末日,蒙古騎兵追捕,無步可退 ;忠臣陸秀夫背著、綁住幼主,跳厓自盡,跟著跳厓有數百名南宋官員和宗親:南宋的「幼主」,就等於台灣的「自由民主」!誰會是台灣的「陸秀夫」和數百名忠心耿耿的官員和宗室 ? 作者: 戴震

國民黨的成本

在經歷一場大規模罷免選戰後,國民黨實際上已付出極高的政治成本。這不只是輸贏問題,而是組織能量、資金結構與內部信任的全面消耗。罷免戰役動員了大量地方系統、黨工與金主資源,卻未能換來對等的政治回報,反而加深社會對藍營「動輒以對抗取代治理」的負面印象。 在這樣的背景下,黨主席鄭麗文仍需面對一個極為現實的問題:每月高達三千萬台幣的黨工人事支出。這筆錢不是抽象數字,而是來自地方募款、企業捐助與政治信用的總和。當黨的勝選前景轉弱、金主信心動搖時,主席是否還能穩定承擔這樣的現金流壓力,本身就是一場硬仗。 更關鍵的是「倒戈後還爬得起來嗎」這個問題。大罷免若被外界解讀為戰略誤判或政治冒進,責任最終必然回到黨中央。一旦地方派系與中間金主開始切割,鄭麗文在黨內的權威將不再來自職位,而取決於她是否仍被視為「能帶黨走向勝利的人」。政治現實很殘酷:沒有勝算的主席,黨內耐心通常不會太久。 這種情勢勢必影響明年的縣市長提名。提名本質上是資源配置與風險控管的結果,而不是單純的派系協商。如果黨中央財務吃緊、民調走弱,地方實力派候選人將更傾向保守操作,甚至出現延後表態、觀望、或要求更大自主權的狀況。部分搖擺選區,也可能出現黨中央提名力下降、地方各自為政的現象。 總結來看,大罷免不只是一次政治攻防,而是一場對國民黨「組織耐久度」的壓力測試。鄭麗文是否還能站得住腳,關鍵不在於她的立場強硬與否,而在於她能否在資金、提名與勝選機率之間重新建立一個讓黨內相信值得繼續下注的敘事。若做不到,影響的不只是一任主席,而是整個藍營接下來數年的選舉結構。 作者:那麼

Recent Posts

正面迎戰

正面迎戰

台灣軍備與中國新式軍備若進入正面衝突,結果高度可預期:短期內以「高強度、飽和打擊、關鍵節點癱瘓」為主軸,戰場首先不是灘岸決戰,而是資訊、指管通情、空海軍基地與後勤節點的存續。多個公開兵推與研究都指出,開戰初期飛彈與遠程精準火力會大量消耗守方的機場、港口與地面防空資產,迫使防禦轉向分散、機動與韌性維持,並把核心目標從「逐件攔截」改為「維持作戰功能」。 [...]

More Info
China’s Claims Over Taiwan and the Question of Force

China’s Claims Over Taiwan and the Question of Force

China has consistently asserted that Taiwan is part of its territory and that reunification is inevitable. This position is not new, but in recent years Beijing has repeated it with […]

More Info
民進黨退此一步,即無死所 !

民進黨退此一步,即無死所 !

對於藍白黨的欺壓,干法亂紀,民進黨退無所退,退此一步,即無死所 ! 民進黨不要再存婦人之仁,「與人為善」,可不要以當年蔣經國金言「打落牙齒和血吞」為念,非到失敗不輕言失敗!—— 你們真的不知道你們還剩下甚麼?眼前的一塊鬆土,再退一步,就是懸崖峭壁! [...]

More Info
國民黨的成本

國民黨的成本

在經歷一場大規模罷免選戰後,國民黨實際上已付出極高的政治成本。這不只是輸贏問題,而是組織能量、資金結構與內部信任的全面消耗。罷免戰役動員了大量地方系統、黨工與金主資源,卻未能換來對等的政治回報,反而加深社會對藍營「動輒以對抗取代治理」的負面印象。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way