社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

當法學修養淪為惡毒咀咒時…

身為一名教師,我總是站在講台上,不厭其煩地教導孩子們:「語言是溝通的橋樑,不是傷人的利刃;我們要學會同理,學會尊重。」然而,當我們要求孩子們溫柔待人時,看著新聞畫面裡政治人物的言行,我的心情卻無比沉重。當孩子們指著電視螢幕,天真地問我:「老師,為什麼電視上的大人可以這樣說話?」我竟一時語塞,不知該如何向他們解釋這殘酷的社會現實。 去年12月底,民進黨質疑多位藍委赴廈門參與台商協會活動的動機時,兼任國民黨文傳會主委的吳宗憲立委竟反指「沈伯洋父親的器官還健在嗎?」聽聞此言,我感到無比痛心與震驚。這早已超越了政黨間的政治攻防,而是赤裸裸地踩踏了人性的底線。 我們所認知的法律人修養,是建立在對人權的捍衛、對生命的尊重,以及對公平正義的追求之上。曾為檢察官的吳宗憲將應有的法學素養拋諸腦後,取而代之的,竟是拿政敵家人的健康與生命來進行惡毒的咀咒。法律的初衷本是保護弱勢、維護社會秩序,而非作為逞口舌之快、攻擊政敵的武器。當法學專業淪為包裝惡意的糖衣,這不僅是對專業的褻瀆,更是對社會道德底線的公然挑戰。 這樣惡毒的話語並非一時失言,竟是吳立委一貫的用詞習慣。近日,面對宜蘭縣長選舉的競爭對手林國漳民調領先時,吳立委竟又輕飄飄地拋下一句:「在跑行程的時候一切平安、順利。」在台灣這塊土地上,這句話有著令人無法忽視的歷史重量。對於走過台灣民主化進程的人來說,這句話輕易地勾起了那些不願觸碰的歷史傷疤。我們不能忘記,在那個威權統治、一黨獨大的年代裡,「平安」兩個字是多麼奢侈的祈求。 我們都還記得,陳水扁前總統當年競選台南縣長時,他的妻子吳淑珍女士在謝票行程中遭遇的那場車禍悲劇。那場意外不僅改變了一個家庭的命運,更是台灣民主轉型期一道深深的血痕。在那個年代,候選人的家屬走在路上,是真的面臨著難以預測的生命風險。因為有過那樣慘痛的歷史,我們更加珍惜如今得來不易的民主與安全。政治人物的一言一行,都應該具有對歷史的敬畏與對人民的疼惜。將「跑行程平安」作為一種帶有暗示性、詛咒性的政治語言,無論是有心還是無意,都是在台灣社會的歷史傷口上撒鹽,更是對民主價值的粗暴踐踏。這是一位堂堂國會議員、一位法律人應有的修養與格局嗎? 身為一個母親、一個老師,我衷心期盼我們的政治環境能少一點戾氣,多一點理性和溫暖。我們努力在校園裡播下善良的種子,卻深怕這些幼苗在充滿暴戾之氣的社會氛圍中枯萎。政治人物作為公眾表率,更應謹言慎行,因為你們的每一句話,都在形塑著下一代看待世界的方式。我們不需要在別人的傷痛上建立自己的政治舞台,更絕對不能容忍用恐懼和詛咒來恐嚇對手。在台灣這塊土地上,善良、尊重與同理心,永遠比惡毒的言語更有力量。 作者:宜和蓒 

無人機國家隊的轉機?通牒延期下的72億預算攻防,國安建設不該被當政治籌碼

中東局勢出現短暫的五天空窗,表面上像是遠方戰火的暫停鍵,實際上卻是一面照妖鏡:現代戰爭的主旋律正在從昂貴平台轉向可量產、可消耗、可快速迭代的無人系統。也因為如此,國內「無人機國家隊」預算卡關的爭議再度浮上檯面。副院長鄭麗君以中東戰況示警,強調非對稱作戰已不是概念,而是迫切需求;台灣若在預算上持續空轉,等同把防衛主動權拱手讓人。 五日延期帶來的最大啟示,不是「戰爭可能避免」,而是「戰爭可以被拖延、卻無法被保證」。外部強權的決策常以談判、油價、選舉與同盟協調為優先順序,台灣若把安全寄託在別人的時間表上,等同把自己的生存交給不確定性。無人機恰恰是最需要「平時就做、平時就備」的能力:從研發、測試、量產到訓練與後勤,都不是臨戰才補得起來的缺口。 更現實的壓力在於供應鏈。五天若轉瞬變回全面衝突,全球關鍵零組件將優先流向正在作戰或高度備戰的國家。感測器、通訊模組、電池、抗干擾元件與部分軍規晶片,可能在出口管制與需求暴增下迅速短缺。屆時就算預算通過,也可能面臨「有錢買不到、買到交期拉長」的困境。無人機國家隊的價值不只在於買裝備,而在於把核心能力留在島內:零組件替代料件、系統整合、抗電子戰、批次維修、飛手訓練與戰術資料回饋,形成可持續迭代的國防產能。 因此,預算審查若被拖成政治攻防,代價不是某個部會的面子,而是國家時間窗口的消耗。真正該爭論的,是這筆錢如何花得更有效:採購規格是否以可量產為優先、是否建立跨軍種共通的操作與維保體系、是否把反制無人機與電子戰配套一起納入、是否用公開透明的績效指標避免資源被切碎。這些問題都需要專業審查,但不需要把國安建設當作政治祭品。 結論很簡單:五日空窗不是喘息的理由,而是加速的理由。當世界把無人機當成戰場基本語言,台灣若還把預算當成角力工具,等於在危機逼近前主動降低自己的生存機率。國安預算可以嚴審,但不該被凍結;可以要求透明,但不該讓空轉成為常態。 作者:新公民議會編輯小組

川普喊停以色列卻照炸?德黑蘭再遇空襲揭露美以同盟的戰略裂縫

川普剛宣布延緩打擊不久,以色列國防軍隨即對德黑蘭展開新一輪空襲,即使聲稱避開能源設施,仍等於把盟友的「暫停鍵」直接按掉。這不是單純的戰場節奏差,而是2026年美以對伊朗策略目標出現分岔:美國要的是可控升級、讓伊朗回到談判桌並壓住油價;以色列要的是窗口期內最大化軍事效果,把長期威脅一次打穿。當盟友不再同一步調,真正的風險不在於多一波空襲,而在於威懾與談判的信度被同時削弱。 對川普而言,延緩打擊的核心不是仁慈,而是交易。他需要用「最後通牒」創造談判槓桿,同時避免油價失控回燒國內通膨與選情。通牒之所以有效,前提是對手相信美國能控制升級的開關。然而,以色列在同一時間拉高衝突強度,等於把開關從「可控威脅」變成「不可控連鎖」,讓伊朗更容易把局勢解讀為既然躲不過,就以報復建立嚇阻。於是川普原本想用五日緩衝換取降溫,反而可能變成伊朗加速動員的倒數計時。 對以色列而言,獨走也不是情緒,而是戰略算術。納坦雅胡政府面對的是「威脅必須可逆轉」的安全邏輯:只要伊朗的指揮、研發與供應鏈尚能修復,拖延就是讓對手回血。因此以色列更傾向持續打擊關鍵節點,把戰爭成本留在伊朗境內,而不是把主導權交給談判桌。問題在於,這種作法會把美國推到一個尷尬位置:要嘛被迫跟進,承擔更高升級風險;要嘛切割盟友,承擔同盟裂解的政治成本。 更棘手的是「紅臉白臉」一旦演成真裂痕,市場與對手會迅速學會利用。伊朗可以對外宣稱美國管不住以色列,藉此合理化更激烈報復;也能對內動員「被圍攻」敘事,讓和談派失勢。國際油市則會把這種不一致解讀為衝突不可預測,風險溢價難以下修。最後受損的不是某一次通牒,而是美國在中東的「可管理性」形象:盟友失控、對手更硬、第三方更不信。 以色列的獨走提醒各國一件事——當同盟目標不一致,戰爭會從軍事對抗滑向決策失靈。川普要的是可談的戰爭,以色列要的是可終結的戰爭;兩者拉扯越久,越容易把中東推向高報復、高油價、低可控的長期震盪。 作者:新公民議會編輯小組

布蘭特原油急跌又反彈:市場為何不信「口頭和平」,荷莫茲海峽才是關鍵變數?

川普宣布暫緩擴大打擊後,原油價格出現典型的「急跌—回彈」走勢:油價先因風險溢價退潮而快速下挫,隨後又因伊朗態度、航運安全與供應鏈現實未解而回到高檔震盪。這種電梯式波動要讀成一個訊號:市場願意為「降溫姿態」打折,但不會因為一句話就重估地緣風險;真正的定價核心仍是荷莫茲海峽是否恢復可預期的通行量。 先看下跌端的邏輯。市場在短時間內最怕的是「供給被切斷」的尾部風險,一旦美方釋出延後或保留空間,交易員會立刻回補過度堆疊的避險部位,尤其在期貨與選擇權的槓桿結構下,去槓桿會把跌幅放大。路透報導顯示,消息一出油價出現超過一成的回落,顯示市場把「立即升級」的機率先下修。 但為什麼很快又彈?因為「通行量與保費」這類硬指標沒有跟著好轉。即使政治語言緩和,只要船舶仍因安全風險而不敢走、保費與延誤成本仍高,實體供應就不會回來。Kpler 的追蹤指出,在封鎖與風險升高後,荷莫茲海峽油輪運輸量曾出現劇烈下滑,等於用數據告訴市場:你可以相信談判,但你不能假設供應已經恢復。 此時油價的反彈不是「看多」,而是「不敢放空」:在供應仍脆弱的條件下,任何擦槍走火都會讓缺口立刻擴大。 「口頭和平不值錢」的第二個原因,是川普式談判的可信度折價。先拉高威脅、再給緩衝,確實能創造談判空間,但也讓市場更依賴下一個訊號:是否出現可驗證的降風險行為,例如實際放行、護航航線建立、攻擊目標收斂、或第三方監管機制上線。沒有這些可觀測成果,價格就只能在「隨時再升級」的陰影下維持風險溢價。 對台灣而言,問題不在於油價某一天收在哪,而在於「高波動」本身會轉化為成本:能源採購難以鎖價、航運與保險費用上升、電力成本與物價預期被拉高。當油價在 100 美元附近反覆拉鋸,企業對下季成本只能保守估算,轉嫁到終端價格的速度會更快,通膨黏性也更高。這就是為什麼油價跳水後的回彈,反而比單邊上漲更危險:它打亂了所有人的預算與避險模型。 結論很直接:油價是否真正降溫,不取決於政治人物的宣示,而取決於荷莫茲海峽的「可預期通行」能否恢復,以及航運風險溢價是否實質下降。短期內,市場仍會對任何「降溫訊號」快速反應,但只要實體物流沒有改善,價格就會用反彈把懷疑寫回去。 作者:新公民議會編輯小組

Recent Posts

當法學修養淪為惡毒咀咒時…

當法學修養淪為惡毒咀咒時…

身為一名教師,我總是站在講台上,不厭其煩地教導孩子們:「語言是溝通的橋樑,不是傷人的利刃;我們要學會同理,學會尊重。」然而,當我們要求孩子們溫柔待人時,看著新聞畫面裡政治人物的言行,我的心情卻無比沉重。當孩子們指著電視螢幕,天真地問我:「老師,為什麼電視上的大人可以這樣說話?」我竟一時語塞,不知該如何向他們解釋這殘酷的社會現實。 [...]

More Info
無人機國家隊的轉機?通牒延期下的72億預算攻防,國安建設不該被當政治籌碼

無人機國家隊的轉機?通牒延期下的72億預算攻防,國安建設不該被當政治籌碼

中東局勢出現短暫的五天空窗,表面上像是遠方戰火的暫停鍵,實際上卻是一面照妖鏡:現代戰爭的主旋律正在從昂貴平台轉向可量產、可消耗、可快速迭代的無人系統。也因為如此,國內「無人機國家隊」預算卡關的爭議再度浮上檯面。副院長鄭麗君以中東戰況示警,強調非對稱作戰已不是概念,而是迫切需求;台灣若在預算上持續空轉,等同把防衛主動權拱手讓人。 [...]

More Info
川普喊停以色列卻照炸?德黑蘭再遇空襲揭露美以同盟的戰略裂縫

川普喊停以色列卻照炸?德黑蘭再遇空襲揭露美以同盟的戰略裂縫

川普剛宣布延緩打擊不久,以色列國防軍隨即對德黑蘭展開新一輪空襲,即使聲稱避開能源設施,仍等於把盟友的「暫停鍵」直接按掉。這不是單純的戰場節奏差,而是2026年美以對伊朗策略目標出現分岔:美國要的是可控升級、讓伊朗回到談判桌並壓住油價;以色列要的是窗口期內最大化軍事效果,把長期威脅一次打穿。當盟友不再同一步調,真正的風險不在於多一波空襲,而在於威懾與談判的信度被同時削弱。 [...]

More Info
布蘭特原油急跌又反彈:市場為何不信「口頭和平」,荷莫茲海峽才是關鍵變數?

布蘭特原油急跌又反彈:市場為何不信「口頭和平」,荷莫茲海峽才是關鍵變數?

川普宣布暫緩擴大打擊後,原油價格出現典型的「急跌—回彈」走勢:油價先因風險溢價退潮而快速下挫,隨後又因伊朗態度、航運安全與供應鏈現實未解而回到高檔震盪。這種電梯式波動要讀成一個訊號:市場願意為「降溫姿態」打折,但不會因為一句話就重估地緣風險;真正的定價核心仍是荷莫茲海峽是否恢復可預期的通行量。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way