社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

2026年回看318太陽花運動:如何重塑台灣政黨版圖與選民結構?

2026年談318太陽花運動,重點早已不只是「那場占領是否正當」,而是它如何在十二年內重塑政黨版圖、改寫選民結構,並把「兩岸議題」從少數人的政治口號,變成各黨必須面對的長期制度問題。318的影響不是一次性爆炸,而是把台灣政治推進一套新的競爭規則:誰能說服選民自己既能保安全、又能管經濟,誰就能取得執政正當性。 318首先改變的是民進黨的路線位置。運動前,民進黨內部仍存在相當比例的「經貿務實派」與「風險保守派」拉扯;運動後,反黑箱、反過度依賴中國的社會能量,迫使民進黨把「制度防線」與「國安風險」更前置,形成後來更清晰的「抗中保台」主軸。這讓民進黨在2016、2020能把國安與民主價值轉換成選票,但同時也帶來後遺症:當選民的焦慮從主權延伸到房價、電價、薪資與育兒,民進黨必須在「安全敘事」之外,交出足以支撐生活的治理成績,否則318所累積的道德優勢會被耗損成純粹的身份動員。 國民黨則是在318後被迫「去理所當然」。過去國民黨可以把兩岸經貿包裝成效率與繁榮,把質疑者貼上反商與反全球化標籤;但318把程序正義與透明審議變成新門檻,使國民黨在兩岸論述上長期背負「黑箱」與「過度親中」的政治成本。即便國民黨嘗試回到民生與地方治理,也很難完全切割兩岸立場的歷史包袱。更關鍵的是,318把一批年輕選民推向政治化,使國民黨的世代更新壓力提前到來:不只要換人,更要換一套可信的風險控管語言。 第三個結構性變化,是「第三勢力」的崛起與碎片化。318培養出大量參與政治、倡議透明與監督的社會人才,讓小黨與新政治得以在2014到2016迅速擴張,並一度改寫國會生態。這股能量後來部分被吸納進既有政黨,部分則在選舉現實與治理落差中分裂,形成今天更常見的局面:第三勢力仍能在特定議題上引爆輿論,但要穩定成為長期執政替代選項,仍面臨組織、人才、財務與地方經營的硬門檻。318讓「監督」變成政治商品,但也讓選民逐漸看懂:監督不是治理,反對也不等於方案。 因此,2026年的政黨版圖可被視為318效應的成熟期:民進黨承接了國安與制度防線的正當性,但必須用民生績效續命;國民黨想靠地方與經濟議題回血,卻持續被兩岸立場與信任赤字拉住;第三勢力的議題穿透力仍在,但若缺乏可執行的政策與可擴張的組織,就容易在大選被迫選邊或被邊緣化。 318的真正遺產,是把台灣政治的主戰場從「誰更會談」推向「誰更能承擔風險」。當選民要求的不只是立場,而是可驗證的制度、透明的程序、以及在危機下不崩盤的治理能力,政黨競爭就不可能回到過去那種單線敘事。這也是為什麼十二年後,318仍然影響每一次選舉:它改寫的不是某一場勝負,而是台灣政治的底層評分標準。 作者:新公民議會編輯小組

太陽花運動12週年PTT熱議:從反黑箱到能源焦慮,青年世代的兩岸經貿觀點為何轉向?

太陽花運動十二週年之際,今日媒體再度出現大量回顧與檢討。討論核心不再停留在「當年對不對」,而是聚焦「今天還剩下什麼問題」。最顯著的變化,是青年世代的政治語言從「主權焦慮」逐步移向「生存焦慮」,並把兩岸經貿放回更功利、更風險控管的框架重新計算。 2014年的太陽花運動,強調反黑箱與程序正義,反對的不是貿易本身,而是以快速通過、社會未充分審議的方式處理高風險的制度性連結。那一代人把「制度」視為防線,擔心的不只是短期就業或產業得失,而是政治依附與規則被改寫。這套論述在當時有效,因為台灣處於對中國市場高度依賴、且國內對風險透明度極度不信任的階段。 十二年後,更常見的語氣是:世界已經變了,風險來源不只中國,也包含全球供應鏈重組、地緣衝突、能源價格、通膨與房價。青年世代面對的壓力更直接,也更日常化。當生活成本、電價與工作機會成為每月都要結算的帳,政治口號的邊際效用下降,議題被迫回到「可用性」與「可承受性」。因此,討論服貿是否仍有空間,不是回到舊時的親中或反中,而是以更冷的方式問:台灣能承擔多大依賴?能換到什麼條件?如果風險發生,止損機制在哪裡? 這種轉向並不等於對太陽花的否定,而是世代在現實約束下的再定義。務實派主張通常包含三個邏輯:第一,中國經濟下行與外資撤退,使「單向押注中國紅利」的吸引力下降,談也不等於賺;第二,供應鏈與科技管制升級,任何深度服務業與資料流連結都牽涉資安、個資、監理與制裁風險;第三,台灣的籌碼在於半導體與高附加價值產業,不在低門檻的市場開放,因此真正關鍵是「談判能力」與「國內治理」,而不是把協議本身神聖化或妖魔化。 同時,另一派仍維持太陽花的核心警覺:程序不透明與監督不足才是問題根源。即便今天有人更在意民生,也不代表能接受以「經濟焦慮」作為降低審議與監理的理由。尤其在能源焦慮升高的年代,任何涉及關鍵基礎設施、電力系統、港口物流、金融支付、數位平台的跨境合作,都可能被視為國安與韌性議題的一部分。也因此,「兩岸經貿」在2026年的語境裡,已很難只用貿易來理解,而必須被拆成供應鏈、法規、資料治理、產業安全與風險對價。 青年世代的觀點確實改變,但改變方向不是從理想退回犬儒,而是從單一價值戰場走向多維度風險管理。太陽花留下的政治遺產,不只是一句反黑箱,而是把「透明、審議、可退出的制度設計」變成衡量兩岸經貿的基本門檻。當情懷不再足以說服人,政策必須用可驗證的條件、清楚的成本效益、以及可執行的風險控管,才能重新取得青年信任。 作者:新公民議會編輯小組

柯文哲赴東京出境聲請遭駁回:法院為何認定「非必要」與「無引渡風險」才是關鍵

柯文哲申請在3月23日至25日「暫時解禁」出境赴日,目的為參加兒子柯傅堯在東京大學的畢業典禮,但台北地方法院裁定駁回。這起裁定之所以引發高度討論,不只因為柯文哲具政治人物身分,更因法院在理由中明確把案件拉回兩個核心:出境限制的風險控管,以及聲請目的是否具「必要性」。 首先,法院處理此類出境聲請,重點不在「想不想去」,而在「能不能放」。裁定指出,柯文哲雖提出邀請函,能證明典禮日期與地點,但法院進一步判斷:柯文哲是否到場,並非典禮得以如期舉行的要件。換言之,典禮的成立與進行,不以柯文哲出席為前提;就算未能前往,也不會影響柯傅堯取得學位。這個論證把「家庭情感需求」與「司法風險管理」做了切割:個人想參與不等同於司法必須放行。 其次,檢方在實務面提出的疑慮,成為裁定背景的重要支撐。若受科技監控或更嚴格身分限制者仍要出境,司法必須面對一個現實問題:一旦人在境外,後續程序能否確保回國、到庭、執行裁判。法院也在裁定中點出關鍵風險:台灣與日本之間欠缺可直接對接的司法互助或引渡機制。當引渡與強制返國的手段不足,法院在「放行」與「確保審判可進行」之間,必然偏向保全後者。 第三,裁定也反映一種司法判斷標準:若要解除出境限制,聲請人需要提出降低逃亡疑慮、確保返國的具體方案,而不是只提供行程目的與邀請文件。法院在意的不是行程本身,而是出境後的可控制性。當可控制性不足,或替代方案不明確,法院即傾向維持既有處分,以避免審判程序因不可逆的「人不回來」而受損。 整體而言,這次駁回並非針對「畢業典禮」做價值判斷,而是依循司法一貫邏輯:出境限制屬程序性風險管理工具,解除必須建立在「必要性」與「可控性」同時成立。法院用「儀式不以其出席為必要」與「跨國執行風險高」兩條理由收束爭點,也等同宣示:司法不會因當事人身分或議題熱度而放寬標準,仍以審判可進行與裁判可執行作為優先序。 作者:新公民議會編輯小組

川習會會不會辦?2026年3月最新訊號、變數與可能時程

近期「川習會」是否成局,關鍵不在單一宣示,而在中東戰事牽制、談判議題堆疊、以及雙方內部政治成本三股力量的拉扯。多家媒體報導指出,川普原本被外界解讀可能在3月底與習近平會面,但川普近日對外稱因美伊衝突等因素,已向中方要求延後,並引發市場與外交圈對美中「貿易休兵」能否延續的疑慮。 從北京的公開表態看,中國外交部口徑偏向「保持溝通」但不給細節:承認雙方就訪問時間等議題維持聯繫,卻不說新的時間表,這通常意味著「門沒關、但條件未談妥」。而路透的解讀更直白:峰會延後本身就會讓原本建立在政治互信上的貿易安排「罩上陰影」,因為峰會往往是用來替談判結果背書、也用來交換更大包的政治承諾。 論壇輿論的溫度,則反映了另一個面向:川普可能把峰會當槓桿。國內媒體討論串聚焦在「延後或取消」的威脅語氣,以及是否藉此施壓北京在特定議題上讓步;這類討論不等於事實,但它抓到一個結構:川普常把外交行程當成可交易的籌碼,而不是固定的儀式。 綜合目前訊號,比起「會或不會」,更接近的判斷是:會面仍有動機,但時間點高度可變。若中東衝突短期降溫、且美中在關稅、供應鏈、科技管制或金融議題上先形成可對外宣示的「可交代成果」,那麼峰會最可能以「延期後的補辦」方式發生;反之,若戰事拖長、或雙方都無法承擔「見面卻談不成」的政治觀感,峰會就可能被繼續往後推,甚至改成多邊場合「短暫場邊會談」來替代。 作者:新公民議會編輯小組

Recent Posts

2026年回看318太陽花運動:如何重塑台灣政黨版圖與選民結構?

2026年回看318太陽花運動:如何重塑台灣政黨版圖與選民結構?

2026年談318太陽花運動,重點早已不只是「那場占領是否正當」,而是它如何在十二年內重塑政黨版圖、改寫選民結構,並把「兩岸議題」從少數人的政治口號,變成各黨必須面對的長期制度問題。318的影響不是一次性爆炸,而是把台灣政治推進一套新的競爭規則:誰能說服選民自己既能保安全、又能管經濟,誰就能取得執政正當性。 [...]

More Info
太陽花運動12週年PTT熱議:從反黑箱到能源焦慮,青年世代的兩岸經貿觀點為何轉向?

太陽花運動12週年PTT熱議:從反黑箱到能源焦慮,青年世代的兩岸經貿觀點為何轉向?

太陽花運動十二週年之際,今日媒體再度出現大量回顧與檢討。討論核心不再停留在「當年對不對」,而是聚焦「今天還剩下什麼問題」。最顯著的變化,是青年世代的政治語言從「主權焦慮」逐步移向「生存焦慮」,並把兩岸經貿放回更功利、更風險控管的框架重新計算。 [...]

More Info
柯文哲赴東京出境聲請遭駁回:法院為何認定「非必要」與「無引渡風險」才是關鍵

柯文哲赴東京出境聲請遭駁回:法院為何認定「非必要」與「無引渡風險」才是關鍵

柯文哲申請在3月23日至25日「暫時解禁」出境赴日,目的為參加兒子柯傅堯在東京大學的畢業典禮,但台北地方法院裁定駁回。這起裁定之所以引發高度討論,不只因為柯文哲具政治人物身分,更因法院在理由中明確把案件拉回兩個核心:出境限制的風險控管,以及聲請目的是否具「必要性」。 [...]

More Info
川習會會不會辦?2026年3月最新訊號、變數與可能時程

川習會會不會辦?2026年3月最新訊號、變數與可能時程

近期「川習會」是否成局,關鍵不在單一宣示,而在中東戰事牽制、談判議題堆疊、以及雙方內部政治成本三股力量的拉扯。多家媒體報導指出,川普原本被外界解讀可能在3月底與習近平會面,但川普近日對外稱因美伊衝突等因素,已向中方要求延後,並引發市場與外交圈對美中「貿易休兵」能否延續的疑慮。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way