社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

代理孕母制度之比較法分析:加拿大、澳洲、美國加州與台灣

代理孕母制度在全球法制中呈現高度多樣化,各司法領域依其文化脈絡、倫理判準、家族制度與生殖醫療發展程度,形成不同監管模式。本文以比較法視角,分析加拿大、澳洲、美國加州的代理孕母制度,並與台灣民眾黨立委陳昭姿所提出的代理孕母法案進行制度性比較,旨在釐清各模式之政策考量及其可能對台灣生殖法制的啟示。 一、加拿大模式:反商業化與「利他型」框架 加拿大聯邦法採取明確的 非商業代理孕母(altruistic surrogacy) 模式,禁止支付超過必要費用補償代理孕母,也嚴格禁止代理仲介營利。其立法目的在於避免脆弱女性因經濟壓力進入市場化的生殖勞動關係。親權確認須經法院程序,以確保代理孕母、委託父母與胎兒的權益均受到平衡保護。 此模式反映加拿大對「身體自主」及「生殖非商品化」的倫理重視,也形成全球無償代理孕母的重要參考。 二、澳洲模式:州分管制與強調倫理審查 澳洲多數州亦採 無償代理孕母模式,並強化倫理審查程序,包括心理評估、關係背景調查以及法院核准機制。部分州要求代理孕母與委託方具有既存社會關係,目的在降低剝削風險並確保代理行為基於互信與非市場性交換。 整體而言,澳洲制度介於加拿大與歐陸保守模式之間,兼具「無償原則」與「強化監管」兩項核心。 三、美國加州模式:市場化、契約保障與明確親權制度 加州的代理孕母制度被視為全球最為成熟的 商業化代理孕母(commercial surrogacy) 模式。其特徵包括: 允許代理孕母取得報酬; 允許仲介機構營利並提供完整服務; 以契約法保障代理母、委託父母與醫療端之權利義務; 採「出生前命令」(pre-birth order)直接確認委託父母親權。 加州模式的核心理念在於 契約自由與司法保障,其高程度市場化與法制完整度,使其成為跨國代理孕母常見目的地。 四、台灣陳昭姿法案:介於無償與有限補償之間的本土化模式 陳昭姿立委版本之代理孕母法案呈現混合型設計,兼具國際無償模式與台灣本土倫理考量,具有以下特徵: 非商業化,但允許必要補償:制度定位接近加拿大與澳洲,但較後者彈性。 以醫療機構為核心監管單位:強調倫理審查、身心評估,以及對代理母健康保護。 禁止利益交換與商業仲介:旨在阻絕市場化鏈結。 親權確認採法律程序審查:並未採加州式的完全契約化模式。 保障代理孕母自主權:包括健康風險中止權、免受強迫或不當壓力等。 […]

「絕對決心行動」成功的關鍵

2026初始,美軍在川普總統的授權下,於1/3對委內瑞拉發動「絕對決心行動」(Operation Absolute Resolve)的軍事攻擊,美軍以迅雷不及掩耳的軍事行動,將委內瑞拉總統馬杜洛(Maduro)與其妻小活捉送往美國,針對美軍一連串、迅速的軍事行動,成功的背後不離三個關鍵。 第一:情報蒐集完整 任何一場軍事行動成功與否,事前充分的情報蒐集相當重要,戰略情報(Strategic Intelligence)成為各國平時主要的分析方向。根據外媒報導,美國總統川普於去年8月開始要求中情局(CIA)進行情報蒐集,透過無人機的監控,包括馬杜洛本人的作息、建物本身的布局、委國的軍力部署等,在情蒐與線民(五千萬美元賞金)的布置下,美軍預先為一場軍事行動進行完美鋪陳。 第二:優勢兵力與電戰壓制 在實際的作戰行動中,此次的任務由美國特種部隊、海空軍進行攻擊、逮捕。美軍全數投入約1.5萬名部隊進行作戰行動,兵力派遣包括11艘軍艦(福特號航艦)、F-35B戰機、B-1B戰略轟炸機、B-52戰略轟炸機、EA-18G咆哮者電戰機、MQ-9B死神無人機、P-8海神定翼反潛機、AC-130電戰機、F-18E/F超級大黃蜂戰機等約150架軍機對委國發動遠距打擊/電戰壓制。 在實際的逮捕、攻擊行動中,美軍派遣精銳的三角洲特種部隊(Delta Force)進行逮捕、攻堅行動,同時以第160特種作戰航空團操作的MH-60M直升機、MH-47F等特種直升機進行地面交火,在作戰的過程中,雖然美軍特種作戰直升機並無遭到擊落,但機身仍舊免不了小口徑武器的攻擊,所幸直升機皆配有一定程度的裝甲防護,最終依然能夠平安飛離戰區。 第三:中國、俄羅斯製的裝備未發揮效果 雖然委內瑞拉配備中製的JA-27A反匿蹤雷達、俄製的S-300防空飛彈,但美軍透過精準打擊、低空突襲、空中電戰/干擾壓制等作為,幾乎將委內瑞拉軍方所有的優勢一掃而空,加上委國的武器系統尚未整合,面臨美軍的強勢進攻,將整個軍事作戰行動時間做有效控制(2小時39分),最終美軍取得輝煌戰果。 結論 實際上,從美軍此次的軍事行動來論,美軍依然在傳統的三軍作戰享有絕對優勢,雖然委內瑞拉向中共、俄羅斯採購軍事裝備,但不可否認的,經過實戰的驗證,中俄的武器性能仍就無法在戰場享有絕對優勢,美軍的裝備再次獲得戰場驗證,我軍長期向美方採購裝備,採購的不僅是一份國家安全,更是以美國為首的軍武體系下的保障。 經過此次的軍事行動,未來美製裝備將持續在國際軍武市場享有優勢,這也是大國競爭下重要的一環。 作者:宋磊

是好事一樁、抑或地方治理失能的縮影?—淺議近期各縣市與直轄市「免費營養午餐」蔚然成風

從台北市長蔣萬安在6日的市政會議中,率先宣佈「為直接減輕家長每年上萬元的經濟支出,台北市國中小營養午餐將全面免費」開始,在整個「中華民國.台灣」的6個直轄市,以及台閩2個虛級化省轄下的3省轄市13縣之間,「營養午餐免費」的事案,在短短幾天內蔚然成風,直到9日禮拜五本週上班日結束為止,只剩新北直轄市、嘉義縣、嘉義市及屏東縣,還沒有跟進加入這波風潮,對這些地方首長,形成相當程度的壓力。 在這波風潮中,地方首長們是如何對處的? —在去年藍白2黨挾立院過半多數席次,強行通過2黨版財劃法,卻沒有連帶調整地方制度法等配套法制、以使中央與地方在財權與相對應事權的分配更合理,使得以台北市為首的多個藍營執政縣市及直轄市,每年能夠向中央多挖走超過4千億元統籌分配款,卻不用承擔更多事權的情況下,對於預期能夠從藍白新版財劃法得益的那些縣市及直轄市,特別是那些在今年多合一地方選舉面臨連任壓力,或者2任任滿後有意窺伺總統大位的地方首長來說,只要有人開第一槍,這些首長也就很樂意跟上腳步。 —對於在充滿藍白政治算計的新版財劃法中,不僅並沒有因此得利,反而統籌分配款還因此停滯不前、甚至有所減損的縣市及直轄市而言,不是只能像台南市般勉強跟上,就是像嘉義縣或屏東縣般還在斟酌評估;至於新北直轄市及嘉義省轄市,大概是因為現任首長沒有連任壓力、臨時要跟上會排擠其他財源等緣故,所以雖然是藍營執政縣市,至今為止卻沒有立刻跟上。 —然而,在跟上蔣萬安腳步的藍營縣市及直轄市首長中,卻有一些人,像是台語所說的「贏賭也要贏話」、或者中文「得了便宜還賣乖」般,在有足夠財源及資源能夠跟進的情況下,卻還要向中央喊話,要中央承擔起統籌全台國中小營養午餐免費化的責務與預算,令有識者為其嘴臉感到憤怒不已。 以2024年2月1日新一屆中華民國立法委員就職,與其後藍白2黨正式聯手、佔據立法院過半席次,並據此無視「中華民國台灣」自1980年代後期開始,直到這之前為止的30幾年間,所累積出的憲政規範、憲政慣例、法制與法治,乃至於一般民眾對這一整套制度,經由習慣其如常運作所形成的各種確信,開啟其一系列有組織、有規模的政治暴舉: —就職後、直到2025年區域藍委罷免投票前,藍白2黨如同脫韁野馬般一路暴進,在以國會改革為名、破壞權力分立的大肆自我擴權失敗後,又染指憲訴、財劃及選罷3法得逞,得逞後復以其一貫黑箱、無視適正立法程序與充分審議等原則的手法,將2025年中央政府總預算,弄到連他們自己也算不出刪減與凍結金額,最後只能照樣送出、讓行政院收拾爛攤的程度,因此使台灣社會一部分民眾,點燃起大壩免的怒火; —等到大罷免因為主事者從主訴求、號召對象到具體操作的種種不得法,加以中國黨政當局透過抖音等社群媒體,輔以傳統電子及平面媒體,針對藍白2黨的支持者,展開新的宣傳攻勢,而全盤鎩羽以後,藍白2黨一方面對於具有高度爭議性的法案,採取相對低調、緩緩推進,但隨時都能夠加速立法的態勢;另一方面則以2026年度中央政府總預算、以及8年1兆2500億特別國防預算,作為遲滯作戰的主戰場,直到1月10日為止,2大預算均仍未經立院程序委員會排入議程,不僅影響向美國採購重大軍事裝備的應有進度,更已開始波及生育津貼與TPASS月票等計畫。 而藍白版新修財劃法的偏狹、錢權與事權未能更加有效對應,乃至於部份縣市及直轄市政府,錢多到能夠讓轄境國中小營養午餐免費,但另外一些卻還要為之仔細考慮,這一連串的事態發展,放到以上的大架構後,應該獲得什麼樣的評價,脈絡也就更加清晰。 簡單地講,財劃法、統籌分配款與免費營養午餐的這一整套事案,是藍白2黨在抓準相當比例選民「不管怎麼樣,就是想要從政府手中多獲得一些所謂的福利,不拿白不拿」的心態後,在有統籌分配款新制財源作為後盾的依峙下,集「掏空中央政府、降低賴清德總統與其中央政府施政能力與績效」、「以公共預算與投部份選民所好的政策,作為向選民變相政策買票的工具」、「欠缺長遠規劃能力與意願,只想用短期能夠讓人有感的政策,來製造看似有話題性的所謂政績」於一,所打出的一張充滿短期政治算計的牌。 更直接地講,中華民國台灣藍營執政的縣市及直轄市,就跟好逸惡勞的懶人一樣,以「能撈就撈、能推就推,不要擔負太多責任」為其施政心法的圭臬,他們會為多拿到統籌分配款而欣喜,卻不願意承擔相對應的事權調整後,因此所生的新責任,但多拿到的統籌分配款,還是要想辦法用完,以免年底預算結餘必須繳庫、次年該預算科目金額還會遭到削減,於是,做了以後能夠讓首長、各層公務員及藍白核心支持層選民,皆大歡喜的免費營養午餐政策,也就成為這些藍營地方首長的優先選項。 固然免費營養午餐有學童學子健康,以及降低家長負擔、甚至間接降低生育心理障礙等等的大義名分,反對者很難去直接挑戰這些面向,但地方治理的公共資源,到底應該如何分配與運用,才能夠更加合理,能否藉由長遠規劃,一方面興利除弊、另一方面為後來者打下更進一步發展的基礎,卻也是有識者不能不考慮的重大問題,只是這樣的考慮,在中華民國台灣社會的公共事務與其思考,淺碟化、娛樂化、情緒化與聲量化等惡的趨勢,一時間都還難以逆轉的情況下,有多少人能夠穿透浮躁與雜音靜心思考,筆者卻也沒有多少能夠樂觀以對的理由。 作者:吳哲文

[轉] 黃國昌下台前的爛攤子

強化國防是台灣的國家利益,不是任何政黨的利益。 這幾天,台灣民眾黨在黃國昌主席的帶領下,針對軍購拋出了各種含沙射影的指控。 對於不熟悉議事程序、也不了解特別條例、特別預算審查的民眾來說,這些話確實充滿誘惑。 但歸根究底,其實都只是操作「資訊落差」用來包裝的話術而已。 從黃主席訪美到民眾黨上下的口徑一致,還有海量的網軍出動,我想來想去,可能的目的只有一個:幫台灣民眾黨找一個台階下。 如果把他前後的說法攤開來看,大概就可以證實這個猜測了。 _ 首先,為什麼民眾黨需要找台階下? 因為他們其實很清楚,把法案卡在程序委員會,從來就不是監督,而是跟著中國國民黨,幫中共杯葛軍購,削弱台灣的防衛能力。 國民黨的選擇已經很明確,寧願與台灣的主流民意唱反調,也不打算退讓,就是要卡軍購。 問題來了:已經七度配合中國國民黨卡案的台灣民眾黨,真的要繼續這樣下去,傷害台灣的國家利益嗎? 於是,為了證明「我們跟國民黨不一樣」,為了合理化之前的蓄意卡案,民眾黨想出的辦法就是:快閃訪美,然後對外宣稱,自己是「在和美方充分討論後,才改變想法」。 但事實真的是這樣嗎? _ 「美方被蒙在鼓裡」、「他們不知道特別預算為什麼在國會被擋」、「他們也不清楚台灣要買什麼武器,所以我要親自去說明民眾黨的立場」。 這是黃國昌一開始的說法。 但這樣的說法,未免太小看美國,也太小看 AIT 了。 AIT 定期都會和各政黨領袖交流,從互動、言談之間,我很清楚他們非常了解台灣政治的眉角,畢竟這是他們的工作。 至於軍購案就更不用說了。 買武器可不是買菜,要買一種武器必須從作戰計畫一路推進才能形成採購計畫,沒有台美之間的緊密合作,根本買不到。 過去七十幾年來,無論台灣由誰執政,美方不只是世界上極少數願意賣武器給台灣的賣家,更是台灣最堅實的戰略夥伴。 這一點,從 AIT 多次發表正式聲明支持軍購案,就已經非常清楚。 _ 黃國昌返台後,新增的論述是: 「1.25 […]

Recent Posts

代理孕母制度之比較法分析:加拿大、澳洲、美國加州與台灣

代理孕母制度之比較法分析:加拿大、澳洲、美國加州與台灣

代理孕母制度在全球法制中呈現高度多樣化,各司法領域依其文化脈絡、倫理判準、家族制度與生殖醫療發展程度,形成不同監管模式。本文以比較法視角,分析加拿大、澳洲、美國加州的代理孕母制度,並與台灣民眾黨立委陳昭姿所提出的代理孕母法案進行制度性比較,旨在釐清各模式之政策考量及其可能對台灣生殖法制的啟示。 一、加拿大模式:反商業化與「利他型」框架 加拿大聯邦法採取明確的 [...]

More Info
「絕對決心行動」成功的關鍵

「絕對決心行動」成功的關鍵

2026初始,美軍在川普總統的授權下,於1/3對委內瑞拉發動「絕對決心行動」(Operation Absolute Resolve)的軍事攻擊,美軍以迅雷不及掩耳的軍事行動,將委內瑞拉總統馬杜洛(Maduro)與其妻小活捉送往美國,針對美軍一連串、迅速的軍事行動,成功的背後不離三個關鍵。 第一:情報蒐集完整 [...]

More Info
是好事一樁、抑或地方治理失能的縮影?—淺議近期各縣市與直轄市「免費營養午餐」蔚然成風

是好事一樁、抑或地方治理失能的縮影?—淺議近期各縣市與直轄市「免費營養午餐」蔚然成風

從台北市長蔣萬安在6日的市政會議中,率先宣佈「為直接減輕家長每年上萬元的經濟支出,台北市國中小營養午餐將全面免費」開始,在整個「中華民國.台灣」的6個直轄市,以及台閩2個虛級化省轄下的3省轄市13縣之間,「營養午餐免費」的事案,在短短幾天內蔚然成風,直到9日禮拜五本週上班日結束為止,只剩新北直轄市、嘉義縣、嘉義市及屏東縣,還沒有跟進加入這波風潮,對這些地方首長,形成相當程度的壓力。 [...]

More Info
[轉] 黃國昌下台前的爛攤子

[轉] 黃國昌下台前的爛攤子

強化國防是台灣的國家利益,不是任何政黨的利益。 這幾天,台灣民眾黨在黃國昌主席的帶領下,針對軍購拋出了各種含沙射影的指控。 對於不熟悉議事程序、也不了解特別條例、特別預算審查的民眾來說,這些話確實充滿誘惑。 但歸根究底,其實都只是操作「資訊落差」用來包裝的話術而已。 從黃主席訪美到民眾黨上下的口徑一致,還有海量的網軍出動,我想來想去,可能的目的只有一個:幫台灣民眾黨找一個台階下。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way