社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

美日的深層隱憂

美國通過 111 億美元對台軍售,規模是台灣關係法立法以來最大挹注,將大幅強化台灣的國防能量及不對稱作戰能力。 然而,牽動印太軍事平衡的關鍵,在於台灣國會:立法院。中國國民黨與台灣民眾黨組成的在野聯盟目前掌握多數席次,對國防預算的保留態度,引發了華盛頓與東京對台灣自衛決心的疑慮。藍白陣營強調財政穩健並應避免挑釁,質疑大舉購武恐引發衝突,主張應以對話緩和兩岸僵局。這種內部政治僵局,被外界視為台灣防衛現代化的重大變數。 美國在台協會(AIT)處長谷立言近期接受中央社專訪,提出了外部視角的困惑。他指出國際社會非常支持台灣提高防衛能力,因此難以理解,台灣內部為何會有如此強烈的反對與質疑聲浪。尤其,投資不足將是風險,他強調,比起「挑釁」,盟友更擔心的是台灣長期以來國防投資不足。這種不足會打破地區的戰略平衡,反而升高衝突風險。 這種將國防預算與挑釁掛鉤的論述,在國際地緣政治的現實邏輯中顯得蒼白和軟弱。和平的基礎從非建立在單方面的善意,而是源於對等實力所產生的「威懾力」。當在野陣營試圖透過凍結預算來尋求緩和時,卻忽略了在國際秩序中,缺乏實力支撐的對話,往往會被對方視為退縮的訊號而非和平的邀請。這不僅削弱了台灣的談判籌碼,更讓國際社會質疑台灣是否正主動放棄其防衛責任。 谷立言直言,若台灣自身不展現足夠的防衛投資決心,美國要依照《台灣關係法》提供防衛武器與支持時,將會面臨極大的政治與政策難度。 東京學者同樣感到不安,認為日本視台灣安全為自身危機,但若台灣內部政壇缺乏自衛共識,其他國家將難以說服其國民支持台灣。 在東京智庫「笹川和平財團」的模擬劇本裡,台灣能否獨力支撐過「關鍵14天」,是國際援台機制的啟動前提。因此,國會對國防預算的阻撓,在盟友眼中無異於自我削弱,直接動搖了印太防線的信譽。這種內耗恐誘使北京產生戰略誤判,認為台灣的防禦意志已在內部政治鬥爭中瓦解,進而轉向以成本更低的認知戰與分化手段,試圖實現「不戰而勝」。 台灣的民主制度固然珍貴,但若政黨競爭的戰火延燒到國家安全的根基,則將成為這套制度最大的脆弱點。在全球民主同盟屏息以待的當下,立法院的預算攻防已不再只是國內政務,而是對國際誠信的期末考。 若台灣無法在國防投入上達成跨黨派的共識,再多的外交辭令也無法掩蓋內部防線的裂痕。唯有實質的預算和行動,展現自衛決心,台灣才能在詭譎洶湧的印太格局中,贏得國際社會的重視與堅實的防衛承諾。 作者:江諺行

美國對台政策的延續性

美國川普政府於美東時間十七日(台灣時間十八日)再度宣布對台一批軍售,總金額達到一百一十一億美元,這是川普第二任政府第二次對台軍售,此次增購的海馬斯火箭彈固然是一大亮點,但更重要的事,陸軍成功向美方採購到60輛最新的M109A7自走砲,此次軍售案也是美國對台政策的延續,美國不分民主或共和黨執政,維持對台軍售也助於區域和平。 最新款的自走砲、續購的海馬斯火箭彈 攤開陸軍的砲兵裝備,陸軍目前使用的自走砲以M109A2/A5為主,總計約225輛,自1982年服役至今已超過40年,此次軍購案軍方向美方採購到最新的自走砲,一方面此型自走砲為2010年代以後的火砲系統,配備最新的發射軟體,底盤、懸吊與傳動系統皆大幅提升,利於自走砲越野機動行駛;二方面根據2025美國陸軍的建軍計畫,未來美軍將採購689輛M109A7自走砲,其服役的時間將延長至2050年,換言之未來進入陸軍服役的M109A7無須擔心消失性商源的問題。 於俄、烏戰場上大放異彩的海馬斯火箭彈系統,陸軍此次增購82輛發射車,420枚陸軍戰術飛彈,加上原先2020年的採購數量,陸軍未來將擁有111套海馬斯火箭彈系統,藉此陸軍將擁有足夠的海馬斯火箭彈部署於全島三個砲指部(21、58、43砲指部),不但大幅提升陸軍「源頭打擊」能力,在想定的防衛作戰中,陸軍也扮演著遠距火力打擊、支援的力量。 實力建構和平(Peace through Strength) 長期以來,在建軍與軍購的過程中,陸軍的火砲系統向來是更新、採購最為緩慢的單位,如今美國在對台軍售上願意售予最新的火箭彈及自走砲,正代表印太安全的變化更為劇烈,為維持第一島鏈上的軍事嚇阻,和北京對話、談判並非美方唯一的做法,更精確的方法是以實力建構和平(Peace through Strength),以維持美國和區域國家的利益與安全。 台灣,洽為第一島鏈上的國家,長期遭到解放軍的文攻武赫,當雙方的政治交集降至冰點,解放軍在台海附近的行動更為頻繁,我海空軍同樣維持高強度的戰備頻率,根據外媒顯示,駐日美軍、關島上的部隊,皆會派遣軍艦、戰機、空中預警機、電戰機前往第一島鏈上執行飛行任務,美軍的目的在於維持第一島鏈、印太地區海空域航道的安全與通暢,外加軍事採購,我方政府正以具體行動告訴外界,台灣願意負擔更多防衛經費,畢竟「若汝欲和平,必先備戰」是西方重要的戰略思想,這並非輕啟戰端,而是培養居安思危的思想,陸軍不但在此波軍售案中獲得最多,未來的防衛責任更為重大。 作者:宋磊

韓國瑜與鄭麗文的隱形角力

賴清德總統邀請三院院長進行茶敘,局勢未成,不願接球的韓國瑜心中自有盤算。此時,行政院與立法院的僵持、立法院的執政在野黨團的衝突、以及國民黨鄭麗文黨主席與韓國瑜立法院長的隱性角力,都是2026前哨戰的主旋律。其中,韓國瑜和鄭麗文潛在的權力矛盾,是目前外界較少關注的切點。 立法院長韓國瑜與戰狼黨主席鄭麗文,兩位國民黨明星所代表的路線及戰略目標,存在本質互斥。他們的潛在矛盾,精準地折射出國民黨為何始終走不出深藍同溫層的困境。 韓國瑜自從接掌立法院長以來,明顯試圖進行一場人設重塑。經歷過總統大選的挫敗與罷免的羞辱,這位善於操作民粹語言的政治領袖,意識到中間選民的恐懼。因此,他努力在議事槌下尋求尊嚴與中立,全力扮演調和鼎鼐的公道伯。至少在形式上,韓國瑜盡力往中間靠攏,建立一種藍營內穩定的體制內權威。 然而,鄭麗文的當選,形成韓國瑜權威的最大挑戰。對於失望出走的藍營支持者而言,鄭麗文代表的是國民黨最令人詬病的一面:為了反對而反對的焦土戰術。她出身學運世代,本該最懂理性論述,但轉投國民黨後,她彷彿為了證明忠誠,表現得比傳統藍營更激進。她的問政風格往往充滿了情緒性的咆哮與人身攻擊,與羅智強等人比起來,有過之而無不及。 這形成了國民黨目前最尷尬的雙重人格:大腦(韓國瑜)試圖告訴大家「我很理性、我很穩重」,但嘴巴(鄭麗文)卻在不受控的拍桌斥責、破口大罵。 韓國瑜與鄭麗文,某種程度上都在爭奪藍營話語權,這是一場零和博弈。當韓國瑜想在國會建立秩序時,鄭麗文的戰鬥藍路線卻需要製造混亂來博取聲量。這種一邊蓋房子,一邊拆房子的內部矛盾,讓恨鐵不成鋼的藍營支持者看在眼裡,只能乾等2026、2028含淚投票。 韓國瑜想帶領國民黨重返執政,他必須壓制黨內的極端聲音,展現包容性。意味著他必須讓鄭麗文這樣的鷹派降溫,甚至「閉嘴」。鄭麗文深知自己的政治生命線繫於深藍基本盤,她不可能走溫和路線,反而還必須喊得更大聲,甚至要在關鍵時刻,例如在兩岸議題拋出更激進的論述,藉此綁架黨中央、迫使韓國瑜必須跟進。 若韓國瑜壓不住鄭麗文,國民黨就會繼續嚇跑中間選民。若兩人發生公開衝突,國民黨又會陷入內鬥分裂的輪迴。這對國民黨來說是一個死局。韓國瑜與鄭麗文的隱形角力,是「懷舊的民粹主義者」與「激進的機會主義者」在爭搶方向盤。 盱衡局勢,嚴格來說,韓國瑜和鄭麗文之間的競爭有七點: 一、提名衝突:2026縣市長和議會議長的名單安排,韓系人馬是否被擋或被「技術性處理」。二、立院藍營主推的法案遭遇社會強烈反彈:國會議長要降速保制度,黨主席要加速打戰功。三、兩岸論述出現過度親中的危機:韓為保國會外交形象而放低身段,黨主席為顧深藍而持續加碼。四、藍白合談判若再度破局,黨主席與院長的「責任敘事」可能互相推。 五、黨內權力中心之爭:黨中央要求立院黨團/院長「聽命」,但院長與黨團認為「現場你不懂」。六、媒體主角之爭:重大議題誰發聲、誰定調、誰收割,長期下來會累積怨氣。七、2028國民黨母雞/總統參選人:當「誰是最適合的總統候選人/誰是最大門面」被迫攤牌時,表面合作很難再維持完全無縫。 韓國瑜與鄭麗文可以在公開場合會握手言歡,但彼此心知,對方是自己互相抵消的負能量。韓國瑜想洗白,被鄭麗文的黑臉拖住;鄭麗文想衝撞,被韓國瑜的體制角色卡住。韓國瑜與鄭麗文的潛在緊張關係,是國民黨2026到2028之間遲早必須面臨的重大關卡,韓、鄭兩人終須一戰。 作者:江諺行

倒閣不敢、彈劾作秀:藍白的憲政話術現形記   

近日立法院掀起「倒閣、彈劾」聲浪,藍白陣營高舉憲政大旗、聲量震天,彷彿正義凜然,實則不過是一場精心計算過的政治秀。真正的關鍵不在於他們說了什麼,而在於他們不敢真的做什麼。 憲法明定,倒閣若成功,總統得以解散國會、全面改選。藍白目前雖握有國會多數,卻心知肚明,一旦重新面對民意,席次是否還能守住,恐怕是未知數。正因如此,倒閣才會喊得最大聲,卻始終停在口號階段,成為情緒動員的出口,而非真正承擔政治後果的選項。 當倒閣玩不起,藍白立刻切換戰場,改打「彈劾」牌。彈劾的好處是什麼?成本低、風險小、聲量大,而且幾乎不可能成功。這正是它成為政治話術首選的原因。不論是彈劾總統或行政院長,現行憲政制度的門檻都高得近乎不可能。彈劾總統需立法院三分之二同意,藍白席次明顯不足,還得送交憲法法庭審理,而目前大法官人數甚至未達法定門檻;至於行政院長,立法院根本無權直接彈劾,最多只是移送監察院,最終仍掌握在監委手中。 換言之,藍白比任何人都清楚:彈劾不會過。既然不會過,那為什麼還要提?答案只有一個,這是一場做給支持者看的政治表演。透過彈劾話術,卻完全不用承擔制度性後果;既不必面對重選風險,又能在輿論上為對手貼上「違憲」、「濫權」標籤,為未來選舉預先鋪路。這不是監督,而是情緒操作。 倒閣不敢玩真的,彈劾明知不會過,卻仍執意操作聲量,這樣的政治行為,已經不能再被美化為「監督政府」。那是一種對制度毫不尊重、對民主極度投機的算計。當藍白政客只剩下話術可以取暖、只剩下激情可以動員,卻始終不願為自己的主張付出任何政治代價時,受傷的從來不是被罵的官員,而是整個社會對憲政秩序的信任。民主不是情緒宣洩場,更不是流量變現工具;把倒閣與彈劾當成舞台效果來消費,終將讓台灣的民主付出集體成本,而歷史也會清楚記下:是誰在關鍵時刻,選擇了表演政治,卻逃避了應負的責任。   作者:林政武

Recent Posts

美日的深層隱憂

美日的深層隱憂

美國通過 111 億美元對台軍售,規模是台灣關係法立法以來最大挹注,將大幅強化台灣的國防能量及不對稱作戰能力。 [...]

More Info
美國對台政策的延續性

美國對台政策的延續性

美國川普政府於美東時間十七日(台灣時間十八日)再度宣布對台一批軍售,總金額達到一百一十一億美元,這是川普第二任政府第二次對台軍售,此次增購的海馬斯火箭彈固然是一大亮點,但更重要的事,陸軍成功向美方採購到60輛最新的M109A7自走砲,此次軍售案也是美國對台政策的延續,美國不分民主或共和黨執政,維持對台軍售也助於區域和平。 最新款的自走砲、續購的海馬斯火箭彈 [...]

More Info
韓國瑜與鄭麗文的隱形角力

韓國瑜與鄭麗文的隱形角力

賴清德總統邀請三院院長進行茶敘,局勢未成,不願接球的韓國瑜心中自有盤算。此時,行政院與立法院的僵持、立法院的執政在野黨團的衝突、以及國民黨鄭麗文黨主席與韓國瑜立法院長的隱性角力,都是2026前哨戰的主旋律。其中,韓國瑜和鄭麗文潛在的權力矛盾,是目前外界較少關注的切點。 [...]

More Info
倒閣不敢、彈劾作秀:藍白的憲政話術現形記   

倒閣不敢、彈劾作秀:藍白的憲政話術現形記   

近日立法院掀起「倒閣、彈劾」聲浪,藍白陣營高舉憲政大旗、聲量震天,彷彿正義凜然,實則不過是一場精心計算過的政治秀。真正的關鍵不在於他們說了什麼,而在於他們不敢真的做什麼。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way