社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

周級(Zhou-class)核動力攻擊潛艦

初一晚,來跟大家說一下,其實前年對岸潛艦發生一件大事: 華爾街日報報導,2024 年 5 月底至 6 月初之間,對岸在長江岸邊的武昌造船廠(Wuchang Shipyard)測試新級別周級(Zhou-class)核動力攻擊潛艦,然而卻在碼頭碼頭邊發生不明原因的沉沒。 美國官員指出,衛星影像拍攝到現場出現大型打撈浮吊船,且長江沿岸佈署了大量攔油索以防止潛艦燃油或流體外洩,這些動作證實了沉沒事件的發生。 相關報告指出,這是中國海軍現代化進程中的一次重大挫折,該艦是中國首艘新研發的周級核潛艦,具備獨特的「X型」尾舵設計。 所以,其實對岸自製潛艦連下潛都還沒辦法,所以為何他們要造謠台灣的海鯤號,無法下潛,甚至還有立法委員因此嘲諷自己國家的國防武器,這就是認知戰! 而為何對岸一直害怕台灣取得潛艦? 因為,潛艦是台灣實現「境外阻絕」最致命的殺手: 台灣海峽海水渾濁是潛艦最好的掩護,只要部署潛艦就能讓解放軍航母不敢輕易靠近。 加上,昨天貼出的「小雪山雷達站」這類高山雷達站合作,在敵方還沒進入潛艦視野,台灣的潛艦,乃至於其他軍艦或飛彈車,可以在敵方根本「看不見」我們的情況下,從遠距離發動飽和攻擊。 縱使部分共軍登陸,只要台灣人不投降,共軍登陸後最怕補給斷線,只要台灣擁有潛艦,就能確保共軍登陸後沒有補給而只能投降。 因此,潛艦是不對稱作戰最有利的國防武器,美國智庫(CSIS 或 2049 計畫研究所)在兵棋推演中指出,若要確保台灣海峽在戰時能徹底變成解放軍的「海葬場」,台灣應該維持12 艘潛艦是最理想的規模。 最後,當大家在快樂過年時,請記得國軍弟兄姊妹還在工作崗位,我們能平安喜樂慶新年,是有人負重前行! 作者:轉載自作者臉書文章

[轉] 台灣的逆行菩薩

昨天一整天,網路上都在流傳國民黨主席鄭麗文在法鼓山敲鐘紅繩抖動的照片,我不是民俗專家,不好評論,不過這讓我想到佛教有兩句激勵人心的詞,一個是逆行菩薩,一個是逆增上緣! 農曆春節前,我在臉書上看到財訊雙週刊專欄作家林坤正先生的文章:「逆行菩薩與關稅談判」!他提到為什麼藍白奮力杯葛,台灣可以談出這麼好的條件?他說人生有兩種幫助你的人,在順境推你一把,這是順行菩薩。另一種是逆行菩薩,在關鍵時刻給你壓力,阻力,試圖阻止你前進,當下看起來是阻力,但回頭看。反而讓你得到原先預想不到的美好結局! 坤正兄的逆行菩薩,在佛法上指的是那些以打擊,壓迫,欺負,侮辱等負面方式帶給我們逆境的人!聖嚴師父常常用這個詞來激勵人心。也有一說是「逆增上緣」,將挫折,打擊,困難和惡緣轉化為激勵自己成長的力量。 在我們周遭,有很多這樣的例子,例如,沒有鄭麗文主席,賴總統民調可能沒有那麼快逆轉走高。這次高市早苗大獲全勝,自民黨創下二戰以來最好成績,最大推手是中共與習近平主席,像濱崎步一個人的演唱會會,王毅在慕尼黑的恐嚇,都是日本再起的推手。 這些年罵台積電掏空台灣,大駡台積電是美積電的不知道有多少人?但他們愈罵台積電愈強韌,很多人從台積電200元一直駡到將近2000元,這些人都是台積電的逆行菩薩! 這次國防預算被擋架10次,去年我帶團考察無人機產業,很多人都在問藍白擋預算,怎麼辦?我說國父革命失敗十次,接下來美國一定會有動作!現在看起來正朝向著這個方向走來!這些擋預算的委員也是逆行菩薩! 今年台灣除了AI會持續興旺之外,也許國防軍工產業會成為帶動傳統產業轉型升級的重要力量! 作者:謝金河 (轉載自謝金河臉書發表)

國民黨國防預算「優先處理」急轉彎:從軍購監督到國際壓力下的立場翻盤

近日,中國國民黨於除夕突然宣示「國防預算列為優先預算」,引發輿論高度關注。過去一段時間,在野陣營反覆主張自己是「監督軍購、看緊荷包」,並未阻擋國防建設;但當外部關切升高後立場迅速調整,且時間點高度吻合,使這次宣示不再只是朝野攻防,而成為檢驗政治可信度與國防決策一致性的事件。 在軍購議題的公共論述中,鄭麗文曾提出國民黨的兩項標準:一是採購真正需要的武器,二是避免浪費公帑。這樣的說法在民主政治中原本屬於合理的國會監督框架,因為所有預算都應接受檢驗。但爭點在於:若先前真是基於內容審查與政策原則,為何在美國國會議員聯名關切、以及前美國在台協會處長司徒文公開發言後,立刻將原本爭議中的預算改列優先?監督標準不應因外部聲音而突然消失,除非真正被改變的不是對預算內容的判斷,而是對政治風險與外部觀感的評估。 此事之所以迅速升溫,關鍵不僅在台灣內部政治,而在國際安全架構與印太戰略脈絡。當多位美國國會議員公開表達疑慮,外交與安全圈人士也罕見對台灣政黨攻防提出警示,意味著問題已被外界視為區域安全議題,而非單純的立法院程序爭端。對美國而言,台灣防衛能力牽動的不只是台灣自身安全,更連動印太部署與盟友協作;因此關切的重點不只是預算金額,而是政治訊號:台灣是否仍維持穩定的自我防衛共識與可預測的國防決策。 也因此,立場的突然轉向更容易被放大檢視。若先前確信軍購內容不合理,理應持續提出替代方案、預算重編路徑或技術性論證,而非在壓力升高後以「優先處理」快速翻頁。政策辯論通常具有延續性,包含問題界定、證據補強與方案競逐;但危機處理才會呈現急轉彎式的改口與排序重置。當改變僅發生在外部壓力之後,社會自然會懷疑:先前提出的理由是否為核心考量,抑或只是可隨時調整的政治敘事。 軍購從來不是單純的商品採購,而是嚇阻能力、聯合作戰與整體防衛戰略的建構。安全政策可以被質疑、被辯論,但其一致性與可預測性本身就是嚇阻的一部分。一旦防衛決策在政治攻防中反覆擺盪,對外釋放的訊號往往比武器本身更具影響力。對盟友而言,問題不在台灣花多少錢,而在台灣是否能長期、連貫地做出一致的安全選擇,並以制度化程序穩定推進國防建設。 整起事件最值得社會追問的,未必是政黨路線差異,而是政治誠信與決策基準的前後一致。民主政治允許不同安全路線,也允許更嚴格的國防預算監督,但理由必須可檢證、可追溯且前後一致。當「沒有阻擋」在外部壓力升高後轉為「優先處理」,爭議焦點就從政策內容移轉到判斷基準:決策究竟是基於安全專業、制度理性與長期戰略,還是基於政治成本、外部觀感與短期風險控管。 除夕的政策急轉彎或許能暫時降低外界疑慮,但留下的核心問題仍在:國防議題最需要的不是口號式宣示,而是可預測的制度承諾與一致的政策軌跡。唯有穩定且連貫的安全決策,才能同時說服國內社會與國際夥伴;否則,每一次立場轉彎所消耗的,將是國家在安全議題上的戰略信任與政策可信度。 作者:林政武

柯文哲能否類比黎智英?從「政治迫害」定義、司法程序與國際反應看差異

陳佩琪醫師近日發文,欲將柯文哲受到的「政治迫害」對照香港黎智英的遭遇,「說給全世界聽」。這場荒謬的類比令人啼笑皆非。將涉入貪瀆弊案的柯文哲,強行拔高到與香港民主運動同等高度,不僅是對黎智英的褻瀆,更是對「政治迫害」四字的廉價消費。 首先,看看兩位「受害者」的待遇。黎智英自2020年12月被拒保釋後,至今已被關押超過一千多個日子。在這五年裡,黎智英有像柯文哲那樣,在交保期間或是被調查初期,大搖大擺地召開記者會嗎?黎智英能天天在媒體上對著習近平指三道四、痛罵中共司法不公嗎?反觀柯文哲,在案發前後,民眾黨天天開直播、辦宣講,甚至發動群眾包圍司法機關,陳醫師更是臉書發文不輟,將檢調形容得一文不值。 如果這叫「綠色恐怖」,那賴清德這個「獨裁者」當得也太窩囊了。在真正獨裁的中國,黎智英連見律師都困難重重,更別說讓家屬在網路上「把故事說給全世界聽」。若賴清德真有習近平萬分之一的獨裁,柯文哲現在應該是在電視上「被認罪」,怎有可能全台到處輔選。 其次,黎智英之所以被入罪,是因為他堅持報導真相、支持民主運動,他被控的是《港區國安法》中的「勾結外國勢力」,他守護的是香港僅存的自由與法治尊嚴。他在法庭上展現的是「殉道者」的姿態,即便身陷囹圄,腰桿依然挺直。而柯文哲面對的指控是京華城容積率暴增的圖利疑雲,是政治獻金帳目不清的爛帳,是檢廉指控他在市長室「踩著飛輪」時可能涉及的期約收賄。 一個為國家尊嚴犧牲,一個被控利用職權上下其手。黎智英是為香港人的未來坐牢,柯文哲若真坐牢,是為了自己的罪刑贖罪。 最後,陳醫師要將這故事說給全世界聽,只會讓人覺得台灣的貪污犯,藉口真的很多。黎智英遭判刑,美國國務院、英國外相、聯合國人權專員紛紛發聲譴責,因為國際社會看得很清楚,這是極權對民主的扼殺。但柯文哲案爆發至今,除了民眾黨內的同溫層在咆哮,請問有哪一個外國政府、哪一個國際人權組織發表過聲明聲援柯文哲? 陳佩琪想把柯文哲塑造成「台灣黎智英」,這不僅是東施效顰,更是一場拙劣的「碰瓷」。黎智英的20年,是極權鑄造的悲劇勳章;柯文哲若真被判28.5年,那將是台灣司法對貪腐政客最嚴厲的警鐘。 作者:宜和蓒

Recent Posts

周級(Zhou-class)核動力攻擊潛艦

周級(Zhou-class)核動力攻擊潛艦

初一晚,來跟大家說一下,其實前年對岸潛艦發生一件大事: 華爾街日報報導,2024 年 5 月底至 6 月初之間,對岸在長江岸邊的武昌造船廠(Wuchang Shipyard)測試新級別周級(Zhou-class)核動力攻擊潛艦,然而卻在碼頭碼頭邊發生不明原因的沉沒。 [...]

More Info
[轉] 台灣的逆行菩薩

[轉] 台灣的逆行菩薩

昨天一整天,網路上都在流傳國民黨主席鄭麗文在法鼓山敲鐘紅繩抖動的照片,我不是民俗專家,不好評論,不過這讓我想到佛教有兩句激勵人心的詞,一個是逆行菩薩,一個是逆增上緣! [...]

More Info
國民黨國防預算「優先處理」急轉彎:從軍購監督到國際壓力下的立場翻盤

國民黨國防預算「優先處理」急轉彎:從軍購監督到國際壓力下的立場翻盤

近日,中國國民黨於除夕突然宣示「國防預算列為優先預算」,引發輿論高度關注。過去一段時間,在野陣營反覆主張自己是「監督軍購、看緊荷包」,並未阻擋國防建設;但當外部關切升高後立場迅速調整,且時間點高度吻合,使這次宣示不再只是朝野攻防,而成為檢驗政治可信度與國防決策一致性的事件。 [...]

More Info
柯文哲能否類比黎智英?從「政治迫害」定義、司法程序與國際反應看差異

柯文哲能否類比黎智英?從「政治迫害」定義、司法程序與國際反應看差異

陳佩琪醫師近日發文,欲將柯文哲受到的「政治迫害」對照香港黎智英的遭遇,「說給全世界聽」。這場荒謬的類比令人啼笑皆非。將涉入貪瀆弊案的柯文哲,強行拔高到與香港民主運動同等高度,不僅是對黎智英的褻瀆,更是對「政治迫害」四字的廉價消費。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way