社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

The Hidden Crisis in North America’s Chinatowns:

Behind the Facade, Migrants Confront Exploitation, Precarity, and a Recast American Dream. Across major cities in North America, the familiar sights of Chinatown—busy restaurants, multilingual shop signs, and bustling markets—suggest […]

鐵拳之下的脆弱秩序──從伊朗街頭血腥鎮壓看威權穩定的幻象

    從香港反送中運動、經濟衰退等激起人民抗爭卻受鎮壓後,伊朗也步入類似情境,竟以強硬手段鎮壓示威民眾,畫面中不乏實彈、拘捕與資訊封鎖。表面上,這似乎只是又一次威權政體面對內部經濟或政治腐敗不滿的「老劇本」;然,事實上深層因果恐非表面上簡單。 首先,伊朗內部的不穩定,核心仍在於長期累積的治理失靈。經濟層面上,制裁導致通膨高企、青年失業嚴重,資源分配高度傾斜於宗教與安全體系,社會階層流動幾近停滯,即使伊朗受中國經援、仍發與人民部分高福利。惟政治層面上,神權體制將重大決策排除於民意之外,選舉與代議機制形式化,人民缺乏可被制度吸納的不滿出口。當制度無法消化壓力,街頭自然成為最後的宣洩場域,而國家機器回應的方式,也往往只剩下暴力。 其次,國際地緣政治確實構成背景,但並非直接導火線。伊朗長期處於美國主導的制裁體系之下,近年又捲入中東衝突與大國博弈。中美對抗的結構,使伊朗在戰略上更傾向與「反西方陣營」靠攏,藉此取得外交與經濟喘息空間。然而,這種外部對抗並未轉化為內部改革的動力,反而強化神權統治塑造你者與他者的區分,強化神權集團統治合法性。 伊朗短期內不太可能出現體制性崩解。行政機關與宗教高度綁定、宗教權威仍具動員力,加上能源與區域影響力,使政權具有一定韌性。但中長期風險正在累積,人口結構年輕化與價值觀世俗化,加上網路全球化,其對外資訊之禁絕、社會之封閉遠不及北韓,年輕世代要不選擇苟活於境內;要不選擇遠走高飛。剩下的年輕人在經濟與發展無望下,陷入長期與當局示威又被鎮壓的惡性循環,政權或可維持「穩定」,但那是一種以高成本換取的脆弱平衡,如同借鏡中共維穩模式。 對台灣而言,伊朗地理距離太遠、經濟與制度迥異太深,仍有其深刻的啟示,不在於宗教或文化差異,而在於國家如何處理社會不滿與外部壓力的交織。目前,台灣如同伊朗一般面對經濟差距擴大、薪資停滯與朝野惡鬥,許多年輕人似乎看不見未來,竟將所有因素概括責難執政當局,莫忘從國際組織數據觀之,我國無論在政府廉潔程度、治理能力、經濟發展或民主開放度幾乎位列東亞之冠,如再以全球貧富差距、動盪化外部因素不由分說地責難當局,無疑一種純粹的情緒宣洩、未見理性。藍白所以有恃無恐,正是利用這股不滿情緒,人慣於將自身不滿責難於執政者,認為投票給某候選人即應有對應政治服務,恰與近代民主憲政邏輯相悖,國家與人民權義關係契約寫於憲法而非消費者權益保護法,政府作用在於守疆衛土、維護治安、穩定經濟與制定國策而非如同「阿拉丁神燈」一般滿足所有人慾望。 當前,有志國人總將藍白之亂歸因於政客煽動,事實上,選民素質方決定政治人物素質。台灣在民主上遠勝伊朗,保障一切權利自由,國內局勢卻見一股隱然的騷動;此際,執政黨應以伊朗為戒,台灣與之同為為地緣樞,紐亟需穩定內政,否則將受強鄰染指。當前之務應降低執政黨內部因選舉帶來的分裂,先安內後攘外;其次,適度放權予立院協商議案,欲得之先予之,可拉攏藍白內部理性者,尤其是區域立委,國昌所以趾高氣焰在於不分區立委無須向選民負責,故繞過爭議人物尋找適當破口;久之,鬆散聯盟將一觸可破;最後,台灣經貿與美國綁定,立委諸公們想必在這番股市收益不少,應知箇中因素,適度讓美國介入不妨是一個好選擇,逼迫藍白在中美之間抉擇,而非以傳統政黨惡鬥來問政。 作者 / 風林火山

委內瑞拉、烏克蘭、伊朗與台灣:四種截然不同的國際處境

在全球局勢持續動盪的當下,委內瑞拉、烏克蘭與伊朗常被用來與台灣比較。然而,這三國的危機來源、政治結構與國際定位,其實與台灣大不相同,理解這些差異有助於更精確地評估台灣的安全環境。 委內瑞拉的問題主要來自 內部治理崩壞。長期的威權統治、經濟政策失當與對石油的過度依賴,使該國陷入惡性通膨與大規模外逃潮。國際社會介入的主軸是制裁與人道援助。相比之下,台灣擁有成熟的民主制度、穩健的財政與科技產業,不存在國家功能失效的問題。 烏克蘭則是 主權遭鄰國直接以武力入侵 的典型案例。其國際邊界明確,俄羅斯的行動明顯違反國際法,因此引發全球大規模援助。台灣雖面臨中國的軍事壓力,但兩岸關係涉及歷史與政治定位,複雜程度高於俄烏邊界的法律清晰度。同時,台灣在全球半導體與科技供應鏈中的關鍵性,使得其安危牽動世界經濟,國際反應的型態自然不同。 伊朗則代表第三類情境:意識形態強烈、並積極參與中東代理戰爭的區域強權。其國際矛盾多源於核計畫、宗教政治體制與地緣衝突。台灣沒有輸出革命、支持武裝組織,也無意在區域擴張,因此其外部壓力並非因自身行為引起,而是來自中國對主權的主張。 綜觀三國案例,台灣最大的不同在於:第一,台灣的內部政經體質穩健,不像委內瑞拉因國家治理危機而動盪;第二,台灣的國際重要性極高,其科技供應鏈角色與烏克蘭截然不同;第三,台灣未曾引發區域衝突,與伊朗的地緣政治行為無法相比。 因此,將台灣簡單類比這三國並不精準。台灣的挑戰主要源自外部強權的壓力,而其穩健制度、經濟實力與國際支持,使其處境雖艱難,卻與那些因內部危機或意識形態衝突而陷入混亂的國家本質不同。 作者:寧為渣

只敢在立法院拍桌咆哮,不敢在華盛頓大小聲

立法院向來音量分貝最大聲的黃國昌,在訪美回國的記者會異常安靜。 前幾天倉促宣布訪問美國。沒有大張旗鼓的行前記者會,沒有隨團記者的鏡頭簇擁,甚至連當地行程都保密到家。總是將公開透明掛在嘴邊的國會戰神,低調進入AIT華盛頓總部,與其說是風光的政黨外交,更像是被迫成行的「緊急召見」。   要理解華府為何在此刻出手,要從印太戰略的視角來看。台灣政府提出8年1.25兆的預算案,並不只是單純的軍購數字,更是台灣向國際(尤其是美國)遞出的「自我防衛決心證明書」。   台海情勢升溫,美國積極建構印太第一島鏈的防禦網,希望台灣加速不對稱戰力的建構。然而,立法院內在野黨聯手杯葛、拖延、阻擋預算,對美方而言已經不是單純的內部朝野攻防,而是釋放出「台灣對抗意志動搖」的危險訊號。小則影響台美軍事合作期程,大至造成印太安全體系的防衛缺口。   AIT處長谷立言多次穿梭藍白陣營,苦口婆心溝通卻屢屢碰壁,華府的戰略耐性顯然已到臨界點。既然台北的代理人講不通,那就直接把相關決策者請到華盛頓面對面「溝通」。   這場會面的時間點精算得令人玩味。依照民眾黨內規的「兩年條款」,黃國昌的立委任期僅剩不到兩個月。在一般的華府政治邏輯裡,一位即將卸任國會議員的在野黨主席,長期投資價值其實是相當低的。   然而華府也很清楚,黃國昌個人的政治壽命或許有變數,但他手中握有的民眾黨團八席立委,是當下解開國會僵局的唯一鑰匙。美方不在乎黃國昌兩年後在哪裡,他們在乎立法院這個會期,民眾黨那八隻手舉起來的方向。   熟悉台美關係運作的人士認為,這次會面美方態度異常嚴肅,甚至帶有幾分訓斥意味。尤其,政壇盛傳黃國昌之子擁有美國籍的背景,在這場涉及美國國家利益的談判桌上,無疑成為無形卻強大的心理籌碼。面對美國老大哥,黃國昌過往在立法院對著官員拍桌咆哮的氣焰,來到波多馬克河畔,恐怕無所施展。   黃國昌返台後的記者會,媒體問他此行見了哪些人、談了什麼內容,昔日對黑箱作業斥之以鼻、堅持會議紀錄公開上網的戰神,竟變得語焉不詳,以私人行程、雙方默契輕輕帶過。   公開透明遇到美方壓力,似乎有了妥協空間。這場在AIT總部的閉門會談,黃國昌的閃爍其詞,證實了外界對於他「被拉正」的判斷與想定。尤其,美國官員對此行也同樣低調冷處理,沒有公開聲明、沒有合影留念;比起政黨領袖的外交訪問,而是像是美國老大哥緊急的召見、當面的拉正與告誡。   視角拉回民眾黨內部,這場訪美行也折射出柯文哲、黃國昌兩個太陽的微妙角力。柯文哲深知國防預算議題是燙手山芋,由黃國昌赴美承接美方壓力,不僅能讓黃暫時遠離立法院黨團的權力核心,更能藉此讓黃在國人面前顏面無光。   若黃國昌因美方壓力轉向支持預算,勢必得罪部分深藍支持者;若他堅持杯葛,則直接得罪美國老大哥。這場由美國導演、柯文哲默許的戲碼,讓黃國昌陷入了進退維谷的尷尬處境。   這場倉促難堪的華府行,或許是黃國昌從政以來最安靜的一次,也是訊號最響亮的一次。至於黃國昌在AIT總部裡究竟談到了什麼?答案,很快就會在立法院揭曉。 作者:江諺行

Recent Posts

The Hidden Crisis in North America’s Chinatowns:

The Hidden Crisis in North America’s Chinatowns:

Behind the Facade, Migrants Confront Exploitation, Precarity, and a Recast American Dream. Across major cities in North America, the familiar sights of Chinatown—busy restaurants, multilingual [...]

More Info
鐵拳之下的脆弱秩序──從伊朗街頭血腥鎮壓看威權穩定的幻象

鐵拳之下的脆弱秩序──從伊朗街頭血腥鎮壓看威權穩定的幻象

    從香港反送中運動、經濟衰退等激起人民抗爭卻受鎮壓後,伊朗也步入類似情境,竟以強硬手段鎮壓示威民眾,畫面中不乏實彈、拘捕與資訊封鎖。表面上,這似乎只是又一次威權政體面對內部經濟或政治腐敗不滿的「老劇本」;然,事實上深層因果恐非表面上簡單。 [...]

More Info
委內瑞拉、烏克蘭、伊朗與台灣:四種截然不同的國際處境

委內瑞拉、烏克蘭、伊朗與台灣:四種截然不同的國際處境

在全球局勢持續動盪的當下,委內瑞拉、烏克蘭與伊朗常被用來與台灣比較。然而,這三國的危機來源、政治結構與國際定位,其實與台灣大不相同,理解這些差異有助於更精確地評估台灣的安全環境。 委內瑞拉的問題主要來自 [...]

More Info
只敢在立法院拍桌咆哮,不敢在華盛頓大小聲

只敢在立法院拍桌咆哮,不敢在華盛頓大小聲

立法院向來音量分貝最大聲的黃國昌,在訪美回國的記者會異常安靜。 前幾天倉促宣布訪問美國。沒有大張旗鼓的行前記者會,沒有隨團記者的鏡頭簇擁,甚至連當地行程都保密到家。總是將公開透明掛在嘴邊的國會戰神,低調進入AIT華盛頓總部,與其說是風光的政黨外交,更像是被迫成行的「緊急召見」。   [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way