社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

台股 0311 暴漲分析:台積電領軍衝破 33000 點,是基本面回歸還是最後的逃命波?

台股在3月11日出現強勁反彈,盤面焦點高度集中在「權值股拉指數」與「通膨風險再定價」的拔河。前一個交易日,加權指數才因中東戰事推升油價、外資大幅調節而重挫,台北時報形容為戰火帶動的價格衝擊,並點出外資單日賣超創紀錄等極端訊號。 反彈當天,市場自然把它解讀為「情緒修正+基本面回歸」,但問題在於:這一波上漲的「實」與「虛」並不在同一條軸線上。 「實」的部分,來自台積電營收與AI供應鏈能見度。台積電公告2月營收雖受工作天數影響月減,但年增仍逾兩成,累計前兩月營收年增接近三成,市場把它視為AI/HPC需求仍在、先進製程趨勢未變的直接證據。 在高權值結構下,台積電只要回到強勢區間,就足以帶動指數快速跳升,形成「指數看起來很猛,但主要靠一兩檔撐起來」的典型行情。 同日盤面另一條「實」線,是記憶體族群的強勢輪動。Yahoo與經濟日報的即時報導顯示,南亞科、旺宏等多檔記憶體股出現漲停或大幅上揚,市場敘事聚焦在供給端轉向HBM/DDR5造成傳統DDR4供給受限,以及AI伺服器、邊緣運算帶動整體記憶體搭載量的中期趨勢。 這使反彈不只是一日「權值拉抬」,而是有族群接棒,增加短線延續性。 但「虛」的部分,是估值所押注的宏觀前提仍不穩。兆豐金董事長董瑞斌指出,油價上漲對物價的遞延影響約2到3個月,可能在5月逐步顯現;若戰事拉長,通膨再起將壓縮降息空間,等於直接衝擊目前市場對「下半年更寬鬆資金環境」的想像。 這也是為什麼同樣是大漲,市場仍會出現「是不是逃命波」的疑慮:當利率與通膨的風向未定,高本益比的AI與高價權值股就會在消息面上呈現高波動。 因此,3月11日的暴漲可以同時成立兩種解讀:它既是前一日恐慌性賣壓後的均值回歸,也是資金在「獲利成長」與「成本攀升」之間重新押注的結果。真正的檢驗點會落在兩件事:第一,接下來公布的3月營收與財測,能否讓「高股價溢價」有可驗證的現金流與訂單支撐;第二,中東油價是否繼續推升全球通膨預期,迫使市場把降息時間表往後推。當基本面撐得住,而通膨沒有反撲,台積電上攻與指數再創高才有「實」的基礎;反之,任何一項失速,回檔就會來得又快又狠。 作者:新公民議會編輯小組

311震災十五週年與能源轉型:日本「廢核轉擁核」對台灣的政治啟示

311東日本大震災邁入十五週年,日本社會對核能的態度正出現明顯位移:從福島核災後的全面反核與停機,走到今天以「能源安全」與「成本壓力」為核心的重啟潮。這種「廢核轉擁核」不是價值翻轉,而是風險排序改變。路透指出,日本在中東衝突推升燃料價格、供應不穩的背景下,加速核電產業回溫,甚至讓三菱重工的核能銷售出現「提前到來的復甦」。日本已有15座可運轉反應爐重啟,更多機組申請中,目標是降低對進口化石燃料的依賴。 這種政策轉向的政治邏輯,在「記憶淡化」與「現實壓力」之間拉扯。路透專題描述,福島災難後民意曾迫使政府走向逐步廢核,但近年在能源價格、極端氣候與供電韌性壓力下,日本重新擁抱核能,並把「新一代更安全的反應爐」當作可對外說服的政策語言。 這也反映在民調與社會氛圍:Yahoo轉載中央社報導提到,朝日新聞2月民調顯示支持核電重啟的比例上升,甚至出現年輕世代支持度偏高的現象。 把日本放回台灣脈絡,啟示並不在「台灣該不該擁核」,而在於「能源政策如何面對現實壓力時不被政治撕裂」。日本的政策修正,是在能源供應高度仰賴進口、又面對中東地緣風險時,為了壓低電價與確保基載而做的選擇;路透就指出,荷姆茲海峽受戰事影響導致油價大漲,已直接衝擊日本工業生產與燃料成本,使政界更加高調呼籲核電全力運轉以對沖危機。 這種「能源恐懼」不靠口號解決,而靠可計算的供應來源、發電成本與風險控管工具來回應。 台灣同樣面臨「高用電、低容錯」的結構:半導體與AI帶來用電成長,任何電價、供電或燃料供應的波動,都會被產業鏈放大成競爭力問題。日本案例提醒台灣:當社會把風險從「核災」轉向「斷電、電價飆升、供應鏈外移」時,民意會重新配置容忍度,政策也會跟著轉向。這不是背叛理念,而是政治必須處理的現實:能源轉型若缺乏韌性設計,最終會被外部衝擊逼著改路線。 因此台灣真正該學的是日本的「政治工程」:第一,把能源安全從意識形態辯論,改成可量化的供電韌性指標(備轉、燃料庫存、極端天候備援)。第二,把「新技術核能/再生能源/儲能/電網強韌」拆成可交付的工程計畫,而不是把核能當成單一答案。第三,用透明的成本與風險揭露,讓社會知道每一條路線的代價,而不是等危機來了才被迫轉彎。311十五週年的日本,正在示範一件事:能源政策終究要回到生存算術,否則任何承諾都會在下一次地緣與氣候衝擊前破功。 作者:新公民議會編輯小組

WBC台韓大戰餘波:韓國主砲遭網暴關閉社群,台灣球迷文化的勝利與失控

WBC台韓大戰後,台灣球迷最先記住的當然是勝利本身,但賽後另一個更不堪的焦點也迅速擴散:有部分激進球迷把情緒從球場延伸到網路,指控韓國隊主砲文保景疑似「控分」意圖做掉中華隊,進而湧入其IG留言洗版,最終導致球員關閉帳號。這起事件讓「台韓大戰」的餘波不再只是戰績與分組計算,而變成一場關於球迷行為與運動倫理的公共討論。 事件的第一個關鍵,是「控分」這個指控本身具有高度煽動性。短期賽制下,分組晉級常牽涉失分率、分差與對戰比較,球迷很容易把複雜的賽程利益簡化成「你是不是故意放水」的陰謀敘事。當這種敘事被剪成短片、搭配片段畫面流傳,理性判讀會被情緒取代,個別球員就會被快速選為「替罪羊」。在社群媒體的演算法結構下,憤怒比分析更容易擴散,導致球員的私人帳號成為集體宣洩的出口。 第二個關鍵,是台灣球迷文化的雙面性。台灣應援文化以高密度、強參與與群體共鳴著稱,這本來是亞洲棒球最具吸引力的景觀之一;但同一套群體動員機制,在失控時也會快速轉向「獵巫」。當部分人把「替台灣出一口氣」等同於「去對方球員IG開戰」,運動競技的邊界就被抹平,剩下的是民族情緒與網路私刑。更嚴重的是,這種行為會讓外界把台灣球迷的高參與度,重新解讀成高攻擊性,反而傷害台灣棒球長期累積的國際好感。 第三個關鍵,是PTT與社群平台上的兩極反應揭露了價值衝突。支持者把洗版視為「愛國」或「反制不公」,認為對方若有不當行為就該承擔壓力;反對者則指出,球場內的輸贏與策略,應回到規則與比賽事實討論,對個人帳號的集體攻擊是失格行為,甚至可能構成霸凌與跨境騷擾。這種分裂本質上是「勝利正當性」的焦慮:越在意勝利是否乾淨,越容易把不確定性投射成陰謀,最後把情緒轉嫁到人身攻擊。 要讓台韓大戰的餘波回到健康的棒球文化,真正有效的做法不是道德喊話,而是建立明確的社群規範與責任鏈。主辦單位與球團應更積極地在賽後提供可驗證的賽事資訊,降低陰謀敘事的空間;平台端要對跨境洗版與集體騷擾更快介入;而台灣球迷社群也需要形成清楚共識:支持球隊不等於攻擊對手,熱血應援不能用羞辱與騷擾作為代價。台灣棒球的價值在於贏球後仍能保持格局,否則每一場勝利都可能被少數人的失控行為抵消。 作者:新公民議會編輯小組

中東戰火下的北京角色:大國博弈的「局外人」焦慮

美以對伊朗動武後,北京的第一反應不是出兵介入,而是快速切換到「停火、降溫、反對政權更迭」的話術與電話外交。中國外長王毅公開稱美以打擊「不可接受」,呼籲立即停火並恢復談判,同時與多個海灣國家外長通話,強調尊重主權與區域穩定,並宣布將派特使赴中東斡旋。 這種姿態表面上像「負責任大國」,但背後更像是一種焦慮:戰場由美國與以色列主導,談判桌也由華府設定節奏,北京被迫站在外圍發聲。 北京的「局外人焦慮」首先來自能源與航運。路透指出,伊朗採取「消耗戰」並把火力指向海灣能源節點,意圖透過能源中斷推升全球油價,給美國與盟友施壓。 對中國而言,中東不是價值敘事,而是供應鏈與通膨風險:中國是全球最大能源進口國,油價暴衝會直接打到製造成本與內需信心。路透亦報導,北京一方面靠戰前大量囤油與伊朗、俄羅斯供應緩衝短期風險,另一方面要求部分煉油業者暫停或取消燃料出口合約,顯示其內部已把戰爭視為供應緊縮事件來管理。 甚至有消息指出,中國正與伊朗協商,讓運載中國原油與卡達LNG的船隻在荷莫茲海峽取得「安全通行」安排,這更像危機下的雙邊交易,而非真正的和平調停。 第二層焦慮來自地緣政治的失分。北京過去以「沙伊和解」建立中東外交招牌,但本輪戰事核心是美以直接攻擊伊朗,軍事主導權完全不在北京手上。更尷尬的是,路透分析指出,伊朗在戰爭壓力下,俄羅斯與中國都選擇「站一旁」,德黑蘭雖有政治聲援,卻難以得到可改變戰局的實質支援。 這讓北京面臨雙輸:不介入則顯得影響力有限;介入則可能被拖進美國設定的對抗場域,還可能引來更嚴格的二級制裁與金融風險。 第三層焦慮則是敘事與制度的矛盾。北京對外一面要求停火、一面警告不要策動伊朗「顏色革命」或政權更迭,並把「反干涉、反顛覆」包裝成國際秩序原則。 這種立場能服務北京的長期安全觀,但在戰爭的即時政治裡很難轉化為談判籌碼,因為真正能迫使交戰方改變行動的,仍是軍事能力、制裁工具與同盟網路。 總結來看,北京在中東戰火中的角色是「高曝險、低主導」。它既不能像美國那樣提供安全傘,也不願像傳統盟友那樣被戰爭綁架,只能在電話外交、特使斡旋與能源風險控管之間反覆切換。對外,北京努力塑造「和平推手」;對內,北京更像在做一套危機資源調度:保供、穩價、維持航運與避免被制裁波及。這就是大國博弈的「局外人」焦慮:表面保持距離,實際每一波油價與航道震盪,都直接打在自己的經濟命門上。 作者:新公民議會編輯小組

Recent Posts

台股 0311 暴漲分析:台積電領軍衝破 33000 點,是基本面回歸還是最後的逃命波?

台股 0311 暴漲分析:台積電領軍衝破 33000 點,是基本面回歸還是最後的逃命波?

台股在3月11日出現強勁反彈,盤面焦點高度集中在「權值股拉指數」與「通膨風險再定價」的拔河。前一個交易日,加權指數才因中東戰事推升油價、外資大幅調節而重挫,台北時報形容為戰火帶動的價格衝擊,並點出外資單日賣超創紀錄等極端訊號。 反彈當天,市場自然把它解讀為「情緒修正+基本面回歸」,但問題在於:這一波上漲的「實」與「虛」並不在同一條軸線上。 [...]

More Info
311震災十五週年與能源轉型:日本「廢核轉擁核」對台灣的政治啟示

311震災十五週年與能源轉型:日本「廢核轉擁核」對台灣的政治啟示

[...]

More Info
WBC台韓大戰餘波:韓國主砲遭網暴關閉社群,台灣球迷文化的勝利與失控

WBC台韓大戰餘波:韓國主砲遭網暴關閉社群,台灣球迷文化的勝利與失控

WBC台韓大戰後,台灣球迷最先記住的當然是勝利本身,但賽後另一個更不堪的焦點也迅速擴散:有部分激進球迷把情緒從球場延伸到網路,指控韓國隊主砲文保景疑似「控分」意圖做掉中華隊,進而湧入其IG留言洗版,最終導致球員關閉帳號。這起事件讓「台韓大戰」的餘波不再只是戰績與分組計算,而變成一場關於球迷行為與運動倫理的公共討論。 [...]

More Info
中東戰火下的北京角色:大國博弈的「局外人」焦慮

中東戰火下的北京角色:大國博弈的「局外人」焦慮

美以對伊朗動武後,北京的第一反應不是出兵介入,而是快速切換到「停火、降溫、反對政權更迭」的話術與電話外交。中國外長王毅公開稱美以打擊「不可接受」,呼籲立即停火並恢復談判,同時與多個海灣國家外長通話,強調尊重主權與區域穩定,並宣布將派特使赴中東斡旋。 這種姿態表面上像「負責任大國」,但背後更像是一種焦慮:戰場由美國與以色列主導,談判桌也由華府設定節奏,北京被迫站在外圍發聲。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way