社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

美超微走私輝達晶片案延燒:吹風機換標籤只是表面,AI出口管制下的供應鏈誠信危機才是核心

一則「吹風機加熱換標籤」的走私指控,之所以能在科技圈炸出巨浪,不是因為手法荒謬,而是它把AI時代最敏感的灰色地帶攤在陽光下:當輝達GPU與高階伺服器被視為戰略物資,企業若在出口管制上踩線,風險不再只是罰款或官司,而是整條供應鏈被重新定價,甚至被貼上「國安疑慮」標籤。 美超微事件的訊號很清楚。第一,出口管制已從「文件合規」進入「行為合規」。過去企業可能靠最終用戶聲明、轉運路徑、第三方貿易公司來做形式防火牆;但在AI晶片變成地緣政治籌碼之後,監管更看重的是企業是否建立可稽核、可追溯、可驗證的內控系統。一旦被認定刻意規避,不只個案被追究,連同集團治理、供應鏈夥伴、售後服務與維修渠道都會被拉進調查範圍。 第二,市場下跌不只是情緒反應,而是風險溢價的重估。投資人擔心的不是單一案件,而是後續連鎖:訂單暫停、政府調查擴大、銀行授信收緊、保險費用上升,甚至客戶為了避免被波及而改採「更保守的供應商」。在AI伺服器與資料中心的採購邏輯裡,合規是一種產品品質;一旦品質被質疑,折價會非常快。 第三,台灣供應鏈會被迫面對更高標準的政治審查。台灣在AI伺服器組裝、主機板、機殼、散熱、電源與系統整合上具有關鍵地位,但也因此更容易被要求「證明清白」。未來風險不在於台廠是否願意配合,而在於是否能用制度化的證據鏈,證明產品流向、客戶背景、維修零件、替換機與退貨機的去向都可追溯。缺乏這套能力,就可能被納入高風險名單,導致接單門檻提高、交期變長、成本上升。 這起事件的真正教訓,是科技巨頭不能再把合規當成本中心。AI時代的合規是競爭力,是能否持續留在美系生態、拿到高階零組件、進入大型客戶白名單的入場券。台灣若要守住AI供應鏈的核心位置,必須把「透明度」做成可驗證的產線能力,而不是公關口號。 作者:新公民議會編輯小組

少子化世界倒數下的政策矛盾:移工生育補助、人口統計美化與台灣生育率困局

台灣少子化已不是「社會現象」,而是直接牽動勞動力、國安、財政與世代公平的結構危機。在這個背景下,任何與生育相關的補助與制度設計,都必須回答同一個問題:它究竟是在修補人口結構,還是在讓報表更好看?近期引發爭議的焦點,是部分政策與實務操作被認為對移工孕產提供補助與安置資源,但對本國年輕家庭面對的高房價、托育缺口與工時壓力,卻沒有同等規模的「可持續解方」。爭議不應被簡化成對移工的敵意,而應回到政策目的、誘因設計與公共資源配置的合理性。 問題的核心在於「目標錯置」。移工制度的本質是補足特定產業與照護人力缺口,屬於短期或循環式移動勞動。若政策用大量公共資源承接移工孕產與新生兒安置,卻缺乏清晰的長期規劃,例如孩子未來的監護、教育、醫療與身分安排,最終容易形成兩個後果:第一,母國與雇用地之間出現責任灰區;第二,孩子在成長過程中面臨照顧斷裂,公共部門與安置機構被迫長期接手。這不是「多花錢做善事」的簡單命題,而是對兒童權益、家庭責任與制度邊界的治理考驗。 更敏感的,是誘因結構帶來的道德風險。任何補助只要與特定行為直接掛鉤,都可能被解讀成「鼓勵」。在收入差距顯著的情境下,一次性補助對部分群體可能具高度吸引力,政策如果缺乏配套查核、缺乏成本分攤規則、也缺乏對雇主與被照護者的替代照護安排,就可能把本來應該被管理的個案風險,擴散成制度性負擔。這會讓社會陷入兩難:一方面必須保障孕產者與兒童基本權利,另一方面又會看到公共資源被不透明地消耗、被用來填補政策設計的空洞。 同時,少子化的主要痛點其實從來不在「有沒有補助」,而在「能不能養得起」。台灣年輕人不敢生,是因為住房成本吞噬所得、托育時間與職場制度不匹配、育兒與照護雙重夾擊、以及對未來的不確定性。若政府把大量政策能量投入「個案式補貼」,卻沒有用同等規模去降低本國家庭的結構成本,社會感受自然會轉向「本國家庭被放生、制度在做漂亮數字」。這種感受一旦擴散,傷害的不只是單一政策,而是對公共治理的信任。 要走出這個爭議,下一步應回到三個原則:第一,人口政策要以「長期定居與養育」為主軸,把資源優先投注在托育公共化、社宅與租屋支持、工時彈性與親職友善職場;第二,移工孕產保障要以「最低必要、可治理、可追責」為邊界,確保兒童權益的同時,建立跨部會責任鏈與透明預算;第三,任何補助都必須附帶清楚的目的指標,避免落入「用錢解決焦慮」的政策幻覺。 少子化不是靠一次性補助扭轉的,而是靠制度把「生與養」從高風險賭局,改成可預期的人生選項。若政策只追求短期數字好看,代價會在未來十年以更高的長照負擔、更低的勞動力、更脆弱的財政,一次性回收。 作者:新公民議會編輯小組

家事移工強制納勞保爭議:雇主負擔、勞保永續與「全民買單」的政策風險

「家事移工是否應強制納入勞保」之所以反覆成為社會爭議,問題不在於誰更有道德高度,而在於制度要怎麼設計才不會把照護家庭推向財務崩潰,同時又讓社會保險走向不可持續。近期雇主團體強烈反對「家事移工強制納勞保」與「政府補貼保費」,突顯這個議題已從勞動權益延伸到公共財政、長照現實、以及勞保基金的結構風險。 先釐清一個常被混淆的前提:家事移工的聘僱型態與一般企業雇用勞工不同。家庭聘請看護或幫傭,多數是為了失能長輩、身心障礙者與病人照護,雇主不是企業、沒有營收,也無法把成本轉嫁到商品價格。當政策以「雇主責任」一語帶過,實際承擔者常是被長照壓力壓到極限的中低收入家庭。若再疊加保費、行政程序與可能的追溯責任,政策表面看起來是擴張保障,底層卻可能變成「增加照護門檻」,迫使部分家庭回到失序的無照護狀態,或改用更脆弱、更不透明的替代方案。 第二個關鍵是勞保制度本身的財務邏輯。勞保是跨世代移轉的社會保險,現收現付色彩濃厚,人口老化與少子化已讓基金長期承壓。此時討論擴大納保對象,不能只談「應不應該」,而要回答「怎麼付、誰來付、風險如何控」。若新增納保人口多屬短期在台工作,繳費期間有限、未來請領條件與跨境給付的查核成本卻上升,就可能在制度邊界產生新的不對稱:成本快速增加、治理難度上升,但永續性不一定改善。更敏感的是「政府補貼」一旦成形,等於把家庭聘僱成本社會化,直接變成納稅人支出,政治上好聽,財政上卻是長期負債承諾。 第三個面向是給付設計與查核能力。社會保險的給付必須建立在可驗證的事實與可稽核的文件上。若涉及海外事件(例如親屬死亡、醫療證明等)需要跨境查核,而制度又缺乏足夠的驗證機制,詐領與爭議就會變成常態風險。政策若不先補上查核與追溯工具,只靠擴大給付範圍,容易讓制度淪為「好心設計、壞人套利」,最後引發更大的民怨與反彈。 真正可行的改革方向,是把「照護」與「就業保險」分開處理。家事移工牽涉的是長照服務與家庭照護支援,政策應先回到長照體系:提升喘息服務、臨托與居服量能,降低家庭對單一移工的依賴;同時建立更貼近家事工作的專屬保險或保障方案,例如以職災、醫療、傷病為主的風險池,搭配明確的保費分攤、政府只針對弱勢家庭定向補助,而不是一口氣把整體成本丟進勞保體系。這樣才能同時回應移工保障、家庭負擔與制度永續三個目標,而不是用單一口號把衝突延後到下一次基金撥補與下一次稅負爭議。 家事移工納保不是不能談,但必須先把「雇主是家庭」與「勞保已承壓」這兩個現實放到桌面上。制度設計若忽略可負擔性與可治理性,只會把照護家庭推進更深的壓力鍋,並讓社會保險的信任更快崩塌。 作者:新公民議會編輯小組

台灣棒球未來的機會與挑戰

台灣職棒新球季即將開打。2024年世界12強、2025年WBC資格賽、2026年WBC,台灣隊接連創造佳績,帶動國內棒球的人氣熱潮,職棒場均觀眾人數跟著突破新高。觀察社會各界的期待與討論,從宏觀的產業發展來看,未來幾年,台灣有幾個重要機會應當好好把握。 中華棒協和職棒聯盟將交接政權 首先是體育圈重要人士的任命。賴清德總統兌現政見承諾成立運動部,有計劃性的推動職業運動、競技運動和全民運動,延攬兩屆奧運金牌國手李洋出任首任部長。李洋年紀雖輕,但是剛從選手退役,具備第一線運動員的視野和人脈連結。此外,總統的欽點與兩面奧運獎牌的雙重加持,讓他在階級輩份制度厚重的體育界,尚能伸展拳腳推動改革。 攸關國手備戰訓練的國家運動訓練中心,最近確定由中華奧會前主席林鴻道接掌董事長,與執政黨關係友好的資深體育人士趙士強擔任執行長,前體大校長、富邦悍將領隊林華韋就任副執行長。國訓中心、棒協、職棒聯盟三位一體,在國內四級棒球發展和國際賽事代表隊的籌組、賽事、訓練各司重要角色。由與政府合作已久的資深人士接棒國訓中心要職,可發揮後勤訓練方面,定心丸的作用。 中華棒協方面,中信集團負責人辜仲諒的兩屆理事長任期將屆滿。最新媒體報導傳出,中信董事長陳國恩及前經濟部長、崇越集團董事長郭智輝皆有意爭取。 暫且不論棒協的會員票數主要由哪些系統掌握,棒協理事長一職攸關國內四級棒球的經營及發展,是國內成棒、職棒、旅外、國家隊的人才養成農場。協會理事長一是需具備足夠的社會份量,能夠一呼百諾,二是需具備相當人脈與財力,能夠協調資源、跨界溝通。從這個角度來看,具中信集團背景的陳國恩,以及經營成棒隊、經營台日關係多年的郭智輝,都具備充足條件,皆是可靠人選。 中華職棒大聯盟會長,功績卓著、深獲聯盟六球團共同支持的立法委員蔡其昌兩屆任期同樣也將屆滿。根據媒體揭露,國民黨立委洪孟楷、教育部次長張廖萬堅都是目前傳聞名單。六球團大約將在今年下半年開始討論新會長人選。 無倫是前任會長吳志揚,或是現任會長蔡其昌,對棒球運動都有足夠的理解和認識,兩人在藍綠兩黨皆有一定政治地位和社會聲望,協調與體育署、棒協之間的紛爭,或是推動政策改革也親力親為,因此受到當年四球團、現在六球團的認可,也獲得球迷普遍正面的評價。 張廖萬堅在台中擔任立委時期就長期支持地方體育發展,體育運動可說是他監督與推動政策的「守備範圍」,接任教育部政次後,體育署(運動部)也在他的督導範圍內;體育圈人士對他並不陌生,接任聯盟會長,也較名符其實,可望能繼續延續「蔡其昌-辜仲諒」合作體制。 相較之下,洪孟楷的體育資歷較為單薄。固然他是坐擁淡水十數萬票選民的支持當選立法委員,也接下母親郭素春政治衣缽,但他與體育發展、尤其棒球運動的連結並不深,無論是國會的相關表現或者平時的社群經營,看起來是場外球迷心態,而非圈內知情者姿態,直接一點的說,對球迷而言,洪孟楷頂多就是個「好像有看一點棒球」的國民黨政治人物。 聯盟新會長的機會 聯盟新會長的人選有哪些人,要等到下半年才會逐漸明朗。根據媒體報導,六球團大約將在八、九月啟動討論。新會長的機會,倒是可以先提出來談。 首先是推動國家代表隊的專職化。我們應該借鏡日本的公司化經營,由專職的教練團和後勤系統,長期追蹤國內外球員動向,而非遇到國際賽時才任務性編組,又從職棒隊伍當中徵招調用教練支援。如此才是長遠之道。 其二是加速室內棒球場,也就是大巨蛋的加速興建。台北大巨蛋的啟用與新鮮感,增加觀眾進場意願,開發新客群,也創造更多合作商機。然而每年職棒賽事的場次安排,仍由遠雄公司所掌握,對於職棒的發展與成長並不利。 除了已經完工的台北大巨蛋,台中、新北、桃園三縣市已有明確的建設大巨蛋計劃。聯盟新會長應該結合棒協、運動部、地方政府的資源和力量,招募民間企業共同商業開發。 第三,壯大亞洲冬季聯盟,以亞太棒球的春訓基地為目標,推動更多成人棒球場。今年台南的國際亞太棒球訓練中心啟用,擁有兩座成人球場;而位於高雄的台鋼科大(前高苑科大)的棒球基地也已開始運作,以及屏東的國際棒球場也正在建造中。 增加職棒一、二軍、業餘成棒的場地與賽事是無疑好事,從球員、裁判、球場人員的練兵養成都有正面助益。我們應該把眼光放大,擴充現有的亞洲冬季聯盟,將其視為台灣棒球除了職棒以外的第二根重要支柱。 台灣的緯度與日本沖繩石垣島相近,南台灣其實相當適合發展台、日、韓、澳球隊的春訓交流商機。包括雲林的斗六球場、嘉義縣市的兩座球場、高雄的青埔國慶棒球場都應該有更長期且完善資源挹注。 第四,探詢是新球隊的可能性。職棒重返六隊後經營有成,加上12強與WBC的全民熱潮。所謂民氣可用,職棒拓展第七隊、甚至第八隊的可能性並非不可能。增加對戰組合、擴增市場規模是必要。從屬地主義和人口經營的角度,目前大新竹、大嘉義、高屏(南高雄與屏東)都有龐大的開發潛力。 從吳志揚會長招募頂新味全重返職棒,到蔡其昌會長招募台鋼集團成為第六隊。經營職棒,金融、服務的B2C企業向來較有興趣。檯面上玉山、國泰和台新新光過去都是四級棒球的長期贊助商,如何吸引這些企業「坐上牌桌」,將是新會長的機會和挑戰。 作者:江諺行

Recent Posts

美超微走私輝達晶片案延燒:吹風機換標籤只是表面,AI出口管制下的供應鏈誠信危機才是核心

美超微走私輝達晶片案延燒:吹風機換標籤只是表面,AI出口管制下的供應鏈誠信危機才是核心

一則「吹風機加熱換標籤」的走私指控,之所以能在科技圈炸出巨浪,不是因為手法荒謬,而是它把AI時代最敏感的灰色地帶攤在陽光下:當輝達GPU與高階伺服器被視為戰略物資,企業若在出口管制上踩線,風險不再只是罰款或官司,而是整條供應鏈被重新定價,甚至被貼上「國安疑慮」標籤。 [...]

More Info
少子化世界倒數下的政策矛盾:移工生育補助、人口統計美化與台灣生育率困局

少子化世界倒數下的政策矛盾:移工生育補助、人口統計美化與台灣生育率困局

[...]

More Info
家事移工強制納勞保爭議:雇主負擔、勞保永續與「全民買單」的政策風險

家事移工強制納勞保爭議:雇主負擔、勞保永續與「全民買單」的政策風險

「家事移工是否應強制納入勞保」之所以反覆成為社會爭議,問題不在於誰更有道德高度,而在於制度要怎麼設計才不會把照護家庭推向財務崩潰,同時又讓社會保險走向不可持續。近期雇主團體強烈反對「家事移工強制納勞保」與「政府補貼保費」,突顯這個議題已從勞動權益延伸到公共財政、長照現實、以及勞保基金的結構風險。 [...]

More Info
台灣棒球未來的機會與挑戰

台灣棒球未來的機會與挑戰

台灣職棒新球季即將開打。2024年世界12強、2025年WBC資格賽、2026年WBC,台灣隊接連創造佳績,帶動國內棒球的人氣熱潮,職棒場均觀眾人數跟著突破新高。觀察社會各界的期待與討論,從宏觀的產業發展來看,未來幾年,台灣有幾個重要機會應當好好把握。 中華棒協和職棒聯盟將交接政權 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way