社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

黃國昌被告與新北市長藍白合提名爭議:司法風險、政治獻金灰區與在野整合的三重壓力

民眾黨徵召黃國昌參選2026新北市長後,「藍白合」原本被視為在野整合的關鍵試驗,但近期輿論焦點同時被兩條線拉扯:一是黃國昌因京華城案相關質詢內容遭控涉及偽造偵訊錄音檔而被北檢傳喚說明;二是他卸任立委後以直播收受「抖內」被內政部點名不符未來候選人合法政治獻金管道,讓選戰從政見競逐轉向「合法性與正當性」的壓力測試。 先談「被告」風險。公共媒體報導指出,黃國昌遭指控在立法院質詢時播放所謂「偵訊示範帶」而被質疑變造錄音檔、誤導社會觀感,北檢因此傳喚應訊。黃國昌本人則回應「官司不會影響藍白合,除非今天把我羈押」,把問題定調為政治操作與程序攻防。對新北選戰而言,真正關鍵不在個案是否成立,而在「司法程序的不確定性」會不會變成整合談判的籌碼:國民黨若要談民調整合或禮讓,勢必會把候選人風險納入勝算評估;民眾黨則必須證明候選人不會被訴訟拖累選戰節奏。 第二條線是政治獻金灰區。中央社報導內政部長劉世芳指出,抖內屬數位網路金流,不易監控審查,並不符合未來候選人可使用的正式政治獻金管道;黃國昌則主張自己無公職身分,依法並無違法。這個爭議的本質,是制度落後於募款工具:現行法對「候選人準備期」與「網路小額贊助」的界線不夠清楚,導致行政機關只能以「不符期待」或「將研議修法」回應,難以立即給出可執行的判準。爭議因此被政治化:支持者視為迫害,反對者視為規避,最後損害的是政治獻金制度的可預測性。 回到藍白合提名本身,民眾黨已正式徵召黃國昌參選新北市長,黃也公開強調在野合作「秉持最大風度」。國民黨方面,黨主席鄭麗文公開表示若新北國民黨提名人選民調最強,黃國昌會支持藍營候選人。此外,國民黨新北熱門人選李四川也曾表態不排斥與黃國昌以民調方式整合。這些訊號透露出一個現實:藍白合在新北的可行性,取決於「誰的民調能證明可贏」,而不是口頭上的理念一致。 因此,相關單位下一步該採取的政策,不是跟著輿論起舞,而是把兩個制度洞補起來。第一,監察院與內政部應儘速提出「候選人準備期」網路贊助的合規框架:明確定義何時視為政治獻金、平台金流如何揭露、實名與上限如何落地,避免抖內成為灰色募款管道。第二,司法機關對高關注政治案件應提升程序透明度與時程可預期性,讓社會把焦點放回證據與法律,而不是用「傳喚」與「陰謀論」互相動員。第三,中選會與選務體系則應針對「候選人資格—募款—宣傳」的灰區提出一致指引,否則每到選舉年,類似爭議都會以不同形式重演。 黃國昌的新北之戰,表面是藍白如何整合,實質是台灣選舉制度如何面對新型募款工具與高強度司法攻防。若制度補不上,最後不只是在野陣營承擔風險,整個民主程序的信任成本也會一起上升。 作者:新公民議會編輯小組

民眾黨不分區立委李貞秀戶籍爭議:制度漏洞如何補上,下一步政策該怎麼做

李貞秀的戶籍爭議之所以擴大,不在於單一個案的政治攻防,而在於「候選人資格審查」與「戶籍/國籍文件補正」之間長期存在的制度落差。行政院與內政部在說法上已點出關鍵:李貞秀1999年定居設籍,但直到2025年3月才向移民署繳交經海基會驗證的註銷中國戶籍公證書;而陸委會也曾表示,李在登記參選時具備「雙重戶籍」疑慮,牽動兩岸條例的參選資格判斷。 制度面最大的風險,是「事後補件」容易被誤讀成「身分重新起算」,也容易讓社會把程序補正與實質資格混在一起。李貞秀方面主張1999年就已註銷對岸戶籍,2025年只是補交證明文件;但政府端若認定在參選時點文件尚未到位,就會衍生候選人資格是否符合的爭點。 這類爭議一旦進入政治動員,真正受傷的是選舉制度的可預測性:選民無法確認「投票後會不會被翻盤」,候選人也無法確認「何時算完成合規」。 相關單位的下一步政策,應聚焦三件事。第一,將「兩岸身分/戶籍除籍證明」納入候選人登記前的強制性查核,並把查核責任與時點寫進明確SOP:以「登記當下」作為唯一判斷基準,避免事後補件造成認定混亂。第二,建立跨機關資料勾稽的例行機制,由移民署、戶政、陸委會與中選會形成固定介面,讓「是否曾具雙重戶籍」不必靠個案政治爆炸才補漏洞。第三,對於「舊案補件」與「新案審查」切割處理:舊案若因早年制度不同導致文件不齊,應提供一致的補正流程與法律效果說明;新案則應在登記前就一次到位,不再允許模糊空間。 在救濟與責任路徑上,也需要制度化。行政院已指出,依選罷法第121條,能提出當選無效之訴的機關只有選舉委員會;而中選會目前若因人事未足無法正常運作,就會造成「有爭議但難以啟動程序」的治理真空。下一步不應再用政治口水互推,而是把中選會正常運作當成最低限度的制度修復。 這個事件最值得被留下的結論,是把爭議從個人道德審判,拉回到「資格審查的法定時點、文件標準化、跨機關查核、救濟程序可啟動」四個技術問題。做得到,下一次爭議就不會靠媒體爆料與政治動員來裁決,而會回到制度本位。 作者:新公民議會編輯小組

川普選在川習會前攻擊伊朗,意在警告習近平!

川普的世紀之怒,狙殺了伊朗領導人哈米尼,以及諸多伊朗高官跟接班人。這個行動,其實在意料之中,可直接擊斃,又令人感到震驚。 而最震驚的,莫過於習近平。因為,川習會,才預告正要展開,卻突然給出下馬威。可見,川普要說,不要懷疑我,對抗威權政府的意志。 伊朗的獨裁者,哈米尼已經統治伊朗近37年。這樣的高壓治理,引發了伊朗民眾上街,而伊朗粗暴的對抗陳抗,已經屠殺了數十萬百姓。 川普對於伊朗政府的暴行,還有恐怖組織的行徑,早已祭出制裁多年。歷任的總統,大都予以譴責,人權團體也都只能聲援居多。實際上,沒有太大用處。 可這次不同,因為伊朗人民走上街頭。讓川普有了足夠的底氣,對伊朗進行精準的打擊。其針對重要官邸跟軍事設施。不只破壞,還將獨裁者們一擊斃命。這必須承擔十足的勇氣,還有不能讓戰線拖長的智慧。 所謂,首戰即終戰;擒賊先擒王。川普肯定精通兵法,才有辦法,在適當的時機,做一場,不會自傷的賭局。 比起來,俄羅斯總統普丁,可真是差多了。曾經說三天要拿下烏克蘭的基輔,結果打了四年,卻讓自己陷入危機。更是拖垮了俄羅斯人。 從以上種種,可以發現,領導者要發動戰爭,除了師出要有名,還要打一場,有把握的戰爭。這其中最大的差別,在於美國狙殺伊朗哈米尼,是民主向獨裁之戰,還有解放伊朗人民之戰。 美國並無意強佔伊朗,也沒有宣稱伊朗是美國的一部分。這樣的戰爭,是為了價值而戰,希冀痛苦跟苦難能夠結束,伊朗人民起身作主。我想,這就是獨裁主義跟共產主義,所無法帶過世人的。 共產主義,總是說要解放人民。可人民卻受到各種箝制。共產主義總是說,台灣是他們不可分割的領土,卻從來就是想要強佔台灣。共產主義不只如此,更是滲透邪惡跟負面的情緒與言語,來戕害民主國家。 因此,習近平最樂意的,就是美國不管世界。這樣共產主義就能在全世界囂張,帶來人民的災難。而川普相反,川普表面上是驅逐非法移民,實則是讓非法移民可以回家,去建立他們真正的樂土。 可見,戰爭看似壞事,可是為正義而戰,卻能帶來完全不同的意義。這也可以讓人想到,當年美國獨立戰爭,華盛頓為何要帶領英國移民們,為守護價值而戰。想必,不是為了他人,而是為了自己的生命信念吧! 川普選在川習會前攻擊伊朗,是因為川普太了解習近平了。習近平總是大外宣說其取得了重大勝利。然而,這種勝利,不過是嘴上吹牛。 對比之下,川普可是不呼嚨,實打實地告訴習近平,不要想動台灣。否則下一次,被殲滅的可是你呀!川普讓美國再次偉大,習近平的下場可會跟伊朗哈米尼無異。   作者:黃宗玄

盧比歐所謂的「鬆綁蔣介石」

美國國務卿盧比歐(Marco Rubio)對中東局勢冷不防拋出一句「Unleash Chiang」(鬆綁蔣介石)。台灣輿論第一時間的反應多半是驚訝和困惑。許多人將這句話翻譯成「派蔣介石上場」。在國際政治的語境裡,這絕對不是一個穿越時空的笑話,而是充滿火藥味的鷹派暗語。 盧比歐這句潛台詞,要回到 1953 年。當年甫上任的艾森豪總統發表國情咨文,正式取消了杜魯門政府在 1950 年韓戰爆發後宣稱的「台海中立化」政策。 杜魯門時代,美國第七艦隊巡弋台海的目標是雙向的。既要防範中共武力犯台,更要死死按住困守台灣、一心想「反攻大陸」的蔣介石。對當時的華府而言,如果不限制蔣介石,美國很可能被拖進與共產中國的全面戰爭。 艾森豪的「鬆綁」,當年被右翼人士戲稱為「Unleash Chiang」。這個詞彙在英文語境中具有強烈的動態感:”Unleash” 原意是指解開獵犬的項圈。當你握著繩子時,你是這隻猛犬的主人,你決定牠何時狂吠、何時進攻。艾森豪宣示取消限制,他並非真的打算讓蔣介石一路打回南京,而是在玩心理戰。他要讓北京與平壤意識到,如果不盡快在韓戰停火協議上簽字,美國將不再煞車,而是會放手讓蔣介石在中國東南沿海開闢第二戰場。 歷史證明,這一招「極限施壓」確實奏效。五個月後,板門店停戰協定簽署。這就是「鬆綁蔣介石」在冷戰戰略學上的真實含義:解除對盟友的束縛,達到恐嚇敵人的政治目的。 誰是 2026 年的蔣介石?   盧比歐在 70 多年後的今天重提這句話,他指的對象顯然是當前中東局勢中最凶猛的雄獅——以色列。 長期以來,華府與耶路撒冷的關係始終處於「既支持又限制」的張力當中。美國提供最先進的武器,但在關鍵時刻,總是透過外交與行政手段限制以色列對伊朗核設施或軍事核心進行毀滅性打擊。對白宮而言,中東的穩定大於一切;但對川普、盧比歐這類鷹派人物來說,這種「束縛盟友」的政策,反而讓伊朗這類對手看破手腳,進而肆無忌憚。 盧比歐口中的「Unleash」,是在向德黑蘭發出最後通牒,美國準備鬆開那條握了幾十年的項圈。如果伊朗不停止代理人戰爭或核武擴張,美國將不再要求以色列「保持克制」,是準備讓這頭中東雄獅直接衝向目標。 除此之外,這句話也隱含更深層的戰略。當年蔣介石代表著「等待反攻的合法政權」,顯然,華府準備全面扶植伊朗境內的流亡勢力或反對派武裝,波斯的巴列維王儲、庫德族勢力都是同時並進選項之一。 國際政治的現實一面   直視 Unleash這個詞,在美式英文中幾乎是狗狗專用詞。生動勾勒出大國與小國之間的從屬關係,美國是握著繩子的主人,而盟友則是隨時準備衝出去的利齒。這種論調或許會讓台灣社會感到不快、感到被物化,但這就是國際政治的現實。對華府而言,盟友的價值取決於具備多少「威懾敵人的力量和決心」,以及這股力量是否能被「精確操縱和鬆綁」。 回看台灣,如果當年羅斯福沒有堅持由中華民國接收台灣,或許台灣今天走的是聯合國託管的道路。過去 70 年來,從杜勒斯到今日的盧比歐,這些美國國務卿對台灣的友好,往往是建立在將台灣視為「防堵共產勢力第一線」的戰略基石上。 盧比歐引用這句冷戰名言,反映了美國政治新保守主義與務實鷹派的全面回歸。他們厭倦漫長的談判與模糊的承諾,追求不留餘地的極限施壓和對抗模式,這也意味著區域戰爭的門檻正在降低。 回來印太戰略的局勢發展,美國顯然希望由日本擔任區域的領導者,而高市早苗也心領神會。對台灣而言,我們擁有地理位置、高科技產業、民主政治體制的三重優勢,在印太區域中的角色,顯然只會日益重要。面對中國的侵略威脅,和平靠實力,實力才能換得和平,台灣這隻獵犬,是該開始好好磨利尖牙了。 作者:江諺行

Recent Posts

黃國昌被告與新北市長藍白合提名爭議:司法風險、政治獻金灰區與在野整合的三重壓力

黃國昌被告與新北市長藍白合提名爭議:司法風險、政治獻金灰區與在野整合的三重壓力

民眾黨徵召黃國昌參選2026新北市長後,「藍白合」原本被視為在野整合的關鍵試驗,但近期輿論焦點同時被兩條線拉扯:一是黃國昌因京華城案相關質詢內容遭控涉及偽造偵訊錄音檔而被北檢傳喚說明;二是他卸任立委後以直播收受「抖內」被內政部點名不符未來候選人合法政治獻金管道,讓選戰從政見競逐轉向「合法性與正當性」的壓力測試。 [...]

More Info
民眾黨不分區立委李貞秀戶籍爭議:制度漏洞如何補上,下一步政策該怎麼做

民眾黨不分區立委李貞秀戶籍爭議:制度漏洞如何補上,下一步政策該怎麼做

李貞秀的戶籍爭議之所以擴大,不在於單一個案的政治攻防,而在於「候選人資格審查」與「戶籍/國籍文件補正」之間長期存在的制度落差。行政院與內政部在說法上已點出關鍵:李貞秀1999年定居設籍,但直到2025年3月才向移民署繳交經海基會驗證的註銷中國戶籍公證書;而陸委會也曾表示,李在登記參選時具備「雙重戶籍」疑慮,牽動兩岸條例的參選資格判斷。 [...]

More Info
川普選在川習會前攻擊伊朗,意在警告習近平!

川普選在川習會前攻擊伊朗,意在警告習近平!

川普的世紀之怒,狙殺了伊朗領導人哈米尼,以及諸多伊朗高官跟接班人。這個行動,其實在意料之中,可直接擊斃,又令人感到震驚。 而最震驚的,莫過於習近平。因為,川習會,才預告正要展開,卻突然給出下馬威。可見,川普要說,不要懷疑我,對抗威權政府的意志。 伊朗的獨裁者,哈米尼已經統治伊朗近37年。這樣的高壓治理,引發了伊朗民眾上街,而伊朗粗暴的對抗陳抗,已經屠殺了數十萬百姓。 [...]

More Info
盧比歐所謂的「鬆綁蔣介石」

盧比歐所謂的「鬆綁蔣介石」

美國國務卿盧比歐(Marco Rubio)對中東局勢冷不防拋出一句「Unleash Chiang」(鬆綁蔣介石)。台灣輿論第一時間的反應多半是驚訝和困惑。許多人將這句話翻譯成「派蔣介石上場」。在國際政治的語境裡,這絕對不是一個穿越時空的笑話,而是充滿火藥味的鷹派暗語。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way