社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

少年殺人事件     :本文於2014年5月30日曾發表於本刊

對於一個事件的稱呼,影響所有經歷這件事情的人的共同記憶。 為了避免兇手的名字流傳造成後人的追隨或是模仿,我們不會在西方主流媒體看到用人名作為事件的名稱。『德州殺人狂』不會被叫做『艾德蓋恩殺人事件』,『奧克拉荷馬爆炸案』不會被叫做『麥克維事件』,『科倫拜校園殺人事件』不會被叫做『哈里斯/克來伯德殺人事件』,『911事件』不會叫做『賓拉登殺人事件』。甚至對任何有爭議的事件都避免“造名運動”。所以『危機解密』不會被稱為『史諾登事件』。 台灣媒體在對事件的命名上需要再被教育,對於一個事件的稱呼會影響社會對這個事件的共同記憶,應該禁止做任何沒有意義的擴大連結。要避免造神運動第一要務就是要避免直呼人名。在那個台灣籠罩在白色恐怖的年代裡,國民黨政府就是用這樣的手法來防止叛亂,他讓台灣人民記不住這二十萬人的名字,因為他知道如果人們記住這個名字便會產生同情。 美國習慣將因被害人或發起人來作為反案的名稱,性暴力犯罪前科者資料公佈以被害人的名字命名『梅根法案』,反壟斷法以發起人的名字命名『休曼法』。 我們不是應該學著忘記,而是該選擇記憶的方式。如此一來我們才能走出傷痛,痛定思痛,不再讓悲劇重演。 作者 :林瓊媛

無差別暴力與網路狂潮:2025台北捷運無差別攻擊事件社會與政策反思

           近日發生於台北車站及捷運中山站周邊的暴力攻擊事件,引發社會高度關注。該事件造成多名民眾傷亡,不僅衝擊公共安全,也在短時間內引發治安及輿論震盪。對於此類事件,若僅停留於情緒反應或單一責任歸因,恐難以回應社會真正的需求;相對地,從公共政策與社會科學角度出發,冷靜檢視事件背景、社會條件與制度面向,更有助於未來的預防與治理。             所謂「無差別暴力事件」通常並非單一因素所致,而是多重結構性條件交互作用的結果。相關研究指出,此類行為往往與個人心理狀態、長期社會支持不足、以及對現實環境的挫折感累積有關。尤其在高度都市化的社會中,人口密集、生活節奏快速、社會連結薄弱,使得部分邊緣個體更容易陷入孤立狀態。值得注意的是,無差別攻擊並不等同於隨機或毫無脈絡的行為。許多案例顯示,行為人往往在事前已出現壓力訊號,例如長期失業、家庭關係斷裂、心理健康失衡,卻未被及時辨識或介入;故反映的並非單一個體的問題,而是社會安全網在早期預警與支持層面的不足。             捷運系統與大型商業區是現代城市中最具代表性的公共空間,其功能在於促進流動、交流與便利。然而,當暴力事件發生於此類場域,對社會心理的衝擊遠大於事件本身的發生頻率。民眾對日常通勤與公共活動的安全感,會因此產生動搖。從治理角度來看,公共安全不應僅依賴事後的警力反應,而需納入預防性思維。例如,透過更完善的現場觀察機制、異常行為通報流程、以及跨單位即時協調,提升早期介入能力。              事件發生後,網路平台迅速湧現大量討論,其中既有對受害者的關懷,也伴隨情緒化指責與標籤化言論。部分言論嘗試以政治立場、特定群體代稱或既有社會對立框架來解釋事件,例如互相指稱兇嫌為「青鳥」或「小草」,蓋缺乏事實基礎,反而模糊問題本質,突現台灣社會逐漸走向極端政治化與網路對立走向現實生活的傾向。社會心理學指出,在高度不確定與恐懼的情境下,人們傾向尋找簡化的解釋與替罪羊,以降低內在焦慮。然而,這類「獵巫式」反應容易導致社會撕裂,使公共討論從如何預防悲劇,轉變為彼此指責。長期而言,這不利於民主社會中理性對話與政策形成。是故,媒體的角色格外關鍵。專業新聞報導應以查證、脈絡與公共利益為核心,避免過度聚焦於嫌疑人個人細節或未經證實的動機推測。過度渲染或即時追逐點擊,可能在無意間放大恐慌,甚至造成模仿效應。同時,數位平台亦需承擔相應的社會責任,強化對仇恨言論、威脅訊息與不實資訊的管理機制,並與政府及民間組織合作,維護健康的公共討論空間。           […]

攝影大哥們!長刀、煙幕彈來了 !

台北的社會評論家,對前日北捷中山站無差別殺人事件有此觀察:事不干己、台灣人愛看熱鬧的「民格」不改。 社評家說:殺人事件過程中有多少「義勇的」攝影大哥們,奮不顧身搶鏡頭,長刀、煙幕彈來了,無所畏懼!——- 到底身旁張皇失措、哀號、或受傷倒地的同胞們,是不是需要幫助,救援?有多少敢挺身而出,誓為長城(這才是真正道德的長城、人性的長城 )! 說來悲慘,此次事件攝影大哥們多矣!唯有一位義士力抗惡徒,不幸身亡。比之於「鄭捷殺人事件」:有婦孺、老人以手中雨傘當武器、年輕力壯者,空手入白刃,壓制惡徒,實不可同日而語 !是不是我們的社會快敗落到只剩下義勇攝影記者,搶拍是唯一的道德考慮 ? 台北有些幸災樂禍的「喜怒客」( cynic )對此社會價值流向,毫無驚訝 !—— 網路流量,難道不是名成利就的捷徑?網紅如此 !政客如此 !路人甲乙為甚麽不能如此 ?最多也不過是「狗仔」之流,人家會這樣辯解:我們公然為之,又不偷偷摸摸,又沒有政治陰謀和企圖,—— 若自己的「獨家」有幸獲得媒體的青睞有加,特別看待,給點豐厚酬勞,天經地義 ! 教育家不時教育我們要「隨時準備」中,誰敢說「幸運」不會憑空而降,頓成網路紅人!所以一定要準備好手機,隨時搶拍。你知道子彈飛越川普總統臉頰,只差幾毫米的獨家攝影,賣了多少美國金元 ? 攝影大哥們!長刀、煙幕彈來了,也可能是你們竄紅的時刻到了,管它你身旁有多少「人性義理」要重視,要處理 !大哥們一定會說:找位見義勇為、出生入死的「白痴英雄」可以;可不要找我,我隨時在準備搶拍中,不要煩我 ! 作者: 徐吁

國民、民眾兩黨「打主人給狗看」!

俗諺「打狗看主人」,從來沒有聽說過、看過「打主人給狗看」! 是不是要類如「殺鷄警𤠣」,不得不然:因為這隻狗太頑劣、凶惡,有如獒犬或比特犬,咬住敵人的喉嚨不放 ,制敵於死!看來又不像,這隻溫馴的狗反而被眾惡犬圍攻,只會拚命爬上樹喘氣,好險!好險!幸而還有一棵孤零零的樹可以託依,暫時活命 ! 你我許多人一定好奇:愛犬被霸凌,那麼狗的主人呢?說來心酸,主人泥菩蕯渡河,自身難保。能保多久?就要看河邊的惡犬能聚集多少隻? 台北的知識達人不疾不徐、再三的強調:「民主是數人頭的」!你我小公民們大概沒有想過,世態炎涼,有朝一日,民主也可能要「數狗頭」! 情況甚至可能會變到你我連數都不需要數。政界的奇葩「鄭娘娘 」口大心快,不是預言 2028年以後台灣不用再大選了嗎?你們還再數甚麽馬的 2/3 !鄭娘娘𢤦得通關祕語,上達天聴!她有「蓋牌」的能耐 ! 所以,連大選很快都不用再選了,所謂「人民的主人」又算啥 ?何況是狗的主人! 今日當然不用再「打狗看主人」了!—— 誰是主人 ?趙孟可貴之,趙孟可賤之,國民、民眾兩黨拍板定案,說了算,誰就是誰?不用再多此「打狗」一擧!—— 「主人」你好膽莫走 !國民、民眾兩黨準備要打「主人」給眾狗頭看 ! 作者: 胡嚴

Recent Posts

少年殺人事件     :本文於2014年5月30日曾發表於本刊

對於一個事件的稱呼,影響所有經歷這件事情的人的共同記憶。 [...]

More Info
無差別暴力與網路狂潮:2025台北捷運無差別攻擊事件社會與政策反思

無差別暴力與網路狂潮:2025台北捷運無差別攻擊事件社會與政策反思

           近日發生於台北車站及捷運中山站周邊的暴力攻擊事件,引發社會高度關注。該事件造成多名民眾傷亡,不僅衝擊公共安全,也在短時間內引發治安及輿論震盪。對於此類事件,若僅停留於情緒反應或單一責任歸因,恐難以回應社會真正的需求;相對地,從公共政策與社會科學角度出發,冷靜檢視事件背景、社會條件與制度面向,更有助於未來的預防與治理。           [...]

More Info
攝影大哥們!長刀、煙幕彈來了 !

攝影大哥們!長刀、煙幕彈來了 !

台北的社會評論家,對前日北捷中山站無差別殺人事件有此觀察:事不干己、台灣人愛看熱鬧的「民格」不改。 社評家說:殺人事件過程中有多少「義勇的」攝影大哥們,奮不顧身搶鏡頭,長刀、煙幕彈來了,無所畏懼!——- 到底身旁張皇失措、哀號、或受傷倒地的同胞們,是不是需要幫助,救援?有多少敢挺身而出,誓為長城(這才是真正道德的長城、人性的長城 )! [...]

More Info
國民、民眾兩黨「打主人給狗看」!

國民、民眾兩黨「打主人給狗看」!

俗諺「打狗看主人」,從來沒有聽說過、看過「打主人給狗看」! 是不是要類如「殺鷄警𤠣」,不得不然:因為這隻狗太頑劣、凶惡,有如獒犬或比特犬,咬住敵人的喉嚨不放 ,制敵於死!看來又不像,這隻溫馴的狗反而被眾惡犬圍攻,只會拚命爬上樹喘氣,好險!好險!幸而還有一棵孤零零的樹可以託依,暫時活命 ! [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way