社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

所謂「文昌配」?

前幾天鄭麗文國民黨主席勝出,媒體馬上出現「文昌配」之說,囂囂然不可一世! 所謂「文昌配」:「文」當然指國民黨新科黨𣁽「鄭麗文」,「昌」者猜猜看是誰?不必奇怪,指的是「民眾黨」主席黃國昌。 果其不然,紅上加紅,怪不得趙少康中廣前董事長,先知先覺,選前已經大聲疾呼,要國民黨員注意「照妖鏡下,妖魔鬼怪,會現形的。」 不只趙董,台北的政治達人們,聽聞「文昌配」之說,啞然失笑,有這樣的配法,放話者以為這樣就可以導引風向 ?或是有人懷疑這是聲東擊西,轉移話題,把陷入泥沼的黃主席,搶救出來!如果認為靠此「奸巧」,就能得𢌥,未免太看不起台灣公民的「政治智慧」。 首先,達人們指出「文昌配」當然是2028年總統大選,鄭麗文為正,黃國昌為副?鄭麗文會選黃國昌為副首嗎 ?副首選擇的標準,是要副首需要有「互補性」:麗文、國昌兩人,「咆哮」的同質性太高。一加一還是等於一,無事自擾。達人們說,如果如此,倒不如「鄭麗文」選擇「鄭麗文」,內舉不避親,何況選擇自己當副手。 更重要的,鄭麗文可以躲開黃國昌養狗仔、跟監、偷拍、以及更嚴重的央廣駭客、掛五星旗,為國人所不恥的爭論。如果要選黃國昌,倒不如去選同黨的羅智強。人家是靠自己寫書,靠粉絲「斗内」,可不像國昌爺養那麼多狗仔、言偽而辯的所謂「第四權」的老手:作業龐大,呼風喚雨,所需大量資金,卻來源不明,全都是「志願役」的,你我相信嗎?不啟人疑竇才奇怪! 民眾黨的守則「公正、公開、透明」,我們現在要怎麼看?—— 原來,文字來了不是事實就跟著來?國昌爺民調的可信任度,現在一定很低,而且更多的事實,預期一定會再爆開來,「司法長城」的崩壞,為天下人所笑,庶幾乎! 台北的政治達人們再三強調,眼前國民黨最重大的課題是黨中央的鄭麗文和台中的大藩侯盧秀燕的關係會如何發展?選舉前,盧市長分別招待六位參選人聚餐、懇談,大有我不是國民黨各路勢力的「盟主」,誰會是?2028年捨我其誰! 選舉後,政治情勢丕變!—— 鄭麗文主席說:2028年選擧,( 總統侯選人)不會只有一位「明星」。可見鄭主席更上層樓的進取心。很快的「兩位女人的完美暴風雨」,百年難得一見,即將在國民黨內形成:雙方招兵買馬,楚河漢界,各為其主! 當然雙方陣營都會說,要下架民進黨團結為要,但是雙方都清楚民進黨眼前就是那種「死樣子」,失掉對「年青世代」吸引力,哪會有何做為?當然無足為慮! 爭取大位的最大「攔路虎」還是黨內同志。盧市長一定沒有想到,情勢大好之時,大位垂手可得之際,怎麼半路來過雄糾糾、氣昂昻的紅統娘子 ,她也要當「明星」!更要命的,人家後面還有位更大、沒有人敢得罪的主子!   作者: 胡嚴

北京戰略:對台統戰與稀土制衡

習近平在給鄭麗文的賀電中強調推進兩岸統一,這不僅是政治表態,也反映出北京在當前國際環境下試圖藉由「民族復興」與「台灣議題」凝聚內部共識、轉移外部壓力的策略。另一方面,大陸近期嚴格限制稀土出口,導致美國與其盟友強烈反彈,這兩個動作在戰略上其實是相互呼應、相互影響的。 首先,從政治層面看,北京對鄭麗文發出賀電、強調統一,是對台政策「軟硬並進」的一部分。賀電象徵「拉攏與分化」——透過對台灣部分政治人物釋出善意訊號,試圖塑造「統一是和平與繁榮的道路」的印象,同時削弱台灣社會內部對中國的警戒心。而此舉在國際上也起到「宣示主權」的效果,讓外界認知北京對台問題的「主導地位」不可挑戰。 其次,從經濟與地緣戰略角度分析,大陸限制稀土出口,其目的之一是作為反制美國科技封鎖與貿易制裁的籌碼。稀土是半導體、電動車與軍工產業的關鍵材料,中國掌握了全球約六成以上的生產與提煉能力。當北京限制稀土出口,美國的高科技與軍工鏈將面臨原料緊縮壓力。這種「供應鏈戰略壓力」會強化中國的談判籌碼,也讓北京更有底氣在政治上推進統一議題。 第三,這兩者的聯動效應在於:當中國以經濟壓力對外對抗美國時,它同時強化了內部民族主義敘事,將「推進統一」包裝成「抵制外來干涉、完成民族復興」的一部分。換句話說,外部的經濟對抗(如稀土出口限制)可用來激發民眾的民族情緒,進而鞏固對台政策的內部支持。 不過,這樣的策略也帶來風險。美國與日本、澳洲、歐盟等國正在加速建立「稀土供應鏈去中化」,若長期封鎖出口,中國的稀土產業可能遭遇市場萎縮與外資撤離。同時,若中國在政治上對台施壓過強,可能導致美國與盟友在安全領域更緊密介入台灣問題,反而使兩岸關係更加緊張。 總體而言,習近平對鄭麗文的賀電與稀土出口禁令看似分屬不同領域,但實際上構成了北京「政治統戰+經濟戰略」的雙重布局:在內部鞏固民族主義與政治正當性,在外部以經濟與供應鏈手段對抗西方壓力。兩者相互作用,可能在短期內提升中國的戰略主動權,但長期來看,也可能加劇地緣政治對立與經濟風險,對兩岸與國際局勢都帶來更大的不確定性。   作者:蔡文邦  

溫水煮蛙的安魂曲:當抖音成為北京的特洛伊木馬

加拿大廣播公司(CBC)的一篇報導,像一支刺耳的警笛,劃破了台灣社會看似平靜的日常。報導中,年輕學子對中國威脅的輕描淡寫,令人心驚膽顫。「我不認為這是我們需要擔心的事情」、「即便被中國統治,我也不擔心言論自由」,這些話語應被視為一場大規模認知作戰的顯著戰果。這是一場沒有硝煙的戰爭,戰場就在你我手中的螢幕上,而名為「抖音(TikTok)」的特洛伊木馬,已經堂而皇之地進駐了我們的城門。 首先,CBC的報導揭露了TikTok使用者親中比例遠高於非使用者,且更傾向將兩岸緊張的責任歸咎於台灣政府。抖音的演算法,本身就是一個精密的意識形態篩選器。它不會直接灌輸「統一有好處」的硬性宣傳,而是透過海量的短影音,潛移默化地改造使用者的世界觀。 這些內容可能是一段中國城市的繁華夜景、一個溫馨的兩岸家庭故事或是一位台灣網紅在中國的「驚奇」體驗。它們共同編織了一個濾鏡下的美麗新世界,呈現出中國很進步、台灣很落後;中國很友善、台灣政府在挑釁的現象。在這種「溫水煮青蛙」的環境中,威脅被常態化,警戒心被娛樂性麻痺,年輕人不再相信北京會構成危險。 其次,對自由的無知,是對歷史的背叛。受訪的女大生竟說著,「香港、澳門人們還是有言論自由」。認知作戰成功地抹去了香港《國安法》實施後,《蘋果日報》被迫關閉、民主派人士被大規模逮捕、公民社會被瓦解的斑斑血淚。它讓「東方之珠」的殞落,在部分台灣年輕人眼中,變成了一場無關痛癢的政權交接。當一個人連近在咫尺的悲劇都能視而不見,我們如何能期待他去理解自由的脆弱與珍貴。 最後,抖音的洗腦是在為台灣社會進行「精神上的軟化工程」,那麼國內部分政治勢力的言行則構成了「政治上的裡應外合」。當中國毫不掩飾地全面介選中國國民黨主席選舉時,我們看到的,是北京已在台灣內部找到政治代理人。 當選的國民黨主席鄭麗文要讓台灣人自豪地說自己是中國人,更多裡應外合的政客會將政府的備戰說成挑釁,國防的強化是浪費金錢,與民主盟友交往是「倚美謀獨」。他們會將台灣政府維護主權的努力,扭曲為造成兩岸緊張的根源,從內部瓦解台灣人民的抵抗意志。 台灣人,你我真的不擔憂嗎?青蛙在水溫逐漸升高的鍋中,會因安逸而失去警覺,最終被活活煮熟。中國全面介入台灣的警報已經響起,台灣不能再做那隻無動於衷的青蛙。我們必須立即跳出這鍋溫水,直面眼前的滾燙現實。因為,當安魂曲響起時,再想掙扎,就為時已晚了。 作者:秦靖

政委季連成的「軍文交流」作用

自從9月23日花蓮馬太鞍溪堰塞湖造成的突發災難,除了民間自願前往救災的成千上萬「鏟子超人」之外,在官方的救災行動中,有一位中央政府官員受到外界矚目——從陸軍中將退役轉任行政院政務委員的季連成,出任花蓮救災的總協調官。 面對災區現場的狀況不明、中央與地方政府的協調困難、大批救災人員與物資等待分配等混亂狀況,季連成展現出霸氣十足的軍人作風,採取「指揮明確、任務分區」的方式,即時協調中央與地方政府。他的決策風格具體直接,縮短官僚組織逐層請示的時間,讓救災行動更聚焦,也使他成為媒體焦點。 從「軍文交流」的角度來看,這不只是季連成的個人作風,而是軍方與文官部門兩種組織文化的融合。軍隊講求紀律與效率,文官重視法制與程序,雙方如果互補,就能在緊急時刻發揮又快又穩的最大效果。 從長期的眼光來看,台灣的軍文體系相對分立,軍方多被視為國防安全的執行單位,文官則負責政府部門的決策與管理。這是因為台灣基於過去威權統治的歷史經驗,避免軍人干政成為民主化以後的社會共識。但在國防二法實行後,已經建立文人領軍的法律架構,軍頭擴權的亂象難以再現,甚至在民意的強勢監督之下,軍人成為相對弱勢的群體。然而除了2000年首次政黨輪替的唐飛內閣等特例,民選政府習慣上避免以軍人出任國防部、退輔會、海巡署等相關部會以外的政務官。 但在當代的公共治理中,這種區隔越來越難應對跨領域危機。例如極端氣候、網路攻擊、能源安全等挑戰,都需要「文武合治」的整合能力。政府平時透過現有的相關會報與演習機制,增加跨部門的對話與協調機會,讓雙方熟悉彼此的運作邏輯。 卓榮泰內閣當初找來季連成出任政務委員,負責後備戰力組建運用、全民防衛動員作戰、復合型災害防救等業務。這個政治任命如今不會有軍人干政的非議,反而能促進政府內部的軍文交流,增加軍事與非軍事部門的橫向聯繫,目的是強化社會韌性。避免在戰時或重大災害發生時,因為各部門的本位主義,削弱互相協調合作的能力。 政務委員季連成出任花蓮救災的總協調官,展現跨部門的協調能力,不只提升救援效率,他的出色表現贏得民意的支持,更是「軍文交流」的具體實踐。這個用人案例顯示,優秀將領脫下軍裝之後,進入文官體系,仍能展現強化社會韌性所需的領導力。 作者:尚智

Recent Posts

所謂「文昌配」?

所謂「文昌配」?

前幾天鄭麗文國民黨主席勝出,媒體馬上出現「文昌配」之說,囂囂然不可一世! 所謂「文昌配」:「文」當然指國民黨新科黨𣁽「鄭麗文」,「昌」者猜猜看是誰?不必奇怪,指的是「民眾黨」主席黃國昌。 果其不然,紅上加紅,怪不得趙少康中廣前董事長,先知先覺,選前已經大聲疾呼,要國民黨員注意「照妖鏡下,妖魔鬼怪,會現形的。」 [...]

More Info
北京戰略:對台統戰與稀土制衡

北京戰略:對台統戰與稀土制衡

習近平在給鄭麗文的賀電中強調推進兩岸統一,這不僅是政治表態,也反映出北京在當前國際環境下試圖藉由「民族復興」與「台灣議題」凝聚內部共識、轉移外部壓力的策略。另一方面,大陸近期嚴格限制稀土出口,導致美國與其盟友強烈反彈,這兩個動作在戰略上其實是相互呼應、相互影響的。 [...]

More Info
溫水煮蛙的安魂曲:當抖音成為北京的特洛伊木馬

溫水煮蛙的安魂曲:當抖音成為北京的特洛伊木馬

加拿大廣播公司(CBC)的一篇報導,像一支刺耳的警笛,劃破了台灣社會看似平靜的日常。報導中,年輕學子對中國威脅的輕描淡寫,令人心驚膽顫。「我不認為這是我們需要擔心的事情」、「即便被中國統治,我也不擔心言論自由」,這些話語應被視為一場大規模認知作戰的顯著戰果。這是一場沒有硝煙的戰爭,戰場就在你我手中的螢幕上,而名為「抖音(TikTok)」的特洛伊木馬,已經堂而皇之地進駐了我們的城門。 [...]

More Info
政委季連成的「軍文交流」作用

政委季連成的「軍文交流」作用

自從9月23日花蓮馬太鞍溪堰塞湖造成的突發災難,除了民間自願前往救災的成千上萬「鏟子超人」之外,在官方的救災行動中,有一位中央政府官員受到外界矚目——從陸軍中將退役轉任行政院政務委員的季連成,出任花蓮救災的總協調官。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way