社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

四月川習會前的亮牌與極限施壓

今年開始,美國展現冷戰結束以來最強勢的單邊軍事行動。一月跨國抓捕委內瑞拉總統馬杜洛,二月協助墨西哥政府對毒梟集團 CJNG 進行精準斬首,再到2月28日聯合以色列大規模空襲伊朗伊斯蘭政軍高層和最高領袖哈梅內伊。 這三起重大事件並非孤立的區域衝突,而是四月川習會前,美國迅速解決後院、邊境與中東的長期戰略痛點。對北京而言,全球戰略支點接連被拔除,中國將面臨卸下多線作戰包袱、且具備極高武力威懾信用的美國。 委內瑞拉行動,重申門羅主義與斬斷紅色資本   一月馬杜洛的落網,是美國新門羅主義的展現。長期以來,委內瑞拉作為反美陣營在南美洲的橋頭堡,不僅為俄羅斯提供了潛在的軍事立足點,也成為中國資本深度滲透西半球的門戶。美國透過特種作戰直接進行政權更迭,徹底清除西半球的地緣政治雜音,更實質控制了全球最大的已探明石油儲量。在後續中東爆發動盪的局勢下,委內瑞拉的能源控制權為美國提供巨大的戰略緩衝。   尤其,對中國造成直接的經濟與外交重創。中國是委內瑞拉最大債權國,雙方維繫高達數百億美元的「石油換貸款」協議。隨著馬杜洛政權覆滅,中國的鉅額投資面臨極高違約或被迫重組風險。更深遠的影響在於「殺雞儆猴」的政治效應。美國展現出的極限介入手段,將迫使巴西、阿根廷等拉美國家重新評估與中國深化一帶一路,或引入中資基礎建設的國安風險,大幅壓縮中國在拉丁美洲的戰略擴張空間。 墨西哥掃毒:芬太尼供應鏈的軍事化溯源   二月針對墨西哥CJNG販毒集團的聯合掃蕩,表面是為解決美國國內致命的芬太尼公衛危機,實則將非傳統安全威脅提升至國家安全與軍事打擊。斬首毒梟首領,美國政府向國內選民展現了強硬維護邊境與社會安全的執行力,有效凝聚了國內政治共識,減少了白宮在推進大國博弈時的國內掣肘。   美國長期指控中國的化學企業是墨西哥販毒集團製造芬太尼前驅化學品的核心源頭。成功癱瘓墨西哥中轉站後,美國的情報與執法焦點必然會沿著供應鏈向上溯源至中國本土。這為美國在四月的經濟與貿易談判中提供了全新的施壓籌碼。華府極可能以此為由,對中國相關化工產業鏈、物流企業甚至金融機構實施極具破壞性的二級制裁。這也暗示了美國未來在處理與中國的灰色地帶貿易摩擦,將不惜繞過傳統框架,直接動用國安工具進行極限施壓。 伊朗斬首行動:瓦解抵抗軸心與極限震懾   美以聯軍精準擊斃哈梅內伊與伊斯蘭革命衛隊(IRGC)高層,直接摧毀長期在中東作亂的「抵抗軸心」(真主黨、胡塞武裝等)的大腦與資金樞紐。不僅一勞永逸解除了伊朗的核武擴散威脅,也大幅降低以色列的生存壓力。更重要的是,確立了美國在中東絕對的單極霸權,確保區域內的石油定價權與航道安全完全掌握在華府手中。 伊朗高層的覆滅,對中國的地緣戰略造成了災難性的破壞。中國高度依賴中東的原油進口,且是伊朗受制裁石油的最大買家。波斯灣的戰火與伊朗的權力真空,直接威脅到中國的能源安全。美國透過此次空襲證明,美軍具備隨時切斷或干擾中國能源補給線的能力。 尤其,伊朗是中國在歐亞大陸抗衡美國影響力的最重要戰略夥伴。失去伊朗,中國連結中東與歐洲的一帶一路陸權戰略佈局將出現難以彌補的缺口。 美國精準掌握敵對國家最高領導人的行蹤,並敢於突破紅線實施斬首打擊,也向北京中南海和莫斯科克姆林宮展現拳頭,在絕對的軍事技術差距與情報優勢面前,任何挑戰美國核心利益都將面臨無法承受的代價。這迫使中國重新計算在台灣海峽或南海軍事冒險的成本與風險。 四月川習會的底牌與格局   這三個月的密集行動,美國以外科手術式的打擊清理周邊戰場,解決了南美的能源與地緣干擾、北美的邊境安全與毒品危機,以及中東的核威脅與代理人戰爭。 屆時四月川習會登場,美方談判代表將挾帶軍事威信與剛重塑的全球同盟體系,將焦點集中於印太地區。反觀中國,不僅失去多個重要的戰略支點,能源供應鏈與海外資產也暴露在極大風險。可以預見的是,屆時川普將不再尋求妥協性的共識,而是針對台灣問題、科技禁運與不公平貿易等核心議題,對中國進行毫無退讓的極限施壓。   作者:江諺行

美、以軍事行動背後的戰略意涵

2/28當天美軍、以色列國防軍針對伊朗發動「史詩怒火行動」(Operation Epic Fury)空襲行動,美軍派遣性能強大的福特號(USS Gerald R. Ford Strike Group)與林肯號(Abraham Lincoln Carrier Strike Group)航艦打擊群給予南北夾擊,同時又從本土、駐歐派遣F-35A、F-15E、F-16與F-22戰機駐防約旦穆瓦法克薩爾蒂基地,連同許多空中加油機、空中預警機進行偕同作戰,一場由美以兩軍發動的外科手術式打擊,至今美以兩軍獲得絕對性的勝利,此次的軍事行動背後的戰略意涵不容忽視。 首先,伊朗長期以來為中東地區產油國,在地緣政治上,掌握一定程度的影響力,然而因長期和以色列爭奪中東地區霸主,外加精神領袖哈米尼(Ali Khamenei,已陣亡)刻意支持恐怖份子對抗以色列、美國,如今美以兩軍成功的軍事行動,至少能為中東地區爭取到更多的和平時光,也為伊朗國內反對派爭取到更多喘息(不被政治迫害)空間。 第二,伊朗身為中東地區的能源、軍事大國,長期以來與中共、俄羅斯關係密切,無論是中共持續倡議的「一帶一路政策」,或伊朗與俄羅斯之間的軍事科技合作,實際上對以美國為首的西方國家構成實質威脅,特別是德黑蘭政府長期主張研發核彈的計畫,對於美國在中東地區的「第五艦隊」(Fifth Fleet)造成實質威脅,也對親美國家以色列構成生存上的危害。在諸多因素下,外加伊朗政府持續堅持研發戰術彈道飛彈,美軍、以軍在精確掌握情報的狀態下,遂針對伊朗發動軍事行動,美、以兩軍目前獲得空前的勝利。 第三,中共在中東外交政策上,長期以來伊朗是北京在經貿、能源、地緣與軍事等領域重要的合作對象,如今在美中兩強已進入戰略對抗、競爭階段,美國必須將所有位居地緣重要的親中共國家率先剷除,才有能力專心於「印太地區」(Indo-Pacific)與中共抗衡。今年元月被美軍活捉的委內瑞拉總統馬杜洛,同樣也是中共在南美地區的心腹,長期以來與北京有著密切的地緣合作事項,白宮為在區域(南美、中東)獲得實質上的控制,元月針對委內瑞拉發動軍事攻擊,如今在二月底展開攻擊伊朗,背後的戰略意涵充斥著美中競爭與對抗的色彩。   整體來論,美以兩軍成功的軍事行動,固然充滿許多豐富的戰術色彩,但若進一步擴大至戰略層面,美國的作法在於,持續透過軍事行動將親中共的政權/領導人活捉、擊斃,並且派遣強大的海空部隊於衝突點,再以優勢兵力將其擊敗,以確保所有會分散、威脅美國的國家沒有能力威脅大美霸權,從戰略意涵上來說,目前美中的對抗/競爭,快速上升至透過軍事行動將親中共的國家領導人予以剷除,本文認為,用以其視角解釋美以兩軍對伊朗的軍事行動更能確保其準確度。 作者:宋磊

[轉] 伊朗領袖被殺死,人民竟然在慶祝?

 ​想像一個畫面。如果你今天打開電視,看到新聞快訊,統治國家快40年的我國領袖被其他國家炸死,你應該會悲痛萬分、憤慨激昂吧? ​ 但當美國與以色列聯手空襲伊朗,擊斃最高領袖哈米尼,伊朗民眾竟全衝到街上開心跳舞、狂按喇叭、放煙火慶祝,在火光中高喊著自由。 ​ 這背後到底累積了多少絕望,才會讓炸彈的爆炸聲聽起來像慶典的樂音? ​ ▋為什麼美國與以色列要攻打伊朗? ​ 你可以把這件事想像成,社區裡有一個常常惹事、甚至正在偷偷製作危險爆裂物的惡鄰居。 ​ 美國和以色列決定發動這場軍事行動,主要有3個原因。 ​ 第一, 伊朗正在加速製造核子武器。 ​ 美國情報單位透過精密監測發現,伊朗已經囤積大量的高濃縮鈾,在技術上,隨時都有可能製造出毀滅性的核武。 ​ 一旦讓這個極端政權擁有核彈,整個世界都會陷入無法控制的災難。 ​ 第二, 伊朗擁有多達數千枚飛彈。 ​ 美國掌握的資訊顯示,伊朗正準備利用這些飛彈,發動先發制人的大規模攻擊。 ​ 為減少士兵與盟邦可能面臨的慘重傷亡,美方決定在對方發射前,先摧毀對方的指揮中心。 ​ 第三, 伊朗政府長期花費數億美元資助海外的武裝組織。 ​伊朗花了天文數字,要這些代理組織搞破壞、發動恐怖活動,美、以希望徹底摧毀這個恐怖網絡。 ​ […]

美伊戰爭如何影響台股?從油價、航運、通膨到AI供應鏈的四層傳導

美伊戰爭對台股的影響,不是單一路徑,而是透過油價、風險情緒、產業輪動與科技基本面四條線同時作用。路透指出,美以對伊朗動武後,油價一度急升,布蘭特原油衝上每桶80美元附近,荷姆茲海峽航運受阻風險升高,全球股市普遍承壓,亞洲股市同步走弱。 對台股最直接的第一層衝擊,是油價上漲帶來的成本與通膨壓力。台灣高度仰賴進口能源,若中東衝突持續、油價向90到100美元靠攏,航空、塑化、用電成本高的產業會先承壓,市場也會擔心企業毛利與消費力被侵蝕。亞洲航空股已因戰爭與油價上升明顯下跌,這反映的正是成本衝擊先於景氣反應。 第二層影響是資金避險與題材輪動。戰事升高時,資金通常先流向黃金、公債、能源與部分航運題材,成長股與高本益比族群短線容易被調節。路透報導中已看到黃金上漲、美元轉強與亞洲股市回落,代表風險資產先被降低部位。 但台股不會因此全面轉空,因為第三層力量來自台灣AI與半導體供應鏈的基本面支撐。路透近期連續報導,台灣2025年出口創新高、2026年成長預測被上修,核心原因都是AI需求強勁、晶片與科技出口續強。也就是說,只要中東戰爭沒有演變成長期全球衰退,台股的大主軸仍是AI,不會只因單一地緣衝突就被完全打翻。 因此,美伊戰爭對台股的真正影響,較像是短線震盪加劇、族群重新排序,而不是立即改變多頭結構。接下來要觀察的關鍵只有兩個:第一,油價是否高檔久留;第二,荷姆茲海峽與中東航運是否持續受阻。若答案是「會」,台股壓力就會從情緒面轉向基本面;若只是短期戰爭溢價,台股仍可能回到AI與半導體主線。 作者:那麼

Recent Posts

四月川習會前的亮牌與極限施壓

四月川習會前的亮牌與極限施壓

今年開始,美國展現冷戰結束以來最強勢的單邊軍事行動。一月跨國抓捕委內瑞拉總統馬杜洛,二月協助墨西哥政府對毒梟集團 CJNG 進行精準斬首,再到2月28日聯合以色列大規模空襲伊朗伊斯蘭政軍高層和最高領袖哈梅內伊。 [...]

More Info
美、以軍事行動背後的戰略意涵

美、以軍事行動背後的戰略意涵

2/28當天美軍、以色列國防軍針對伊朗發動「史詩怒火行動」(Operation Epic Fury)空襲行動,美軍派遣性能強大的福特號(USS Gerald R. Ford Strike Group)與林肯號(Abraham Lincoln Carrier Strike [...]

More Info
[轉] 伊朗領袖被殺死,人民竟然在慶祝?

[轉] 伊朗領袖被殺死,人民竟然在慶祝?

 ​想像一個畫面。如果你今天打開電視,看到新聞快訊,統治國家快40年的我國領袖被其他國家炸死,你應該會悲痛萬分、憤慨激昂吧? ​ 但當美國與以色列聯手空襲伊朗,擊斃最高領袖哈米尼,伊朗民眾竟全衝到街上開心跳舞、狂按喇叭、放煙火慶祝,在火光中高喊著自由。 ​ 這背後到底累積了多少絕望,才會讓炸彈的爆炸聲聽起來像慶典的樂音? ​ ▋為什麼美國與以色列要攻打伊朗? ​ [...]

More Info
美伊戰爭如何影響台股?從油價、航運、通膨到AI供應鏈的四層傳導

美伊戰爭如何影響台股?從油價、航運、通膨到AI供應鏈的四層傳導

美伊戰爭對台股的影響,不是單一路徑,而是透過油價、風險情緒、產業輪動與科技基本面四條線同時作用。路透指出,美以對伊朗動武後,油價一度急升,布蘭特原油衝上每桶80美元附近,荷姆茲海峽航運受阻風險升高,全球股市普遍承壓,亞洲股市同步走弱。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way