社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

國民、民眾兩黨「打主人給狗看」!

俗諺「打狗看主人」,從來沒有聽說過、看過「打主人給狗看」! 是不是要類如「殺鷄警𤠣」,不得不然:因為這隻狗太頑劣、凶惡,有如獒犬或比特犬,咬住敵人的喉嚨不放 ,制敵於死!看來又不像,這隻溫馴的狗反而被眾惡犬圍攻,只會拚命爬上樹喘氣,好險!好險!幸而還有一棵孤零零的樹可以託依,暫時活命 ! 你我許多人一定好奇:愛犬被霸凌,那麼狗的主人呢?說來心酸,主人泥菩蕯渡河,自身難保。能保多久?就要看河邊的惡犬能聚集多少隻? 台北的知識達人不疾不徐、再三的強調:「民主是數人頭的」!你我小公民們大概沒有想過,世態炎涼,有朝一日,民主也可能要「數狗頭」! 情況甚至可能會變到你我連數都不需要數。政界的奇葩「鄭娘娘 」口大心快,不是預言 2028年以後台灣不用再大選了嗎?你們還再數甚麽馬的 2/3 !鄭娘娘𢤦得通關祕語,上達天聴!她有「蓋牌」的能耐 ! 所以,連大選很快都不用再選了,所謂「人民的主人」又算啥 ?何況是狗的主人! 今日當然不用再「打狗看主人」了!—— 誰是主人 ?趙孟可貴之,趙孟可賤之,國民、民眾兩黨拍板定案,說了算,誰就是誰?不用再多此「打狗」一擧!—— 「主人」你好膽莫走 !國民、民眾兩黨準備要打「主人」給眾狗頭看 ! 作者: 胡嚴

如何強化台澎防衛作戰的能力?

現狀:中共不放棄武力威脅台灣 中共至今尚未放棄武力解決台海爭端,從實際面來看,解放軍常態化越過海峽中線、持續干擾我西南、東南防空識別區(ADIZ),如今配合中共海警船(類似我國海巡單位)以海上執法的名義侵擾我漁船的作業,種種的行徑均讓人感受到北京意圖改變台海現狀,以武力侵犯我國的意圖越來越明顯。   面對解放軍持續的強勢作為,我軍依然能根據自身能力,外加軍事採購調整、提升實力,茲分析如下: 增購、部署反艦飛彈 飛彈的研製向來是我中科院的強項,相關的裝備也大量的服役於海空軍。從海軍的角度來說,發展「以陸制海」的能力相當重要,相關的做法包括2020年向美方採購100套400枚「岸置魚叉反艦飛彈系統」,先由海軍海鋒大隊接裝,後續移至「濱海作戰指揮部」,預計部署在台灣東、西、南、北部,將與我國現役的雄風二型、雄風三型、雄風三型增程飛彈配合,形成一股強而有力的反艦飛彈網。 反艦飛彈網不但能為台灣提供以陸制海的能力,鄰國日本、菲律賓同樣也以相同模式,於各島嶼部署反艦飛彈,雖然我海軍在艦艇數量上遠遠少於中共海軍,但現代海軍船隻,面對大量海面的飽和攻擊時,其艦上的防空系統仍無法完全有效應付,因此我海軍的建軍作法不但務實,更能提升軍方制海作戰能力,也能大舉挫敗解放軍的登陸部隊。 持續強化空軍源頭打擊能力 傳統上,我空軍戰機是我國於戰時爭取空優的部隊,雖然空軍向美方採購的F-16V戰機尚未交貨,但已將舊型的F-16A/B戰機性能提升至F-16V戰機的水準,無論在制空作戰、對海打擊與對地轟炸我F-16V機群皆能和現役的幻象戰機、IDF戰機進行高中低空搭配進行反制作戰與空優的爭取。 然而,面對解放軍龐大的軍事基地與兵力部署,近年來我軍方也發展出具有源頭打擊能力飛彈。舉例而言,部署於空軍「防空暨飛彈指揮部」的雄二E巡弋飛彈是一款相當重要的彈種,該款飛彈是軍方以「雄風二型反艦飛彈」為基礎進行研發的巡弋飛彈,根據多方消息推論,包括美國CSIS智庫的資料顯示,雄二E飛彈的射程依據彈種有所區隔,A彈具有約500公里的射程,B彈具有約1000公里的射程,軍方為持續強化源頭打擊能力,增程型的「雄昇飛彈」其射程約達1200公里之遠,大幅提升空軍的源頭打擊能力。 提升陸軍源頭打擊能力 我國陸軍同樣肩負著保家衛國的職責,近年來美國政府也多次針對我陸軍的能力進行相關裝備的軍售,包括販售台灣相當重要的裝備:海馬斯火箭彈系統。 2020年美國政府正式批准出售我國29套海馬斯火箭彈系統,同時也採購84枚MGM-140陸軍戰術飛彈系統(ATACMS),以後者的射程來論,將達到約300公里的射程,若在本島發射,將能涵蓋福建省多數地點,大幅增進陸軍跨區打擊能力,也同時為我軍爭取更多的反制時間。 目前海馬斯火箭彈系統由陸軍58砲指部接裝,駐地為台中。根據12/18早上最新的新聞顯示,美國已正式同意出售我國最新的軍售案,包括再度增購第二批海馬斯火箭彈系統,具體內容為82輛火箭飛彈發射車、420枚陸軍戰術飛彈系統(ATACMS),未來將持續部署在北部的21砲指部、南部的43砲指部,此裝備未來將和國軍現有的雷霆兩千多管火箭彈系統進行搭配,為陸軍提供強大的源頭打擊能力。 結論 反艦飛彈、雄二E巡弋飛彈及海馬斯火箭彈系統現在及未來將是國軍相當重要的源頭打擊武器,國軍將秉持聯合作戰的型態整合相關裝備的系統與建構「共同戰場圖像」(COP)。 誠然建軍備戰必須花費相當多的經費,但為何國軍需要不斷採購武器?一方面是基於整體的印太、全球情勢增溫,二方面是解放軍持續威脅到我國的生存空間,基於上述理由,務實對美軍購、提高國產武器的數量是根本之道。 作者:宋磊

蔣介石初來台灣的歷史會重演嗎?

1949 年國民黨撤退來台後,為了處理嚴重通貨膨脹,推行「新台幣四萬換一元」的幣制改革。這項政策雖然在宏觀上穩定了金融秩序,但對許多台灣民眾而言,卻等同於一夜之間財產蒸發。長期累積的儲蓄被清零,經濟地位瞬間下滑,而隨軍來台的軍眷與公務體系反而較容易獲得配給與制度性保障,造成族群間長期的不信任與不平等記憶。這段歷史提醒我們,政權更替往往伴隨巨大且不可逆的社會成本,而承擔代價的,通常不是決策者本人。 另一方面,在中國大陸的歷史中,也有相似但更殘酷的例子。部分向共產黨投降的國民黨軍人,原以為可以換取生存與安定,最終卻被毛澤東派往韓戰前線,成為與美國支持的南韓作戰的「消耗品」。這些人並未因投降而獲得真正的信任或保護,而是在大國博弈中被迅速犧牲。這說明一個現實:在極權體制下,所謂的「統一戰線」或「既往不咎」,往往只具有暫時與工具性的價值。 如果設想有一天台灣因政治交易或內部崩解而被納入中國體制,對台灣人的影響恐怕不只是國旗與政權更換。首先,法治與人權保障將面臨根本性改變。言論自由、司法獨立、財產保障,都可能被重新定義,甚至被視為「不合時宜」。其次,台灣既有的社會菁英、政治人物或協力者,未必能長期保有地位,反而可能在完成過渡任務後被邊緣化甚至清算。歷史反覆證明,極權政權最不信任的,往往正是曾經「倒戈」的人。 對一般台灣民眾而言,最大的風險在於失去選擇權與退路。一旦體制改變,錯誤將難以修正,代價也不再是選舉失利,而是世代性的結構後果。從新台幣改革到韓戰的歷史教訓,都指向同一個結論:政治決策若忽視權力本質與歷史經驗,最終承受風險與犧牲的,永遠是普通人民。 作者:立雪

正面迎戰

台灣軍備與中國新式軍備若進入正面衝突,結果高度可預期:短期內以「高強度、飽和打擊、關鍵節點癱瘓」為主軸,戰場首先不是灘岸決戰,而是資訊、指管通情、空海軍基地與後勤節點的存續。多個公開兵推與研究都指出,開戰初期飛彈與遠程精準火力會大量消耗守方的機場、港口與地面防空資產,迫使防禦轉向分散、機動與韌性維持,並把核心目標從「逐件攔截」改為「維持作戰功能」。 中國是否有辦法用導彈破壞台灣重要基礎建設。能力層面,解放軍的火箭軍、巡弋飛彈與精準打擊鏈條,確實具備對固定且可識別目標造成嚴重破壞的潛在能力;其演練也多次呈現「模擬打擊關鍵基礎設施」的訊號。 但「能破壞」不等於「能達成戰略目的」。基礎設施分為可快速修復與難以修復兩類:電力、通訊、交通樞紐即使被擊中,仍可能透過備援、繞路、快速搶修與分區供應恢復部分功能;相反地,若長期反覆打擊、結合網攻與封鎖,才更可能把社會運作壓到臨界點。RAND 對台灣民防與韌性研究強調,戰時關鍵在於供電、通訊、物流、醫療等體系的「持續運作能力」而非零損。 台灣國防報告也把「韌性、備援、整體防衛」作為重要方向,反映官方已將「被打仍能運作」視為必備假設。 台灣是否武裝以備就可以和共軍打仗。答案是:台灣能打,但「打得贏」取決於戰型與外部變數。若是全面登陸入侵,防衛的可行路徑是以不對稱方式提高解放軍跨海投送成本,把戰局拉長,讓其後勤與政治承受不起。CSIS 兵推多次出現「代價巨大、勝負取決於介入與補給」的結論,顯示台灣單靠傳統對稱軍備很難在火力與產能上長期對拚,但能透過地面防禦、機動火力、海空拒止、分散指管與民防韌性,讓入侵變成不可承受的賭局。 因此,互戰的現實結果更可能呈現三點:第一,初期基礎設施與軍事節點受損顯著,社會成本高;第二,台灣若能維持指管、分散戰力、快速修復與持續補給,就能維持拒止;第三,戰爭走向會被封鎖強度、外援速度、國際制裁與資訊戰效果共同塑形,而不只是單純的飛彈交換。 蔡文邦  

Recent Posts

國民、民眾兩黨「打主人給狗看」!

國民、民眾兩黨「打主人給狗看」!

俗諺「打狗看主人」,從來沒有聽說過、看過「打主人給狗看」! 是不是要類如「殺鷄警𤠣」,不得不然:因為這隻狗太頑劣、凶惡,有如獒犬或比特犬,咬住敵人的喉嚨不放 ,制敵於死!看來又不像,這隻溫馴的狗反而被眾惡犬圍攻,只會拚命爬上樹喘氣,好險!好險!幸而還有一棵孤零零的樹可以託依,暫時活命 ! [...]

More Info
如何強化台澎防衛作戰的能力?

如何強化台澎防衛作戰的能力?

現狀:中共不放棄武力威脅台灣 中共至今尚未放棄武力解決台海爭端,從實際面來看,解放軍常態化越過海峽中線、持續干擾我西南、東南防空識別區(ADIZ),如今配合中共海警船(類似我國海巡單位)以海上執法的名義侵擾我漁船的作業,種種的行徑均讓人感受到北京意圖改變台海現狀,以武力侵犯我國的意圖越來越明顯。   [...]

More Info
蔣介石初來台灣的歷史會重演嗎?

蔣介石初來台灣的歷史會重演嗎?

1949 [...]

More Info
正面迎戰

正面迎戰

台灣軍備與中國新式軍備若進入正面衝突,結果高度可預期:短期內以「高強度、飽和打擊、關鍵節點癱瘓」為主軸,戰場首先不是灘岸決戰,而是資訊、指管通情、空海軍基地與後勤節點的存續。多個公開兵推與研究都指出,開戰初期飛彈與遠程精準火力會大量消耗守方的機場、港口與地面防空資產,迫使防禦轉向分散、機動與韌性維持,並把核心目標從「逐件攔截」改為「維持作戰功能」。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way