社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

斷章取義作為媒體素養教材:以公共發言爭議培養學生的思辨能力

在現在這個時代,只要一打開手機,新聞、貼文、截圖就一個接一個跳出來。我們很容易在幾秒鐘之內,就對一件事情下判斷,甚至很快轉貼、留言、表態。但在學校裡,不管是公民課、閱讀理解,還是 108 課綱裡很重要的「探究與實作」,老師其實一直提醒我們一件事:事情還沒看完整之前,不要急著下結論。最近社會上發生的一則爭議,就很適合拿來當媒體素養與思辨練習的例子。 事情的起點,是賴總統在一個公開場合談到閱讀的重要性,分享自己過去在地方施政時的想法。他的原意是提醒家長,不要把所有希望都放在「擠進名校、追逐名師」,而是要讓孩子養成閱讀的習慣,因為好書可以陪伴一個人很久。但這段話,後來被簡化成一句「好老師不如讀好書」,並被拿來指控成「不尊重老師」。全教總因此提出嚴厲批評,認為這樣的說法是在貶低教師專業。 如果只看到那一句被整理出來的話,很多人第一時間的反應,很可能就是生氣,覺得「怎麼可以這樣說老師」。但當總統府後來公開完整逐字稿後,才會發現事情其實沒有那麼簡單。原本的發言內容,並沒有否定老師的重要性,而是在談「不要過度迷信某一種升學路線」,也在肯定多數老師本來就很有使命感。這中間發生的問題,不是捏造,而是斷章取義。 這正好是一個非常典型、也非常適合拿來教的媒體素養案例。在 108 課綱裡,媒體素養不是要你記住「假訊息很可怕」,而是要你學會判斷:一則訊息是怎麼被選擇、被剪裁、被重新包裝的。像這次的例子,並不是整段話都是假的,而是只取其中一句,拿掉前後脈絡,然後直接下了一個很重的結論。這種「說一半」的狀況,在現在的公共討論裡,其實非常常見。 對學生來說,要判斷這類訊息,可以先練習幾個很實用的問題。第一,這句話有沒有原始來源?是完整發言,還是別人整理後的版本?第二,有沒有逐字內容可以對照?第三,這個指控,是建立在事實上,還是建立在某一種解讀上?這些問題,聽起來好像很像在「看新聞」,但其實跟你在國文課做閱讀理解、在社會科判讀資料時做的事情是一模一樣的,只是把學校裡學到的能力,拿來用在真實生活中。 再來談思辨。很多人會以為思辨就是「反駁別人」,但在教育現場,我們真正想教的,是學生能不能看出一個說法中間「少了什麼」。像這次的爭議,從「鼓勵閱讀」直接跳到「貶低老師」,中間其實少了好幾個步驟。是誰做了這個連結?這個連結有沒有其他可能的解釋?這是事實,還是意見?在探究與實作課程裡,老師會要求學生把推論過程寫清楚,因為如果只有結論,卻沒有過程,那就很容易出錯。公共討論也是一樣。 如果公共空間裡只剩下情緒、標籤和立場,而沒有查證和推理,那最後往往只是彼此對罵,而不是讓事情更清楚。這也是為什麼媒體素養和思辨教育,並不是在教政治立場,而是在教一種判斷力。 在數位時代,每一個人都不只是訊息的接收者,也很可能是傳播者。你的一次轉貼、一句留言,都可能影響別人怎麼理解這件事。所以媒體素養與思辨教育,其實是在教一種責任感。不是要你什麼都不相信,而是提醒你:慢一點,看完整,想清楚。這正是 108 課綱希望學生帶走的能力之一。因為真正能陪你一輩子的,不是某一次考試的成績,而是當你面對複雜資訊時,還能保持清醒、願意思考的能力。當你願意把事情看完整,而不是只看一句話,其實你就已經在練習,成為一個成熟、有判斷力的公民了。 作者:潘威佑 (社團法人台灣教師聯盟理事長)

從黎智英的遭遇認清中國真面目

港台知名的壹傳媒、《蘋果日報》創辦人黎智英近日被香港法庭宣判勾結外國勢力、煽動等三項罪名全數成立,刑期擇日宣布,這個裁判結果引起各界為之譁然從黎智英在2020年8月10日被香港當局以違反香港《國安法》為由遭到逮捕後,他已經在監獄中渡過超過五年的時光。   外界質疑這起判決只是政治操縱的「袋鼠法庭」,純粹是中國透過香港當局整肅香港異議聲音的政治審判,觀察家周芳芳在評論文章直言對黎智英的審判「是一項清楚而明確的政治宣示:北京已完成對香港新聞自由與政治異議的制度性清算。」   以英國小報作風衝擊台港媒體界的黎智英,卻是長年抱持「民主中國」情懷的理想主義者,台灣只要記得《壹周刊》、《蘋果日報》的人無不為這位特立獨行的媒體大亨今日的落難,感到唏噓不已。   而黎智英的遭遇,也帶給台灣在內的自由世界諸多教訓,比如說:   一、「不能低估中國共產黨的陰險」 在2019年香港反送中抗爭前後,有些有識者警告中國共產黨跟它操縱的香港特區政權勢必會徹底清除香港一切反對聲音,黎智英、黃之鋒及戴耀廷等知名的異議人士將是第一批被整肅的目標,而且會比照中國式司法迫害這些知名異議人士,因此相關人士應及早撤出香港,在海外保存力量作長期抗爭。   遺憾的是黎智英等人低估了有識者的警告,認為香港司法體系仍可還其公道,選擇留在香港,在法庭上說道理,但是此時的香港司法體系已經不再是過去的那個仍然有獨立性的香港司法,而黎智英等人則不幸成為「袋鼠法庭」的受害者,甚至其壹傳媒、《蘋果日報》都被迫停止營運。   二、「軟弱無力的國際聲援只是鼓勵中國軟土深掘」 黎智英遭到逮捕入獄之後,其家人和旗下傳媒工作者為他奮力在國際奔走、發聲,然而所得到的回應非常微弱,即使是美國也是如此態度。   這突顯出國際社會對於中國共產黨侵害人權的態度變得更軟弱,不如當年聲援劉曉波的力道,當初劉曉波不幸在監獄中過世的厄運是否可能發生在目前健康不佳的黎智英身上,值得關注香港的各界人士正視。而國際上這種姑息綏靖的氛圍,只是縱容中國共產黨更為所欲為。   曾經有人把香港比喻為礦坑裏的金絲雀,認為中國共產黨如何對待香港,未來就會如何對待世界,同理,今日中國共產黨如何對待黎智英,未來就會如何對待其他自由世界的公民。   因此,包括台灣在內的自由世界,必須更積極聲援並關切黎智英等其他遭到中國共產黨迫害的香港異議人士,尤其是台灣更不能保持沉默,當年太陽花運動的口號「今日香港,明日台灣」都在在警醒台灣公眾,如果低估中國共產黨的陰險,甚至放棄自身的民主自由,黎智英等人的遭遇未來同樣可能發生在任何一個台灣人身上。 作者:局外人  

從羅馬元老院到台北立法院:當憲法裁判捲入黨爭時

歷史一再證明,國家最怕的不是政黨對立,而是政黨沉溺鬥爭卻忘記國家與人群。古羅馬共和末期,元老院與護民官互相杯葛,結果不是誰贏得更高的道德制高點,而是讓凱撒帶著軍團走進羅馬;明末東林黨與閹黨鬥得不可開交,最終誰也沒笑到最後,只留下山河破碎的歷史評語。這些故事看似遙遠,卻在今日台灣的憲政現場,浮現出令人哭笑不得的既視感。        不過,台灣版的劇情沒有鐵甲軍團,也沒有宦官密詔,而是更文明、也更諷刺的版本,就是讓憲法法庭「暫停營業」。憲法法庭本是現代民主國家的裁判室,負責在政治衝突失控前吹哨。依憲政分工,不替任何政黨得分,也不幫行政或立法背書,乃立於中立地位。然而當立法院以人事同意權作為政治武器,讓大法官人數不足、法庭無法開庭,等同於在球賽進行中把裁判請下場,然後若無其事地說:「沒裁判也可以繼續比賽。」當沒有裁判的比賽,最後通常只剩下肢體衝突。    從憲法學理來看,憲法法庭之所以被設計成「不中斷機關」,正因其功能不在政治,而在止血。德國聯邦憲法法院在冷戰、恐怖攻擊與國會高度對立下仍持續運作,正是因為任何一個負責任的民主體制都知道,讓憲法審查停擺,本身就是一種制度自殘。反觀台灣,藍白陣營一方面高喊「制衡行政權」、「反對專斷」,另一方面卻默許、甚至促成唯一能對國會多數說「不可以」的機關空轉,這種行為若不是憲政失憶,就是選擇性遵憲。    更荒謬者,此操作還經常披著「依法行使職權」的外衣。沒錯,人事同意權寫在憲法裡,但憲法從來不是給人用來癱瘓整個憲政機制的工具。從政治史的角度看,這類操作從來不新鮮。美國南北戰爭前,國會長期陷於奴隸制爭議,最高法院又在德雷德史考特案中自廢武功,最終政治問題失控成為戰爭;法國第四共和內閣頻繁倒閣,憲政秩序空轉,才為強人政治鋪路。歷史反覆告訴我們,當制度性的仲裁者消失,政治不會因此變得更自由,只會變得更粗暴。     回到台灣現實,憲法法庭空轉的直接後果,是人民權利被「無限期延後」。違憲法規無法被宣告違憲,爭議制度無法被最終裁判,所有不滿只能在政治口水與街頭動員中消耗。長此以往,社會將逐漸學會一件危險的事:與其相信憲法,不如相信誰的聲音比較大、誰的席次比較多。遺憾的是,正是民主退化的起點。       令人諷刺,藍白陣營口中最常出現的詞彙之一,正是「憲政危機」。只是他們似乎忘了,真正的憲政危機,不是政府被監督,而是監督機制被關機。當憲法法庭長期空轉,台灣並非少了一個機關,而是少了一道最後的防火牆。       歷史從不缺乏警告,只缺乏願意聽的人。從羅馬到台北,政黨鬥爭可以有輸贏,但憲法不能成為陪葬品。否則有一天,當大家終於發現國家真的停滯了,再回頭尋找那位缺席已久的裁判時,只會發現,比賽早已變成一地狼藉的混戰。 作者 / 風林火山

[轉]【國防安全專欄|美日防長舉行會談之戰略意涵 】​

​ ● 一、前言 ● 二、美日防長密集舉行會談 ● 三、美日防長華府舉行會談 ● 四、戰略意涵 ● 五、政策建議(代結語) (一)強化與日本防務領域合作 (二)擴大與美國防衛產業合作 (三)爭取加入第一島鏈各軍演 ​ 一、前言 美國戰爭部長赫格塞斯(Pete Hegseth)於2025年1月24日通過參議院任命案(國防部長);日本防衛大臣小泉進次郎則是2025年10月21日接任該職,美日因有《美日安保條約》做基礎,自1961年該條約生效後,雙邊軍事合作不斷深化。尤其,近年來中國軍事快速崛起,並不斷挑戰國際秩序,侵入日本領空與領海情事迭有發生,讓日本周邊安全面臨前所未有的挑戰。 此外,中國、俄羅斯與北韓軍事合作密切、都加劇東北亞及印太地區安全的不確定性。日本作為印太重要國家,同時也是美國在印太地區最堅實的盟友,在美國的支持下,不斷調整其戰略觀,以及修訂3份安保文件,鬆綁之前加諸在日本身上的桎梏,使日本得以不斷強化軍備力量,應對中國、俄羅斯及北韓可能的軍事威脅。近期美日防長在短時間舉行密集會談,旨在溝通、協調雙邊防衛事務,確認美日同盟堅定不移。本文分從美日防長密集舉行會談、美日防長華府舉行會談、戰略意涵及政策建議等面向,析論如後。 二、美日防長密集舉行會談 日本防衛大臣小泉進次郎於2025年10月21日接任該職,迄今剛滿三個月,渠於2025年結束前已經與美國戰爭部長赫格塞斯舉行兩次面對面會談,以及一次通話,顯示東亞安全情勢因中國的軍事擴張不容樂觀,美日防長曾於10月29日、11月12日舉行面對面會談,12月11日則進行電話會談,針對問題核心做充分溝通與協調,相關會談內容,摘整如表一。 美日防長2025年舉行面對面暨電話會談統計 10月29日面對面會談 (東京) 會談主要內容 ●小泉表示日本將透過增加防衛預算來強化防衛能力。 ●雙方就進一步強化美日同盟嚇阻及應對能力進行確認。 ●雙方將擴大沖繩群島在西南諸島地區的日美共同部署訓練,並將其列為「最優先事項之一」。 ●同意以日美為核心,強化南韓、澳洲、菲律賓等國的情報共享與行動協調。 ●推動包括AIM-120先進中程空對空飛彈等武器的共同生產,以及美軍艦艇與飛機的共同維修機制。 […]

Recent Posts

斷章取義作為媒體素養教材:以公共發言爭議培養學生的思辨能力

斷章取義作為媒體素養教材:以公共發言爭議培養學生的思辨能力

在現在這個時代,只要一打開手機,新聞、貼文、截圖就一個接一個跳出來。我們很容易在幾秒鐘之內,就對一件事情下判斷,甚至很快轉貼、留言、表態。但在學校裡,不管是公民課、閱讀理解,還是 108 課綱裡很重要的「探究與實作」,老師其實一直提醒我們一件事:事情還沒看完整之前,不要急著下結論。最近社會上發生的一則爭議,就很適合拿來當媒體素養與思辨練習的例子。 [...]

More Info
從黎智英的遭遇認清中國真面目

從黎智英的遭遇認清中國真面目

港台知名的壹傳媒、《蘋果日報》創辦人黎智英近日被香港法庭宣判勾結外國勢力、煽動等三項罪名全數成立,刑期擇日宣布,這個裁判結果引起各界為之譁然從黎智英在2020年8月10日被香港當局以違反香港《國安法》為由遭到逮捕後,他已經在監獄中渡過超過五年的時光。   [...]

More Info
從羅馬元老院到台北立法院:當憲法裁判捲入黨爭時

從羅馬元老院到台北立法院:當憲法裁判捲入黨爭時

歷史一再證明,國家最怕的不是政黨對立,而是政黨沉溺鬥爭卻忘記國家與人群。古羅馬共和末期,元老院與護民官互相杯葛,結果不是誰贏得更高的道德制高點,而是讓凱撒帶著軍團走進羅馬;明末東林黨與閹黨鬥得不可開交,最終誰也沒笑到最後,只留下山河破碎的歷史評語。這些故事看似遙遠,卻在今日台灣的憲政現場,浮現出令人哭笑不得的既視感。       [...]

More Info
[轉]【國防安全專欄|美日防長舉行會談之戰略意涵 】​

[轉]【國防安全專欄|美日防長舉行會談之戰略意涵 】​

​ ● 一、前言 ● 二、美日防長密集舉行會談 ● 三、美日防長華府舉行會談 ● 四、戰略意涵 ● 五、政策建議(代結語) (一)強化與日本防務領域合作 (二)擴大與美國防衛產業合作 (三)爭取加入第一島鏈各軍演 ​ 一、前言 美國戰爭部長赫格塞斯(Pete [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way