社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 吶喊廣場
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

4 月電價調漲沒回頭路?台電曝調整方向:住宅平均電價遠低於成本,能源海嘯下的「庶民加稅」?

4 月電價是否調漲,表面上是台電財務與燃料成本的技術問題,實際上卻更像一場延後結帳的政治經濟問題。真正敏感的,不只是每戶電費帳單會增加多少,而是台灣過去幾年刻意壓低民生電價、用國營事業財務去吸收能源成本的模式,到了 2026 年是否已經接近極限。當台電董事長曾文生明確指出,住宅平均電價每度約 2.77 元,低於售電成本約 3.71 至 3.80 元,這件事就不再只是「漲不漲」的選擇,而是誰來承擔差額、何時承擔、用什麼方式承擔的問題。 從經濟邏輯來看,電價長期低於成本,本來就不可能無限延續。問題在於,台灣不是在一個景氣穩定、通膨溫和、能源供應無虞的時點討論這件事,而是在中東地緣政治升溫、國際油氣價格波動加劇、民眾對生活成本已高度敏感的環境下,被迫面對這張帳單。曾文生點出天然氣價格是電價平均成本的重要因子,而台灣電力結構對進口燃料依賴度高,這意味著只要國際能源價格被戰爭或航運風險推升,台電的成本壓力就會快速轉嫁到整個電價機制上。 真正讓社會反感的,不是「成本反映」這個概念本身,而是民眾直覺上會把這種調整理解為另一種形式的隱性加稅。因為多數家庭不會從財務報表角度看台電虧損,而是從自己的生活經驗出發:油價已漲、外食不便宜、房租高、通勤與日用品成本都在上升,現在連電價也可能再上修,那麼這就不是單一價格調整,而是生活成本全面墊高。主計總處已指出,光是國內油價上漲 5%,對 3 月 CPI 的直接影響就約 0.11 個百分點;而電價若調整,其後續影響通常不只停留在家庭電費,而會透過冷鏈、餐飲、零售、洗衣、物流、製造與租賃成本層層擴散。 這也是為什麼「庶民加稅」這個說法雖然情緒化,卻能迅速引發共鳴。因為對多數中低收入家庭、租屋族與微型商家而言,能源支出本來就不是可自由調整的奢侈消費,而是近乎固定、不可避免的生存成本。尤其租屋族往往不直接受惠於節能設備更新,也缺乏更換電器或改善隔熱環境的空間,結果就是同樣的電價調整,對不同族群產生完全不對稱的負擔。微型企業也一樣,像是小吃店、美髮店、洗衣店、工作室、早餐店與小型辦公室,本來就處在毛利薄、議價能力低的區間,一旦電價上修,它們不是吸收利潤,就是轉嫁價格,最後仍會回到消費端。 因此,這次電價討論真正暴露的,不只是台電該不該漲價,而是台灣能源轉型與價格政策長期存在的一個結構矛盾:政府希望穩定民生、壓抑通膨、維持產業競爭力,同時又要推動電力結構轉型、吸收燃料波動與處理台電財務黑洞,但這幾個目標並不能無成本同時成立。過去幾年,政府選擇以撥補、延後調整、分級吸收與平滑化處理來降低短期衝擊,但這種做法本質上是在把成本從帳單上移到財政與國營體系資產負債表上。中央社先前報導就指出,台電累積虧損已超過 4,200 億元,而若無撥補與適度調整,虧損還會持續擴大。 問題在於,當社會已經普遍對物價變動高度敏感時,任何「理性反映成本」都可能迅速被政治化。這不只是因為漲價本身,而是因為民眾會開始追問:為什麼能源政策的代價,最後往往由最缺乏轉嫁能力的人先承擔?若這個問題沒有被正面處理,4 月電價調整即使在數字上幅度有限,政治上仍可能被放大成對整體施政信任的投票。尤其當國際油價與地緣風險明顯不是政府能完全控制的變數時,民眾更容易把不滿集中到唯一可見的結果——帳單變貴。 所以,4 月電價真正的爭點不只是是否調整,而是調整方式是否具有社會正當性。若只是齊頭式把成本往終端推,確實很容易被理解成庶民承擔、制度卸責;但若能精準區分基本民生、租屋型態、小商戶與高耗能用戶,把價格訊號與社會保護機制綁在一起,那麼電價調整才有可能被視為必要修正,而不是另一種沒有明講的稅負轉嫁。2026 年這場能源壓力測試,考驗的從來不只是台電帳面能不能平衡,而是台灣能不能在能源現實與社會承受力之間,找到一條不引爆信任危機的路。 作者:新公民議會編輯小組

台積電宣布 560 億美元史詩級資本支出!2 奈米擴產潮背後:能源海嘯下台灣半導體的最後防線?

台積電將 2026 年資本支出拉高到 520 億至 560 億美元,確實不只是單純的擴廠新聞,而是把台灣半導體產業推進到一個更赤裸的現實:先進製程的競爭,表面上是技術節點、良率與客戶訂單之爭,實際上已經變成電力、能源價格、基礎設施穩定度與國家承載能力的全面競爭。根據《經濟日報》與相關報導,台積電今年資本支出預估再創新高,遠高於市場先前對約 460 億至 470 億美元的預期,且其中約 70% 至 80% 將投入先進製程技術,2 奈米量產與擴產已成核心方向。 這筆支出的第一層含義,是台積電正用資本密度去鞏固技術密度。當 AI 基礎建設需求持續擴張,先進製程、先進封裝與高效能運算晶片的需求不只是上升,而是開始擠壓整條供應鏈。報導指出,台積電管理層已明確表示先進製程產能吃緊,2026 年供應瓶頸甚至已對部分科技供應鏈形成掐喉效應。這代表台積電此刻不是因為景氣樂觀才大舉投資,而是因為若不加快擴產,就會失去對全球 AI 晶片供應節奏的主導力。 但真正更深層的問題在能源。半導體廠不是一般製造業,先進製程每前進一代,背後需要的是更密集的電力、更穩定的供水、更高標準的廠務系統與更可預測的能源成本。2 奈米不是只靠工程師與設備就能推進,而是整個台灣基礎設施要同步支撐。從這個角度看,560 億美元並不只是台積電對未來訂單的押注,也是對台灣電力穩定性的反向壓力測試。只要供電出現不穩、電價劇烈波動,或能源輸入遭遇地緣政治衝擊,先進製程的成本優勢就會被侵蝕,良率與交期也會承受更大壓力。 這也是為什麼這筆支出可以被視為台灣「矽盾」邏輯的升級版。過去談矽盾,多半著重於台積電的不可取代性會提高台灣的戰略價值;但到了 2026 年,矽盾已不只是晶片製造領先,而是「能不能持續以穩定能源與基礎設施,把最先進晶片可靠地做出來」。如果台灣能提供穩定電力、快速擴建能力與高效率供應鏈協同,這筆資本支出就會轉化為更厚的產業護城河;反過來說,若能源韌性不足,龐大投資反而會把台灣的基礎建設弱點放大到全球客戶面前。 因此,這場競爭的本質已不是台積電單獨對抗 Intel […]

川普「五日緩刑」進入倒數!伊朗否認接觸、以色列空襲不停:中東戰火即將迎來最黑暗的週末?

川普對伊朗祭出的「五日通牒」進入最後 48 小時,表面上看起來像是一次典型的川普式施壓:先把局勢推向極限,再保留一條談判出口,讓對手在壓力下讓步。但真正值得警惕的,不是川普在社群平台上用了多激烈的語氣,也不是他口中的「富有成效對話」是真是假,而是目前中東局勢已經進入一種最危險的狀態:外交話術、軍事升級與市場錯價正在同時發生。 川普 3 月 23 日宣布,暫緩對伊朗電力與能源基礎設施的打擊五天,並聲稱美伊之間過去兩天已有「非常好且富有成效的對話」。包括 Reuters、PBS 與 CBS 在內的國際媒體都指出,這項延後與荷姆茲海峽通行危機高度相關,美方顯然試圖把「打或不打」作為一種談判工具,迫使伊朗在海峽通行與區域安全上讓步。 但問題是,伊朗幾乎立即公開否認。伊朗官方與相關表態明確指出,並未與美方進行直接接觸,甚至將美國釋放的談判訊號視為政治宣傳與壓力操作。這種資訊完全不對稱的狀態,才是這場危機最危險的核心。因為當一方認為自己在「逼談」,另一方卻認為對方只是在「掩護開戰」,雙方對局勢的認知就已經脫鉤。 從川普的政治風格來看,這種「先極限威嚇、再暫時收手」並不新鮮。無論是對中國、北韓、伊朗還是北約盟友,他一貫採用的都是商業談判式邏輯:先把代價拉高,讓所有人意識到局勢可能失控,再由自己提供唯一可接受的降溫出口。問題在於,這種做法在貿易戰或關稅談判中可能有效,但放到中東這種高烈度軍事環境中,誤判的代價不是市場波動,而是戰爭外溢。 更值得注意的是,川普的延後並沒有伴隨真正的區域降溫。以色列在這段通牒期間仍持續對德黑蘭相關目標發動空襲,代表至少在軍事層面上,壓力並未解除。這讓外界更容易解讀出一個更真實的戰略結構:美國在口頭上保留外交空間,以色列則在實際上持續削弱伊朗戰略能力,兩者形成某種「一唱一隨」的極限施壓組合。對華府來說,這可能是一種逼迫伊朗退讓的雙軌操作;但對德黑蘭而言,這也可能被理解為「美國在談判桌上說話,以色列在空中替美國執行劇本」。 這正是目前風險正在急速升高的原因。只要伊朗內部決策層開始認定,美方所謂的談判只是為了爭取部署與打擊節奏,那麼川普原本設計成「談判籌碼」的動作,就會在對方眼中轉譯為「開戰前置訊號」。一旦訊號被這樣理解,誤判便可能自我實現。 外界若只把這次事件看成一次單純的中東軍事升級,也同樣低估了它的全球衝擊。這次危機真正的引信,不只是德黑蘭上空的飛彈與空襲,而是荷姆茲海峽是否能恢復可信通行。國際能源署(IEA)3 月報告已指出,近期中東戰事已造成全球油氣供應重大中斷,荷姆茲海峽原本約 20 百萬桶/日的流量一度大幅下降,並導致全球供應鏈、煉油、LNG 與保險市場同步承壓。 也就是說,市場現在面對的不是「會不會缺油」這種單一問題,而是「全球能源、航運、保險與通膨是否會連鎖惡化」的系統性風險。只要荷姆茲海峽沒有真正恢復穩定與可驗證的商業通行,那麼任何來自 Truth Social 的一句「對話富有成效」,都不足以構成實體風險解除。市場目前最大的脆弱點就在這裡:金融價格可能已經開始反映和平預期,但實體供應鏈卻仍停留在戰時邏輯。 因此,未來 48 小時真正要觀察的,不是川普是否再發一篇更憤怒或更樂觀的貼文,而是三個更具體的現實信號:第一,伊朗是否釋出任何可被驗證的降溫動作,例如放鬆海峽風險、降低報復語氣或接受第三方中介;第二,以色列是否實際降低空襲頻率與打擊層級;第三,美國是否開始從模糊威嚇轉向明確條件交換。如果這三者都沒有出現,則代表這五天不是降溫窗口,而只是戰前節奏管理。 所以,川普這場「史詩怒火」到底是談判籌碼還是開戰信號?答案可能是:它原本被設計成談判籌碼,但在目前這個多方互不信任、軍事節奏持續推進的環境裡,它隨時可能被現實轉化為開戰信號。真正可怕的,不是有人想打,而是有人以為對方只是演;而對方則以為這一切早已不是演。 若 […]

核能是解方嗎?看川普嗆伊朗要炸發電廠

近日,賴總統宣布,研議核二、核三重啟的可能性。這讓核能議題再次掀起討論。說實在,真是感到厭煩了。如果核能這麼好,為何不各縣市一個核電廠呢?這樣不是超級完美嗎? 核電廠的問題,已經說過無數次。首先,台灣在環太平洋的地震帶。這是絕對的危險因子。再者,核廢料至今都還沒有適切的處理方法。有誰可以說,歡迎核廢料放我家呢? 最後,因應戰時,有核電廠的國家,絕對變成敵國的靶心。這也是,川普為何要嗆聲伊朗,要把他們的發電廠炸掉的關鍵了。 事實上,我們都很明白,因為台灣發展AI,需要更多電力。所以亟需用電。可是,這段非核時期,不也是照樣前進嗎?難道,台積電自主研發綠電能源,是在做心酸的嗎? 可見,要發展AI,跟選擇核電,並無相關。更不應該在老舊的核二、核三基礎上,去討論重啟。因為,沒有人能夠對可能造成的意外,來負責。 那麼,相信會有人說,新能源科技,可以採用核電。我想,會這樣說的人,自己應當先行試驗。把自己家當作新核能試驗場。這樣會更有說服力。 所謂,自救再來救人。這些擁核人士,在危險的毒藥之下,要叫大家全部吞下。自己得先確認核能不是毒藥,而且還能自己消除核廢料,才是真正的負責。 因此,與其抱怨在未來的AI產業中,台灣會因缺電而落後。不如說,台灣應該思考,要怎麼讓綠能更廣泛,才是兼顧安全與發電的好方法。 縱使,會有許多人說,像是日本,或是歐洲各國,也走回核電的老路,為何我們不照做。問題是,台灣地狹人稠,真的禁不起一次的大災害呀! 所以,由風險控管,還有核廢料的處理等等層面來觀察,台灣實則不是核電的合適地。況且,我們好不容易達到了2025非核家園的目標。到底為何要走向過去呢? 以上種種,不只可以從核能的問題點出發,還能從需求跟必要出發。最實在的,發電若變成致災武器,這樣沒有人樂意呀! 回顧過去以來,核能都變成爭吵的議題。可是,核能真正能發的電力,是相對少的8%。硬要使用核能,不只不安全,實際效益更是有限。 核能是解方嗎?想必不是!如果為了一時方便,害了自己,那才是得不償失。尤其,看到川普嗆伊朗要攻擊發電廠,令人想到,習近平也能依法炮製。 加上,中國在台協力者這麼多,有核電廠真是弊大於利呀!賴清德真該好好認清現實呀!核電,在地緣政治不穩下,更加不該重啟才是。 作者:黃宗玄

Recent Posts

4 月電價調漲沒回頭路?台電曝調整方向:住宅平均電價遠低於成本,能源海嘯下的「庶民加稅」?

4 月電價調漲沒回頭路?台電曝調整方向:住宅平均電價遠低於成本,能源海嘯下的「庶民加稅」?

4 月電價是否調漲,表面上是台電財務與燃料成本的技術問題,實際上卻更像一場延後結帳的政治經濟問題。真正敏感的,不只是每戶電費帳單會增加多少,而是台灣過去幾年刻意壓低民生電價、用國營事業財務去吸收能源成本的模式,到了 2026 年是否已經接近極限。當台電董事長曾文生明確指出,住宅平均電價每度約 2.77 元,低於售電成本約 3.71 至 3.80 [...]

More Info
台積電宣布 560 億美元史詩級資本支出!2 奈米擴產潮背後:能源海嘯下台灣半導體的最後防線?

台積電宣布 560 億美元史詩級資本支出!2 奈米擴產潮背後:能源海嘯下台灣半導體的最後防線?

台積電將 2026 年資本支出拉高到 520 億至 560 億美元,確實不只是單純的擴廠新聞,而是把台灣半導體產業推進到一個更赤裸的現實:先進製程的競爭,表面上是技術節點、良率與客戶訂單之爭,實際上已經變成電力、能源價格、基礎設施穩定度與國家承載能力的全面競爭。根據《經濟日報》與相關報導,台積電今年資本支出預估再創新高,遠高於市場先前對約 460 億至 470 億美元的預期,且其中約 [...]

More Info
川普「五日緩刑」進入倒數!伊朗否認接觸、以色列空襲不停:中東戰火即將迎來最黑暗的週末?

川普「五日緩刑」進入倒數!伊朗否認接觸、以色列空襲不停:中東戰火即將迎來最黑暗的週末?

川普對伊朗祭出的「五日通牒」進入最後 48 小時,表面上看起來像是一次典型的川普式施壓:先把局勢推向極限,再保留一條談判出口,讓對手在壓力下讓步。但真正值得警惕的,不是川普在社群平台上用了多激烈的語氣,也不是他口中的「富有成效對話」是真是假,而是目前中東局勢已經進入一種最危險的狀態:外交話術、軍事升級與市場錯價正在同時發生。 川普 3 月 23 [...]

More Info
核能是解方嗎?看川普嗆伊朗要炸發電廠

核能是解方嗎?看川普嗆伊朗要炸發電廠

近日,賴總統宣布,研議核二、核三重啟的可能性。這讓核能議題再次掀起討論。說實在,真是感到厭煩了。如果核能這麼好,為何不各縣市一個核電廠呢?這樣不是超級完美嗎? 核電廠的問題,已經說過無數次。首先,台灣在環太平洋的地震帶。這是絕對的危險因子。再者,核廢料至今都還沒有適切的處理方法。有誰可以說,歡迎核廢料放我家呢? [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way