社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

關稅違憲之後:台美經貿關係的真正考驗   

近日,美國最高法院以6比3裁定,認為總統援引《國際緊急經濟權力法》(IEEPA)全面加徵關稅,已逾越法律授權範圍,構成違憲。此一判決,不只是對總統權力的重新界定,更牽動全球供應鏈與各國對美經貿布局的判斷。表面上看,這是對川普強勢關稅政策的一記重擊;但若細究制度與現實層面,其實未必意味著關稅時代的終結。 最高法院否定的是IEEPA作為全面加徵關稅的法律基礎,而非否定總統整體的貿易政策空間。美國法律體系中,仍有《貿易擴張法》第232條、《貿易法》第301條,甚至《貿易法》第122條等可供動用。尤其232條涉及國安理由,過去已廣泛運用於鋼鐵、鋁與汽車等產業;122條更可在一定期間內快速課徵關稅。 換言之,法院為權力劃線,但並未抽走總統手中的所有刀。若未來白宮改以其他法源推動關稅措施,政策衝擊未必比先前小。這也是為何市場雖短暫震盪,卻未出現結構性逆轉的原因。 在這樣的背景下,真正的關鍵問題是:台灣是否因此陷入不確定性?恰恰相反。如果台美之間已完成涵蓋232條款的談判安排,代表台灣是在制度框架內完成布局,而不是押注於單一法律工具。當其他國家還在重新評估策略時,已談成協議的一方,反而握有時間與秩序的優勢。 更重要的是,產業鏈的走向並不完全取決於關稅。以台積電為核心的半導體供應鏈赴美投資,本就源自長期的市場與地緣政治考量,而非短期關稅壓力。美國需要先進製程與完整供應鏈經驗,台灣企業則需要接近終端市場與政策資源,這種互補關係不會因單一判決而逆轉。 值得注意的是,這次判決也釋放一個重要訊號:即便是強勢總統,也必須受制於憲法框架。美國最高法院的裁定,體現的是權力分立的運作,而非政策方向的否定。對台灣而言,這其實是一堂關於制度信任的課。當外界質疑「若美國法院都能判總統違憲,政策是否不穩定」時,另一種理解應是:正因為有司法制衡,政策才更具可預測性。制度的穩定,來自於權力邊界的清晰,而不是行政權的無限擴張。 全球供應鏈正處於重組階段。若數據顯示美國自台灣進口金額在特定時期超越自中國進口,這不僅是貿易數字的變化,更是戰略重心轉移的象徵。台灣夾在兩大經濟體之間,從來不是單純的市場選擇題,而是制度、價值與安全架構的綜合判斷。當全球科技與製造體系重新排列時,能否在高附加價值產業中占據關鍵地位,比短期關稅高低更為重要。 無論未來白宮由誰主政,關稅工具如何變形,美國對供應鏈安全與產業自主的追求不會消失。台灣若能在這波重組中站穩科技核心與制度夥伴的位置,才是真正的長期紅利。與其將焦點放在某一次違憲判決是否「打臉」某位領導人,不如回到更根本的問題:台灣是否在全球經濟再平衡的過程中,站在更有利的結構位置? 作者:林政武

[轉] 美國最高法院裁定IEEPA不授權課關稅後,判決僅是爭取時間

美國最高法院近期就「以IEEPA課徵全球性關稅」作出關鍵裁定,核心不是否定關稅政策本身,而是指出《國際緊急經濟權力法》(IEEPA)並未授權總統以其主張的方式課徵關稅,關稅權限仍屬國會授權範圍。 這類裁判邏輯可被理解為「法律依據選錯」而非「行為不存在」:法院否決的是適用法源與權限邊界,並未宣告美國從此不能用其他貿易法源啟動關稅工具。 因此,判決一出,政策路徑立刻轉向。川普政府迅速宣布改採1974年《貿易法》第122條,以「國際收支/支付失衡」為由,啟動為期150天、最高可達15%的臨時附加關稅;在實務宣示上先以10%作為替代性全球關稅框架,用最短程序維持談判籌碼。 這一步的本質是「用更可用、但時間較短的法源接力」,把政策連續性先撐住,讓各國談判得到喘息窗口,但不代表關稅壓力消失。 接下來的焦點會回到更傳統、也更常用的貿易工具組合。其一是1974年《貿易法》第301條,由美國貿易代表署(USTR)調查外國不公平貿易作法後,得採報復性措施(含加徵關稅),且可在不走WTO爭端程序的情況下單邊推進。其二是1962年《貿易擴張法》第232條,以「國家安全」為由,由商務部調查並建議總統採取關稅或配額限制;這類調查一旦啟動,對特定產業與出口結構高度集中者的風險特別大。其三是1974年《貿易法》第201條等防衛措施,由ITC認定進口激增造成嚴重損害後,總統可採取關稅/配額,最長可延續多年。Reuters亦指出川普已下令啟動301與232等新調查,為後續更高、更具針對性的關稅鋪路。 至於「是否退回既已課徵的關稅」,目前更接近長期訴訟戰而非立即退稅。Reuters報導提到,最高法院裁定使先前依IEEPA徵得的關稅收入面臨退款不確定性,並引發後續訴訟與行政處理的複雜問題;相關金額規模被估計超過千億美元等級,現階段更可能進入拉長的法律程序,而非短期結案。 這也解釋了為何政府會在法源被否決後,立即用122條接續:在退款與權限爭議未落幕前,先維持關稅政策的談判框架與收入/槓桿結構。 結論是:最高法院裁定的主要效果,是把「用IEEPA課關稅」這條捷徑封住,迫使行政部門回到既有貿易法的程序工具箱;但美國可用的關稅法源仍多,差別只在程序成本、時間與可調整彈性。 因而這份判決對各國的意義更像是「爭取時間」,而不是「關稅落幕」。接下來的風險管理重點將轉為:122條的短期效力如何銜接到301/232/201的中期調查結果,以及各國是否能在調查期間完成談判交換,避免被納入更高、更多品項的關稅清單。 作者:趙堃成(轉載自作者臉書發文)

為何台灣詐騙如此猖獗:從產業鏈、制度漏洞到人性弱點的結構性解析

台灣詐騙之所以長期猖獗,原因不是「民眾太笨」或「警方不做事」,而是詐騙已經進化成跨境、分工、數據驅動的黑色產業鏈,並且精準卡住台灣的高流量金融環境、通訊平台生態與法律執行落差。當犯罪可以低成本大量嘗試、被抓成本相對可控、而且資金回收速度極快,詐騙自然會變成最「划算」的犯罪型態。 第一個核心原因是詐騙產業鏈完整,從「引流—洗腦—收款—洗錢—分潤」高度分工。台灣常見的投資詐騙、假檢警、解除分期、交友詐騙或假網購,本質上都不是單一人行騙,而是由不同角色接力:前端用廣告、假老師、群組、釣魚簡訊或社群私訊引流;中段用話術腳本與心理控制建立信任;末端由車手、收水、第三方支付、虛擬貨幣或境外帳戶完成收款與轉移;最後由洗錢節點把金流切碎、分散、跨境匯出。這種分工讓每個環節都像可替換的零件,個案被破也能迅速補位,整體效率不會崩。 第二個原因是台灣金融與支付環境便利,提供了詐騙需要的「高頻轉帳能力」。快速轉帳、即時入帳、多帳戶管理、第三方支付與便利的ATM提領,使得詐騙得手後可在極短時間內完成多段轉移,拉高追金難度。更重要的是,詐騙不需要每次都成功,只要大量發送訊息與廣告,靠極低的邊際成本換取少量高額成功案,就能覆蓋失敗率。 第三個原因是通訊與社群平台成為詐騙的「最佳投放渠道」。詐騙集團不必自建技術系統,只要依賴通訊軟體、社群平台、短影音與搜尋廣告,就能用演算法找到目標受眾。假投資常透過「名人代言」假圖、假新聞連結、投放到中高齡族群的內容版位,再把人導入封閉群組,利用群體壓力與假獲利截圖完成洗腦。平台治理與下架速度如果跟不上,詐騙就能像病毒一樣複製擴散。 第四個原因是跨境化讓偵辦成本上升。大量詐騙機房、金流節點與話務中心不在台灣境內,甚至在多個司法管轄區分散。警方即使掌握線索,也常只能先抓到「車手」或末端節點;而幕後主嫌、機房與資金終點在境外,使得刑事司法需要跨國協作、證據調取與引渡,時間與成功率都不理想。詐騙集團因此能把高風險環節外包到海外,降低被一網打盡的機率。 第五個原因是法律與執行存在「不對稱」:詐騙更新太快,制度反應太慢。詐騙劇本、平台與金流工具迭代速度以週為單位,但立法修法、跨機關協調與數位證據程序常以月或年為單位。刑責設計若無法有效提高「主犯與組織者」成本,而末端又不斷有人補上,整體威嚇效果就有限。民眾在新聞中看到「抓了很多車手」,但體感仍是詐騙不斷,正反映打擊點未能長期壓住產業鏈上游。 第六個原因是台灣的社會心理與生活壓力,提供了詐騙特別好用的切入點。投資詐騙利用的是對通膨與退休焦慮的恐懼;交友詐騙利用孤獨與情感需求;假檢警利用對司法與權威的畏懼;解除分期利用怕麻煩與資訊不對稱。詐騙話術之所以有效,是因為它不攻擊理性,而是攻擊情緒:緊迫、羞恥、恐懼、貪念與面子。只要把受害者推進「時間壓力」與「私密對話」場景,判斷力就會下降。 結論是:台灣詐騙猖獗不是單點失敗,而是「高報酬、低摩擦、可規模化」的犯罪模型遇上「支付便利、平台擴散、跨境阻力、制度慢反應」的結構環境。要有效降低詐騙,關鍵不是加強宣導一句「不要貪」,而是把成本結構反過來:提高上游組織者的風險、壓縮金流轉移速度、讓平台的下架與驗證變成標配、並讓被害人能更快止付與追金。沒有改變成本結構,就只會看到詐騙以新包裝持續存在。

台灣農曆過年為何越來越「沒年味」:城市節奏、家庭結構、消費型態與儀式退潮的共同結果

台灣的農曆過年越來越「沒年味」,不是單一原因,而是生活系統一起換軌的結果。過去的年味建立在三件事:長時間的停工停學、家族式的集中居住、以及高度一致的儀式流程(大掃除、辦年貨、貼春聯、拜拜、圍爐、走春)。當這三個支柱同時鬆動,過年就會從「社會共同節日」退化成「個人行程中的連假」。 第一個變化是城市節奏與服務業常態營業。外送、便利商店、百貨、電商與串流讓生活不需要為過年停擺,街景也不再出現「全城歇業」的稀缺感。年貨從一次性集中採購變成全年可買,儀式性的「準備期」被拆解成平日化,心理上就少了進入節日的門檻。 第二個變化是家庭結構縮小與人口流動。小家庭、晚婚不婚、少子化與跨縣市就業,使「大家族團聚」從必然變成協調成本。長輩減少、家族核心人物不在、或親戚分散海外,傳統的拜年網絡自然萎縮;再加上照護壓力與代際價值差異,聚會更容易變成負擔而非期待,年味被「壓力感」稀釋。 第三個變化是社群媒體與旅遊取代在地走春。過去走春是社區型互動,現在更多人把連假用在國內外旅行、露營或補眠,節日記憶轉向「景點照片」而非「共同儀式」。當每個人的過年敘事都不一樣,社會層面的同步感就下降。 第四個變化是儀式退潮與環保、健康、宗教觀念的轉型。減香、減紙錢、簡化祭祀、甚至不再拜拜,讓過年少了可見的符號密度;同時紅包電子化、轉帳取代現金、春聯與年菜外包,也削弱了「親手完成」帶來的節日實感。儀式一旦變成外包服務,節日就容易像消費品,而不是家族共同創作的作品。 年味不是「要不要熱鬧」,而是「社會是否同步」與「家族是否有共同儀式」。要找回年味,不必復古,而是重建幾個低成本但高同步的固定動作,例如同一時間的圍爐、固定一句祝賀、固定一個家庭小儀式。只要能讓多數人同時做同一件事,年味就會回來。

Recent Posts

關稅違憲之後:台美經貿關係的真正考驗   

關稅違憲之後:台美經貿關係的真正考驗   

近日,美國最高法院以6比3裁定,認為總統援引《國際緊急經濟權力法》(IEEPA)全面加徵關稅,已逾越法律授權範圍,構成違憲。此一判決,不只是對總統權力的重新界定,更牽動全球供應鏈與各國對美經貿布局的判斷。表面上看,這是對川普強勢關稅政策的一記重擊;但若細究制度與現實層面,其實未必意味著關稅時代的終結。 [...]

More Info
[轉] 美國最高法院裁定IEEPA不授權課關稅後,判決僅是爭取時間

[轉] 美國最高法院裁定IEEPA不授權課關稅後,判決僅是爭取時間

美國最高法院近期就「以IEEPA課徵全球性關稅」作出關鍵裁定,核心不是否定關稅政策本身,而是指出《國際緊急經濟權力法》(IEEPA)並未授權總統以其主張的方式課徵關稅,關稅權限仍屬國會授權範圍。 這類裁判邏輯可被理解為「法律依據選錯」而非「行為不存在」:法院否決的是適用法源與權限邊界,並未宣告美國從此不能用其他貿易法源啟動關稅工具。 [...]

More Info
為何台灣詐騙如此猖獗:從產業鏈、制度漏洞到人性弱點的結構性解析

為何台灣詐騙如此猖獗:從產業鏈、制度漏洞到人性弱點的結構性解析

台灣詐騙之所以長期猖獗,原因不是「民眾太笨」或「警方不做事」,而是詐騙已經進化成跨境、分工、數據驅動的黑色產業鏈,並且精準卡住台灣的高流量金融環境、通訊平台生態與法律執行落差。當犯罪可以低成本大量嘗試、被抓成本相對可控、而且資金回收速度極快,詐騙自然會變成最「划算」的犯罪型態。 [...]

More Info
台灣農曆過年為何越來越「沒年味」:城市節奏、家庭結構、消費型態與儀式退潮的共同結果

台灣農曆過年為何越來越「沒年味」:城市節奏、家庭結構、消費型態與儀式退潮的共同結果

台灣的農曆過年越來越「沒年味」,不是單一原因,而是生活系統一起換軌的結果。過去的年味建立在三件事:長時間的停工停學、家族式的集中居住、以及高度一致的儀式流程(大掃除、辦年貨、貼春聯、拜拜、圍爐、走春)。當這三個支柱同時鬆動,過年就會從「社會共同節日」退化成「個人行程中的連假」。 [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way