社會觀察 . 獨立評論 . 多元觀點 . 公共書寫 . 世代翻轉

  • Home
  • English
  • 評論
  • 民意
  • 時事
  • 生活
  • 國際
  • 歷史
  • 世代
  • 轉載
  • 投稿須知

偽陽性誤判太多,調降p值門檻就好?

  • 時事
  • 民意

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。

「p值(p value)」是統計時常用的值,用於判斷結果是否顯著。p值本身是一個計算出的數字,常見的顯著標準是0.05;對研究人員而言,它常常也是決定生或死的那條界限,若是千辛萬苦得到的數據低於0.05,意謂結果顯著,人生也跟著有了意義。反之,假如超過0.05,那就是實驗失敗,生命變成灰色。

p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily
p值在統計上決定結果是否顯著。 圖片來源:3quarksdaily

近年來,卻有許多學者認為p值並不好用,常常無法反映真實的狀況。更激進的建議是,p值顯著門檻太高,應該調降,比方說降低為0.005(《’One-size-fits-all’ threshold for P values under fire》 [連結] )。p值是科學研究方法上,非常重要的議題,本文整理最近的爭議,希望帶給讀者一些想法。

降低顯著門檻最大的好處是,可以減少偽陽性(false positive)的誤判。什麼是偽陽性?例如檢驗吸毒,若是真的有吸,測試得到的結果也有,就是真陽性;反之,假如沒有吸毒,檢驗卻是有吸,則稱作偽陽性,亦即「實際上沒有,算出來卻有,假的!」。

順帶一提,在學校內進行全面吸毒篩檢,科學上不可行的理由,正是由於偽陽性太高,將導致誤判過多。(詳見《全面尿液篩檢的統計陷阱》 [連結] )

前面提過,研究人員生死時常決定於p值,因此不乏有人操弄實驗變數,讓p值越過門檻,例如由0.057「調整」後降低為0.049,使不顯著變成顯著,讓論文得以發表。若是降低數字,的確可以遏止此類歪風。然而,學界卻也有很多反對意見。為什麼,難道降低誤判率不好嗎?

我們回到統計與研究。究竟計算p值或是其他指標,對科學有什麼意義?在門檻0.05之下,我們不能說p值算出來0.049是寶,0.050是沒意義的垃圾。p值本身不過是個工具,單看一個值,不足以決定結果有沒有價值。

顯著值不是固定門檻,會根據研究對象改變。例如研究基因組尺度的「全基因組關聯分析(GWAS)」,顯著標準往往非常小,遠遠低於0.05;這非常合理,因為以人類來說,一共有60億個DNA位置,若是門檻設在0.05,偽陽性少說會造成幾百萬個誤判;若是門檻不設小一點,根本無法得到有意義的結果,遑論進一步研究。

實驗結果有沒有科學意義,取決於研究的整體脈絡、研究對象、問的問題、分析方法的設計,以及進一步的發展等等,而不是單一統計指標。在科學上,p值是幫助判斷的指標之一,絕非p值不顯著,結果就沒有意義。

舉個例子,有強烈論文壓力的博士班四年級生,實驗結果p值是0.087,離0.050沒差太遠,那麼合理判斷是:大方向應該對了,微調實驗細節或許有用(喂,不是直接改參數喔!),繼續拼拼看吧!可是如果p值是0.87?差這麼多,搞不好還沒吱吱射飛鏢準確,如此不趕快放棄這個實驗,另謀出路,被當北七怨不得人。而曠日費時又花錢的新藥研發,道理類似。

要讓分析有意義,關鍵在於要用來做什麼、怎麼用、解釋什麼,而不是顯著門檻多少。也有專家建議,下有意義的判斷,光看p值不夠,至少要加上信心區間(confidence intervals)輔助,可以參考以下兩篇文章:
《p 值的陷阱(上):p 值是什麼?又不是什麼?》[連結]
《p 值的陷阱(下):「摘櫻桃」問題》[連結]

假如硬性規定讓顯著門檻降低,例如改為0.001,有什麼問題?可能的負面影響是,帳面上失敗率會大增,降低偽陽性的同時,也殺掉許多有潛力的真陽性候選人;本來或許只要調整配方、步驟,就能見效的實驗,就這樣被過度嚴厲的標準在無形中扼殺了。更慘的是,標準更嚴苛,對資源不足的研究團隊影響更大,將對整個學界不利。

p值顯著門檻該不該降,並非是非黑白,而是考量不同的問題,它不適合定為一個死的標準,而該根據不同需求調整。這也是為什麼,不少主張更嚴格標準的支持者,是不做實驗、甚至是不在乎生物意義、有沒有因果關係,只接觸數據的統計學家;或是資源豐厚的大老。而許多質疑、反對者,是與有限預算奮鬥的艱苦人,以及重視生物意義,勝於玩弄數字的生物學家。

作者 / 寒波

Share this:

  • Facebook
  • Twitter
  • Email
  • More
  • Tumblr
  • Pocket
  • Pinterest
  • LinkedIn

Related

社會 統計
2017-09-24 寒波

Post navigation

柯先生,「媽媽牌」玩不得! → ← 從「籌建海巡艦艇發展計畫」看第二海軍

Related Posts

殲16攔截F-35畫面之後:真正決勝點不是單機性能,而是體系化聯合作戰與制電磁權

隨著中美兩強競爭態勢越趨強烈,兩軍在第一島鏈上的對峙、頻率快速升高(東海、南海),去年中共《央視》曝光解放軍海軍殲16戰機驅離美海軍F-35戰機的畫面,過程中殲16採取倒飛「座艙對座艙」的模式進行攔截。消息一出,殲16與F-35若發生空戰?最終的勝利者誰成為各方分析的重點。 然而,欲分析兩款戰機在空戰的表現,必須先從「戰機性能」與「作戰環境」分析。 首先,中共海軍的殲16戰機為一款重型戰機,在載彈量、雷達性能、武器配備確實不容小覷,在解放軍「體系化作戰」下,若和空警500預警機配合,確實能在空中形成作戰優勢(殲35匿蹤戰機因服役數量少,暫時不列入參考);但缺點在於,殲16屬於傳統四代半戰機,縱然能和其他機種進行配合,但受限於機體構型的限制仍舊無法在空戰環境中獲得絕對優勢。相對的,美軍F-35與F-18E/F戰機的配合,前者能發揮匿蹤優勢,後者能與空中預警機進行配合,獲得即時的戰場資訊以發動攻擊。 第二,在美國海軍的空戰構想中,F-35為匿蹤構型戰機,對於敵方雷達偵測有匿蹤的效果,無論是執行視距外空戰、聯合打擊,F-35將聯合F-18E/F超級大黃蜂戰機、E-2D空中預警機進行聯合打擊任務;F-35透過自身匿蹤優勢,在執行「視距外」空戰享有優勢,能透過機上的視距外飛彈,配合空中預警機取得目標,和F-18E/F戰機進行空戰任務時,因本身的載彈量優於F-35,故能攜帶相當數量的空對空飛彈,和F-35發揮聯合空戰的優勢。 第三,在空中電子戰的作戰構想上,美海軍能以F-35、F-18E/E、E-2D等機種組合,對上殲16、空警500,即使中共海軍派出殲16D電戰機,仍會遇上美海軍EA-18G電戰機的電磁干擾,從過往的作戰紀錄來論,美軍在電子戰、制電磁權的性能仍優於多數國家,縱然中共解放軍在電戰機的技術持續更新,但美軍在相關技術的發展/應用,其性能仍舊獲得各界認可。 美軍F-35偶發性的遇上中共殲16戰機,雖然最後遭到驅趕的命運,但若此斷言F-35戰機遜於殲16戰機的性能仍有失偏頗。在真實的作戰構想、環節,美海軍將以F-35匿蹤戰機、F-18E/F戰機、EA-18G電戰機與E-2D預警機進行編隊合作,已能應付潛在的海上(空中)威脅,而中共海軍在殲16戰機、殲16D電戰機、殲35匿蹤戰機與空警600預警機,因尚未部署到位,相關的作戰經驗居於劣勢,美軍F-35依舊能在「聯合作戰」上發揮的空戰優勢。 作者:宋磊

命運共同體的跨時空對話:台灣與以色列的戰略特質、國家安全與科技互惠分析

在全球地緣政治的棋盤上,台灣與以色列分別位於亞太與中東的關鍵樞紐。儘管兩國在地理距離、宗教文化與建國背景上截然不同,但在國際生存環境與發展軌跡上,卻展現出高度的相似性。這兩顆被強鄰環伺的「民主珍珠」,在面對生存威脅時的強韌適應力,成為了雙方進行深度科技與軍事合作的堅實基礎。透過深入頗析兩國的異同點,我們能更清晰地預見兩國未來的戰略價值。 從相近之處來看,台灣與以色列最顯著的共通點在於「極度的安全威脅」。以色列自建國以來便處於敵對國家的包圍中,經歷多次中東戰爭的洗禮;台灣則長期面臨中共的武力威脅,雙方都存在著「生存即勝利」的現實緊迫感。這種強大的外部壓力,促使兩國社會發展出極高的危機意識。此外,兩國皆缺乏天然資源,這迫使兩國不得不將「人才與技術」視為唯一的生存資本。這種環境孕育了特殊的創新文化,以色列擁有世界知名的創業精神,而台灣則打造了領先全球的半導體供應鏈,兩國皆成功將「生存壓力」轉化為「經濟競爭力」。 然而,兩國在發展脈絡上也存在明顯的差異。以色列的國家主權獲得國際社會普遍承認,並擁有強大的自主軍事投射能力與研發能量,其社會組織高度軍事化,徵兵制深入國民 DNA,形成了一套完整的軍民一體科研體系。相比之下,台灣的國際處境更為特殊且艱難,主權地位常因大國博弈而受到排擠。在經濟結構上,台灣以大規模、高效率的硬體製造與供應鏈管理見長,而以色列則專注於軟體開發、網路安全及原始技術的創新與突破。這種「硬體製造」與「軟體創新」的互補,正是兩國合作最迷人的潛力所在。 深入分析為何兩國在科技與軍事上的合作對未來發展至關重要,首先必須談到「不對稱作戰」的技術整合。以色列在無人機、反飛彈系統及數位戰場管理上擁有豐富的實戰經驗與領先技術,這些領域正是台灣應對台海潛在衝突、建立防禦韌性的核心需求。透過技術引進與共同開發,台灣能加速國防自主的進程;而對以色列而言,台灣強大的硬體生產與精密度製造能力,能將其前瞻性的軍事技術低成本、大規模地轉化為實體裝備,提升其在全球國防市場的競爭力。 在民用科技領域,兩國的合作更是未來數位轉型的引擎。以色列在人工智慧、網路安全及生物醫療領域的原始創新,需要與台灣的半導體能量接軌。當以色列的頂尖演算法遇上台灣的先進製程晶片,將能產出更強大的邊緣運算設備或醫療偵測工具。這種深度嵌入彼此供應鏈的合作,能有效分散因區域緊張帶來的斷鏈風險。兩國透過建立「民主韌性供應鏈」,不僅能確保關鍵技術不被威權國家壟斷,更能共同定義未來的科技標準。 總結來說,台灣與以色列的合作並非僅止於商務往來,更是一種基於「共同價值觀」與「生存邏輯」的戰略盟約。雙方在軍事科技的深度交流,能強化彼此在面對區域威脅時的嚇阻力;在高端科技的資源互補,則能鞏固兩國在國際分工中不可取代的地位。在動盪的 2026 年,這種跨越地理限制的強強聯手,將為兩國在充滿變數的國際秩序中,開創出更具韌性與主動性的未來。

從流亡到復國:猶太人的千年歷史處境與以色列建國之路全解析

猶太人的歷史,是人類文明史上最奇特且充滿苦難的篇章之一。從古代巴勒斯坦地區的起源,到長達兩千年的大流散,再到 1948 年以色列奇蹟般的建國,這個民族始終處於文明衝突與政治博弈的核心。要理解當代中東局勢,必須先釐清猶太人從古至今的歷史處境,以及他們與基督教文明、伊斯蘭文明之間錯綜複雜的關係。 1. 遠古起源與大流散的開端 猶太人的歷史最早可追溯至西元前 1200 年左右的迦南地。根據希伯來聖經與考古發現,猶太人在這片土地上建立過大衛王與所羅門王的強盛王國。然而,隨著巴比倫、波斯、希臘與羅馬帝國的相繼入侵,猶太人多次面臨亡國威脅。 關鍵的轉折發生在西元 70 年,羅馬帝國為鎮壓猶太起義,摧毀了耶路撒冷的第二聖殿,將猶太人驅逐出聖地。自此,猶太人展開了長達兩千年的「大流散(Diaspora)」,散落於歐洲、北非與中東各地。身為一個失去國土的民族,猶太人透過嚴謹的律法(妥拉)與宗教習俗保持民族認同,卻也因此在異鄉成為了永遠的「外來者」。 2. 宗教衝突的源頭:不相信耶穌是彌賽亞嗎? 許多人好奇,猶太人在歐洲歷史上長期遭受排擠與迫害(Anti-Semitism),是否與宗教教義有關?答案是肯定的,但層次非常複雜。 猶太教與基督教系出同源,基督教最初是猶太教的一個教派。兩者最大的分歧在於對「彌賽亞(救世主)」的定義。猶太人認為,彌賽亞應該是一位具備政治與軍事領袖特質的人物,他將在人間建立公正的王國、重建聖殿並帶來和平;而基督教則認為耶穌就是那位以受難形式救贖世人靈魂的彌賽亞。 在長達千年的歐洲中世紀,基督教會指責猶太人是「弒神者」(殺害耶穌的人),並因猶太人不願改宗而將其視為頑固與墮落。這種宗教上的仇恨,導致猶太人在社會上受到種種限制,如禁止擁有土地、只能從事放債等商業活動。這種宗教排擠後來演變成長期的集體偏見,為近現代的大規模迫害埋下了導火線。 3. 錫安主義的興起與大屠殺的慘痛 19 世紀末,歐洲民族主義高漲,猶太人意識到即使他們在經濟上取得成功,卻始終無法真正融入當地社會。這種不安感促成了「錫安主義(Zionism,猶太復國主義)」的誕生,主張猶太人必須回到祖先的土地——巴勒斯坦,建立屬於自己的國家。 第二次世界大戰期間,納粹德國對猶太人進行了系統性的種族滅絕(Holocaust),造成超過 600 萬猶太人喪生。這場慘絕人寰的悲劇,讓國際社會深刻意識到,若不讓猶太人擁有獨立的主權國家,他們的生存將永遠面臨威脅。 4. 以色列建國與地緣政治的碰撞 1948 年 5 月 14 […]

美伊戰爭會爆發嗎?川普限期核協議、軍力集結與伊朗內部動盪下的衝突風險解析

在伊朗伊斯蘭政權月前殘酷鎮壓抗議民眾,引發國際震驚、譴責之後,外界認為美國可能會軍事介入,如今這個預測極有可能成真。 過去數個星期以來,川普的女婿庫許納(Jared Kushner)與外交特使魏科夫(Steve Witkoff)代表美國方面和伊朗進行多次祕密談判,而伊朗方面仍虛以委蛇的情況之下,日前美國總統川普表明只給伊朗十天的期限重回談判桌簽署核協議,在核武、飛彈等地緣威脅問題交出讓美國方面滿意的條件,否則將命令美軍發動攻擊。同一時間美軍正大舉集結中東,準備在伊朗無意讓步後動手,而去年空襲伊朗的以色列也積極動員,美以聯手攻擊伊朗的態勢已然成形。 伊朗伊斯蘭政權為何在這個對它僅次於兩伊戰爭的政權危機的當下,仍然冥頑不靈,不肯認真的作出實質讓步?主要是伊朗伊斯蘭政權從過去歷任美國政府交涉核武問題的經驗中,認定美國不敢跟它冒著大規模衝突的風險強迫它讓步,因為大規模衝突帶來的油價上漲及經濟衝擊並非美國所能承受,川普政府也不例外;再者,在屠殺抗議民眾、經濟困境無解的情況下,伊朗伊斯蘭政權的核心革命衛隊更堅持要保留,甚至加速開發核武、長程飛彈,作為嚇阻美國、以色列趁虛而入的關鍵武器,如果放棄核武、飛彈,伊朗伊斯蘭政權勢必將步上伊拉克海珊、利比亞格達費的後塵,遭到內外夾擊而崩潰。 對於川普政府來說,在目前這個時刻要求伊朗放棄核武、飛彈,從美國及中東盟邦沙烏地阿拉伯、以色列等國看來,是再好不過的時機,此時的伊朗伊斯蘭政權已經喪失民心、去年以色列重創防空系統及軍政高層的打擊尚未恢復,極限施壓乃至一定程度的外科手術攻擊,能夠達成外交目標迫使伊朗讓步,甚至可能讓伊朗伊斯蘭政權如同委內瑞拉那樣,在最高領袖哈梅內衣更迭(被殺或逃亡他國)之後轉向親美,有助於美國的地緣政治佈局。 綜合前述情況看來,在伊朗伊斯蘭政權無意真正讓步,以及川普政府持強硬態度持續施壓之下,近日內發生如去年美、以輪番空襲伊朗的有限衝突的可能性非常高,但是困獸猶鬥的伊朗伊斯蘭政權是否會冒險擴大衝突,引發難以控制的區域性戰爭,是難以預料的變數。 對於台灣來說,面對極有可能爆發的美伊衝突,除了油價上漲的經濟影響之外,更該關注的是中國的動作,習近平是否可能以和事佬姿態介入,以此向川普政府在台海問題上「討人情」?還是趁此機會擴大對台日的灰色地帶侵擾?種種可能變化值得台灣各界持續關注並未雨綢繆。 作者:局外人

Recent Posts

殲16攔截F-35畫面之後:真正決勝點不是單機性能,而是體系化聯合作戰與制電磁權

殲16攔截F-35畫面之後:真正決勝點不是單機性能,而是體系化聯合作戰與制電磁權

隨著中美兩強競爭態勢越趨強烈,兩軍在第一島鏈上的對峙、頻率快速升高(東海、南海),去年中共《央視》曝光解放軍海軍殲16戰機驅離美海軍F-35戰機的畫面,過程中殲16採取倒飛「座艙對座艙」的模式進行攔截。消息一出,殲16與F-35若發生空戰?最終的勝利者誰成為各方分析的重點。 然而,欲分析兩款戰機在空戰的表現,必須先從「戰機性能」與「作戰環境」分析。 [...]

More Info
命運共同體的跨時空對話:台灣與以色列的戰略特質、國家安全與科技互惠分析

命運共同體的跨時空對話:台灣與以色列的戰略特質、國家安全與科技互惠分析

在全球地緣政治的棋盤上,台灣與以色列分別位於亞太與中東的關鍵樞紐。儘管兩國在地理距離、宗教文化與建國背景上截然不同,但在國際生存環境與發展軌跡上,卻展現出高度的相似性。這兩顆被強鄰環伺的「民主珍珠」,在面對生存威脅時的強韌適應力,成為了雙方進行深度科技與軍事合作的堅實基礎。透過深入頗析兩國的異同點,我們能更清晰地預見兩國未來的戰略價值。 [...]

More Info
從流亡到復國:猶太人的千年歷史處境與以色列建國之路全解析

從流亡到復國:猶太人的千年歷史處境與以色列建國之路全解析

猶太人的歷史,是人類文明史上最奇特且充滿苦難的篇章之一。從古代巴勒斯坦地區的起源,到長達兩千年的大流散,再到 1948 年以色列奇蹟般的建國,這個民族始終處於文明衝突與政治博弈的核心。要理解當代中東局勢,必須先釐清猶太人從古至今的歷史處境,以及他們與基督教文明、伊斯蘭文明之間錯綜複雜的關係。 1. 遠古起源與大流散的開端 猶太人的歷史最早可追溯至西元前 1200 [...]

More Info
美伊戰爭會爆發嗎?川普限期核協議、軍力集結與伊朗內部動盪下的衝突風險解析

美伊戰爭會爆發嗎?川普限期核協議、軍力集結與伊朗內部動盪下的衝突風險解析

在伊朗伊斯蘭政權月前殘酷鎮壓抗議民眾,引發國際震驚、譴責之後,外界認為美國可能會軍事介入,如今這個預測極有可能成真。 過去數個星期以來,川普的女婿庫許納(Jared Kushner)與外交特使魏科夫(Steve [...]

More Info

搜尋

精選文章

川習會的中美矛盾是戰略,不是貿易!

2017-04-08 韓非

八仙樂園爆炸案:缺乏常識造成的災難

2015-06-28 異想

彰化縣民輪替後的哀與愁

2016-03-06 許家瑋

新文明病:儲物症(Hoarding disorder)似正在增加

2015-04-13 楊庸一

訂閱本站

輸入你的電子郵件訂閱新文章並接收新通知。

Powered by WordPress | theme Dream Way
Powered by WordPress | theme Dream Way