Alpha和P值有什么區(qū)別?
在進(jìn)行顯著性檢驗(yàn)或假設(shè)檢驗(yàn)時(shí),有兩個(gè)容易混淆的數(shù)字。這些數(shù)字很容易混淆,因?yàn)樗鼈兌际橇愕揭恢g的數(shù)字,并且都是概率。一個(gè)數(shù)字稱為測試統(tǒng)計(jì)量的p值。另一個(gè)感興趣的數(shù)字是顯著性水平或α。我們將檢查這兩個(gè)概率并確定它們之間的差異。
Alpha Values
數(shù)字alpha是我們測量p值的閾值。它告訴我們極端觀察結(jié)果必須是如何拒絕顯著性檢驗(yàn)的零假設(shè)。
alpha的值與我們測試的置信度相關(guān)聯(lián)。以下列出了一些與alpha相關(guān)值的置信度:
- 對(duì)于置信度為90%的結(jié)果,alpha的值為1-0.90=0.10。
- 對(duì)于置信度為95%的結(jié)果,alpha的值為1-0.95=0.05。
- 對(duì)于置信度為99%的結(jié)果,alpha的值為1-0.99=0.01。
- 通常,對(duì)于置信度為C%的結(jié)果,alpha的值為1-C/100。
雖然在理論和實(shí)踐中許多數(shù)字可以用于alpha,但最常用的是0.05。其原因在于共識(shí)表明這個(gè)級(jí)別在許多情況下是合適的,并且歷史上它已被接受為標(biāo)準(zhǔn)。但是,在許多情況下,應(yīng)該使用較小的alpha值。沒有一個(gè)alpha值總是決定統(tǒng)計(jì)顯著性。
alpha值給我們一個(gè)類型I錯(cuò)誤的概率。當(dāng)我們拒絕實(shí)際為真的零假設(shè)時(shí),會(huì)發(fā)生I型錯(cuò)誤。因此,從長遠(yuǎn)來看,對(duì)于顯著性水平為0.05=1/20的檢驗(yàn),真正的零假設(shè)將每20次被拒絕一次。
P-value
作為顯著性檢驗(yàn)一部分的另一個(gè)數(shù)字是p值。p值也是一個(gè)概率,但它來自與alpha不同的來源。每個(gè)測試統(tǒng)計(jì)量都有相應(yīng)的概率或p值。該值是假設(shè)零假設(shè)為真,則觀察到的統(tǒng)計(jì)量僅偶然發(fā)生的概率。
由于存在許多不同的測試統(tǒng)計(jì)信息,因此有許多不同的方法可以找到p值。在某些情況下,我們需要知道人口的概率分布
測試統(tǒng)計(jì)量的p值是一種說明該統(tǒng)計(jì)量對(duì)我們的樣本數(shù)據(jù)有多極端的方式。p值越小,觀察到的樣品越不可能。
P值與Alpha
之間的差異為了確定觀察結(jié)果是否具有統(tǒng)計(jì)學(xué)意義,我們比較了α值和p值。出現(xiàn)了兩種可能性:
- p值小于或等于alpha。在這種情況下,我們拒絕零假設(shè)。發(fā)生這種情況時(shí),我們說結(jié)果具有統(tǒng)計(jì)意義。換句話說,我們可以合理地確定,除了偶然之外,還有其他事情可以給我們一個(gè)觀察到的樣本。
- p值大于alpha。在這種情況下,我們不能拒絕零假設(shè)。發(fā)生這種情況時(shí),我們說結(jié)果沒有統(tǒng)計(jì)學(xué)意義。換句話說,我們可以合理地確定我們觀察到的數(shù)據(jù)可以僅憑偶然性來解釋。
上述含義是α值越小,聲稱結(jié)果具有統(tǒng)計(jì)學(xué)意義就越困難。另一方面,alpha的值越大,越容易聲稱結(jié)果具有統(tǒng)計(jì)顯著性。然而,與此相結(jié)合的是,我們觀察到的可能歸因于機(jī)會(huì)的可能性更高。
健康知識(shí)講座圖片