置信區(qū)間在推理統(tǒng)計中的應(yīng)用
推理統(tǒng)計數(shù)據(jù)的名稱來源于此統(tǒng)計分支中發(fā)生的事情。推理統(tǒng)計不是簡單地描述一組數(shù)據(jù),而是試圖根據(jù)統(tǒng)計樣本推斷出有關(guān)人口的某些信息。推論統(tǒng)計中的一個具體目標(biāo)涉及確定未知總體參數(shù)的值。我們用來估計這個參數(shù)的值的范圍稱為置信區(qū)間。
置信區(qū)間的形式
置信區(qū)間由兩部分組成。第一部分是人口參數(shù)的估計。我們通過使用簡單的隨機樣本獲得此估計值。從這個樣本中,我們計算出與我們希望估計的參數(shù)相對應(yīng)的統(tǒng)計量。例如,如果我們對美國所有一年級學(xué)生的平均身高感興趣,我們將使用美國一年級學(xué)生的簡單隨機樣本,測量所有這些樣本,然后計算樣本的平均身高。
置信區(qū)間的第二部分是誤差范圍。這是必要的,因為我們單獨的估計可能與總體參數(shù)的真實值不同。為了允許參數(shù)的其他潛在值,我們需要生成一系列數(shù)字。誤差范圍是這樣做的,每個置信區(qū)間都有以下形式:
估計±誤差幅度
估計值位于區(qū)間的中心,然后我們從該估計值中減去并添加誤差范圍,以獲得參數(shù)的值范圍。
置信水平
附加到每個置信區(qū)間是一個信心水平。這是一個概率或百分比,表明我們應(yīng)該歸因于我們的置信區(qū)間的確定性。如果情況的所有其他方面相同,則置信水平越高,置信區(qū)間越寬。
這種信心水平可能會導(dǎo)致一些混亂。這不是關(guān)于抽樣程序或人口的陳述。相反,它表明了建立置信區(qū)間的過程的成功。例如,從長遠來看,置信度為80%的置信區(qū)間將每五次錯過真實的總體參數(shù)。
從理論上講,從零到一的任何數(shù)字都可以用于置信水平。在實踐中,90%,95%和99%都是共同的信心水平。
誤差范圍
置信水平的誤差幅度由幾個因素決定。我們可以通過檢查誤差范圍的公式來看到這一點。錯誤范圍的形式是:
誤差范圍=(置信水平統(tǒng)計)*(標(biāo)準(zhǔn)偏差/誤差)
置信水平的統(tǒng)計量取決于使用何種概率分布以及我們選擇的置信水平。例如,如果C是我們的置信水平并且我們使用正態(tài)分布,則C優(yōu)生健康知識是曲線下面積介于-z*至z*。這個數(shù)字z*是我們的誤差范圍公式中的數(shù)字。
標(biāo)準(zhǔn)偏差或標(biāo)準(zhǔn)誤差
我們的誤差范圍所需的另一個術(shù)語是標(biāo)準(zhǔn)偏差或標(biāo)準(zhǔn)誤差。我們正在使用的分布的標(biāo)準(zhǔn)偏差在這里是**。但是,通常來自群體的參數(shù)是未知的。在實踐中形成置信區(qū)間時,這個數(shù)字通常不可用。
為了解決知道標(biāo)準(zhǔn)偏差的這種不確定性,我們改為使用標(biāo)準(zhǔn)誤差。對應(yīng)于標(biāo)準(zhǔn)偏差的標(biāo)準(zhǔn)誤差是該標(biāo)準(zhǔn)偏差的估計值。標(biāo)準(zhǔn)錯誤如此強大的原因在于它是從用于計算我們估計值的簡單隨機樣本計算得出。沒有額外的信息是必要的,因為樣本為我們做了所有的估計。
不同的置信區(qū)間
有各種不同的情況需要置信區(qū)間。這些置信區(qū)間用于估計許多不同的參數(shù)。雖然這些方面不同,但所有這些置信區(qū)間都以相同的整體格式統(tǒng)一起來。一些常見的置信區(qū)間是人口平均數(shù),人口方差,人口比例,兩種人口均值的差異和兩種人口比例的差異。