如何在統(tǒng)計中找到自由度
許多統(tǒng)計推斷問題要求我們找到自由度的數(shù)量。自由度數(shù)從無限多中選擇單個概率分布。在置信區(qū)間的計算和假設(shè)檢驗的工作中,這一步驟是一個經(jīng)常被忽視但至關(guān)重要的細節(jié)。
自由度數(shù)沒有一個通用公式。但是,在推論統(tǒng)計中,每種類型的過程都使用特定的公式。換句話說,我們正在進行的設(shè)置將決定自由度的數(shù)量。接下來是一些最常見的推理過程的部分列表,以及每種情況下使用的自由度數(shù)。
Standard Normal Distribution
列出了涉及標(biāo)準(zhǔn)正態(tài)分布的程序的完整性并澄清了一些誤解。這些程序不要求我們找到自由度的數(shù)量。原因是存在單個標(biāo)準(zhǔn)正態(tài)分布。這些類型的程序包括已知人口標(biāo)準(zhǔn)偏差時涉及人口平均數(shù)的程序,以及涉及人口比例的程序。
One Sample T Procedures
有時統(tǒng)計實踐要求我們使用學(xué)生的t分布。對于這些程序,例如處理人口標(biāo)準(zhǔn)偏差未知的人口均值的程序,自由度數(shù)比樣本量少一個。因此,如果樣本大小為n,則存在n-1個自由度。
T程序與配對數(shù)據(jù)
很多時候?qū)?shù)據(jù)視為配對是有意義的。配對通常是由于我們對中第一個和第二個值之間的連接而執(zhí)行的。我們會在測量之前和之后配對很多次。我們的pai樣本紅色數(shù)據(jù)不是獨立的;但是,每對之間的差異是獨立的。因此,如果樣本具有總共n對數(shù)據(jù)點(總共2n值),則存在n-1個自由度。
兩個獨立人群的T程序
對于這些類型的問題,我們?nèi)栽谑褂胻分布。這次是我們每個人口的樣本。盡管**將這兩個樣本的大小相同,但對于我們的統(tǒng)計程序而言這并不是必需的。因此,我們可以有兩個大小分別為n和n的樣本家庭安全小常識。有兩種方法可以確定自由度數(shù)。更準(zhǔn)確的方法是使用韋爾奇公式,這是一個計算繁瑣的公式,涉及樣本量和樣本標(biāo)準(zhǔn)偏差。另一種方法,稱為保守近似,可用于快速估計自由度。這只是兩個數(shù)字n-1和n-1中的較小者。
卡方獨立
卡方檢驗的一個用途是查看兩個分類變量(每個變量都有幾個級別)是否表現(xiàn)出獨立性。關(guān)于這些變量的信息記錄在具有r行和c列的雙向表中。自由度數(shù)是乘積(r-1)(c-1)。
卡方擬合優(yōu)度
卡方擬合優(yōu)度從單個分類變量開始,總共n個級別。我們測試這個變量與預(yù)定模型匹配的假設(shè)。自由度的數(shù)量比等級的數(shù)量少一個。換句話說,有n-1個自由度。
單因素方差分析
單因素方差分析(ANOVA)允許我們在幾個群體之間進行比較,消除了多重成對假設(shè)的需要是測試。由于測試要求我們測量幾個組之間的變化以及每個組內(nèi)的變化,因此我們最終得到兩個自由度。用于單因素方差分析的F統(tǒng)計量是一個分?jǐn)?shù)。分子和分母各自具有自由度。令c為組數(shù),n為數(shù)據(jù)值總數(shù)。分子的自由度數(shù)小于組數(shù),或c-1。分母的自由度數(shù)是數(shù)據(jù)值的總數(shù)減去組數(shù),或n-c。
很明顯,我們必須非常小心地知道我們正在使用哪種推理程序。這些知識將告訴我們正確的使用自由度數(shù)量。