指數(shù)分布中位數(shù)

一組數(shù)據(jù)的中值是中間點(diǎn),其中恰好一半的數(shù)據(jù)值小于或等于中值。以類似的方式,我們可以考慮連續(xù)概率分布的中位數(shù),而不是在一組數(shù)據(jù)中找到中間值,而是以不同的方式找到分布的中間值。

概率密度函數(shù)下的總面積為1,代表****,結(jié)果,其中一半可以表示為一半或50%。數(shù)學(xué)統(tǒng)計(jì)的一個(gè)大想法是概率由密度函數(shù)曲線下的面積表示,該面積由積分計(jì)算,因此連續(xù)分布的中位數(shù)是實(shí)數(shù)線上的點(diǎn),其中恰好一半面積位于左側(cè)。

以下不恰當(dāng)?shù)姆e分可以更簡(jiǎn)潔地說明這一點(diǎn)。具有密度函數(shù)fX)的連續(xù)隨機(jī)變量X的中值是值M,使得:

mfx05=m -f疫情期間健康小知識(shí)xdx

指數(shù)分布的中位數(shù)

我們現(xiàn)在計(jì)算指數(shù)分布Exp(A)的中位數(shù)。具有這種分布的隨機(jī)變量具有密度函數(shù)fx)=e-x/A/A對(duì)于x任何非負(fù)實(shí)數(shù)。該函數(shù)還包含數(shù)學(xué)常數(shù)154 e 155,近似值y等于2.71828。

由于對(duì)于任何負(fù)值x,概率密度函數(shù)為零,我們必須做的就是積分以下并求解M:

<165>0.5

由于積分∫e-x/A/A dx=-e-x/A,結(jié)果是

0.5&#6

這意味著0.5=e-M/A,并且在取等式兩邊的自然對(duì)數(shù)之后,我們有:

199升

由于1/2=2-1,根據(jù)對(duì)數(shù)的屬性,我們寫:

將兩側(cè)乘以A給出了中值M=A ln2的結(jié)果。

統(tǒng)計(jì)中位數(shù)平均不平等

應(yīng)該提到這個(gè)結(jié)果的一個(gè)結(jié)果:指數(shù)分布Exp(A)的平均值是A,并且由于ln2小于1,因此乘積Aln2小于A.這意味著指數(shù)的中位數(shù)分布小于平均值。

如果我們考慮概率密度函數(shù)的圖,這是有意義的。由于尾巴長(zhǎng),這種分布向右傾斜。很多時(shí)候,當(dāng)分布向右傾斜時(shí),平均值在中位數(shù)的右側(cè)。

就統(tǒng)計(jì)分析而言,這意味著我們通常可以預(yù)測(cè),鑒于數(shù)據(jù)向右傾斜的概率,平均值和中位數(shù)并不直接相關(guān),這可以表示為稱為Chebyshev&#的中值平均不等式證明。39;s不平等。

例如,考慮一個(gè)數(shù)據(jù)集,假設(shè)一個(gè)人在10小時(shí)內(nèi)總共收到30位訪客,其中訪客的平均等待時(shí)間為20分鐘,而這組數(shù)據(jù)可能表明中位等待時(shí)間將會(huì)在20到30分鐘之間如果超過一半的游客在頭五個(gè)小時(shí)內(nèi)來到。

311