科普類文章_辛普森的統(tǒng)計(jì)悖論概述

矛盾的是表面上似乎矛盾的陳述或現(xiàn)象。悖論有助于揭示看似邪惡的表面之下的根本事實(shí)。在統(tǒng)計(jì)領(lǐng)域,Simpson's悖論證明了組合來自多個(gè)群體的數(shù)據(jù)會(huì)產(chǎn)生什么樣的問題。

有了所有數(shù)據(jù),我們需要謹(jǐn)慎行事。它來自哪里?它是如何獲得的?它真的在說什么?這些都是我們在提供數(shù)據(jù)時(shí)應(yīng)該提出的好問題。Simpson'悖論的非常令人驚訝的案例向我們表明,有時(shí)數(shù)據(jù)似乎在說什么并不是真的。

悖論概述

假設(shè)我們正在觀察幾個(gè)組,并為這些組中的每一個(gè)建立關(guān)系或關(guān)聯(lián)。辛普森的悖論說,當(dāng)我們將所有群體組合科普類文章在一起并以匯總形式查看數(shù)據(jù)時(shí),我們之前注意到的相關(guān)性可能會(huì)逆轉(zhuǎn)。這通常是由于尚未考慮的潛伏變量,但有時(shí)是由于數(shù)據(jù)的數(shù)值。

示例

為了更清楚地理解Simpson's悖論,讓's看看下面的例子。在某家醫(yī)院,有兩名外科醫(yī)生。外科醫(yī)生A對100名患者進(jìn)行手術(shù),95名患者存活。外科醫(yī)生B對80名患者進(jìn)行手術(shù),72名患者存活。我們正在考慮在這家醫(yī)院進(jìn)行手術(shù),并通過手術(shù)生活是非常重要的。我們想選擇兩位外科醫(yī)生中**的一位。

科普_1

我們查看數(shù)據(jù)并用它來計(jì)算外科醫(yī)生A's患者在手術(shù)中存活的百分比,并將其與外科醫(yī)生B患者的***進(jìn)依科普行比較。

  • 100名患者中有95名患者在外科醫(yī)生A中存活,因此95/100=95%存活。
  • 80名患者中有72名患者在外科醫(yī)生B中存活,因此72/80=90%存活。

從這個(gè)分析中,我們應(yīng)該選擇哪個(gè)外科醫(yī)生來治療我們?看起來外科醫(yī)生A的**更安全。但這真的是真的嗎?

如果我們對數(shù)據(jù)做了一些進(jìn)一步的研究,發(fā)現(xiàn)最初醫(yī)院已經(jīng)考慮了兩種不同類型的手術(shù),但隨后將所有數(shù)據(jù)匯總在一起報(bào)告給每位外科醫(yī)生。并非所有的手術(shù)都是平等的,有些被認(rèn)為是高風(fēng)險(xiǎn)的緊急手術(shù),而另一些則是事先安排的更為常規(guī)的手術(shù)。

在外科醫(yī)生A治療的100名患者中,50名患有高風(fēng)險(xiǎn),其中3名死亡。其他50人被認(rèn)為是例行的,其中2人死亡。這意味著,對于常規(guī)手術(shù),由外科醫(yī)生a治療的患者具有48/50=96%的***。

現(xiàn)在我們更仔細(xì)地查看外科醫(yī)生B的數(shù)據(jù),發(fā)現(xiàn)80名患者中有40名患有高風(fēng)險(xiǎn),其中7名死亡。其他40人是例行的,只有一人死亡。這意味著患者對于外科醫(yī)生的常規(guī)手術(shù)具有39/40=97.5%的***B。

現(xiàn)在哪個(gè)外科醫(yī)生看起來更好?如果你的手術(shù)是常規(guī)手術(shù),那么外科醫(yī)生B實(shí)際上是更好的外科醫(yī)生。如果我們看一下外科醫(yī)生進(jìn)行的所有手術(shù),A會(huì)更好。這是非常違反直覺的。在這種情況下,手術(shù)類型的潛伏變量會(huì)影響外科醫(yī)生的綜合數(shù)據(jù)。

辛普森的歷史's悖論

辛普森的悖論以愛德華·辛普森(Edward Simpson)命名,愛德華·辛普森(Edward Simpson)在1951年的論文&##34;列聯(lián)表中相互作用的解釋"皇家統(tǒng)計(jì)學(xué)會(huì)雜志。皮爾遜和尤爾每個(gè)人都比辛普森早半個(gè)世紀(jì)觀察到類似的悖論,所以辛普森的悖論有時(shí)也被稱為辛普森尤爾效應(yīng)。

悖論在sp等不同領(lǐng)域有許多廣泛的應(yīng)用ORT統(tǒng)計(jì)和失業(yè)數(shù)據(jù)。任何數(shù)據(jù)匯總的時(shí)候,請注意這個(gè)悖論的出現(xiàn)。