Simpson-paradoxon

A Simpson-paradoxon egy statisztikai paradoxon. Nevét Edward H. Simpson brit statisztikusról kapta, aki 1951-ben írta le először. Karl Pearson statisztikus 1899-ben írt le egy nagyon hasonló hatást.- Udny Yule leírása 1903-ból származik. Néha Yule-Simpson-effektusnak is nevezik. Amikor csoportok statisztikai pontszámát nézzük, ezek a pontszámok változhatnak attól függően, hogy a csoportokat egyenként vizsgáljuk, vagy egy nagyobb csoportba vonjuk össze őket. Ez az eset gyakran előfordul a társadalomtudományokban és az orvosi statisztikában. Összezavarhatja az embereket, ha gyakorisági adatokat használnak egy ok-okozati összefüggés magyarázatára. A paradoxon más elnevezései közé tartozik a fordított paradoxon és az összeolvadási paradoxon.

Példa: Vesekő kezelése

Ez egy valós példa egy orvosi tanulmányból, amely a vesekő két kezelésének sikerességét hasonlítja össze.

A táblázat a sikerességi arányokat és a kezelések számát mutatja a kis és nagy veseköveket érintő kezelések esetében, ahol az A kezelés az összes nyílt eljárást, a B kezelés pedig a perkután nefrolitotómiát foglalja magában:

A kezelés

B kezelés

siker

hiba

siker

hiba

Kis kövek

1. csoport

2. csoport

a betegek száma

81

6

234

36

93%

7%

87%

13%

Nagy kövek

3. csoport

4. csoport

a betegek száma

192

71

55

25

73%

27%

69%

31%

Mindkettő

1+3 csoport

2+4 csoport

a betegek száma

273

77

289

61

78%

22%

83%

17%

A paradox következtetés az, hogy az A kezelés hatékonyabb, ha kis köveken, és akkor is, ha nagy köveken alkalmazzák, ugyanakkor a B kezelés hatékonyabb, ha mindkét méretet egyszerre vesszük figyelembe. Ebben a példában nem volt ismert, hogy a vesekő mérete befolyásolja az eredményt. Ezt a statisztikában rejtett változónak (vagy lappangó változónak) nevezik.

Azt, hogy melyik kezelés tekinthető jobbnak, két arány (sikerek/összesség) egyenlőtlensége határozza meg. Az arányok közötti egyenlőtlenség megfordulása, amely a Simpson-paradoxont hozza létre, azért történik, mert két hatás együttesen jelentkezik:

  1. A lappangó változó figyelmen kívül hagyása esetén egyesített csoportok mérete nagyon eltérő. Az orvosok hajlamosak a súlyos eseteket (nagy kövek) jobb kezelésben részesíteni (A), az enyhébb eseteket (kis kövek) pedig rosszabb kezelésben (B). Ezért az összegeket a hármas és a kettes csoport uralja, és nem a két sokkal kisebb, egyes és négyes csoport.
  2. A lappangó változónak nagy hatása van az arányokra, azaz a sikerességi arányt erősebben befolyásolja az eset súlyossága, mint a kezelés megválasztása. Ezért a nagy kövekkel rendelkező betegek A kezelést alkalmazó csoportja (hármas csoport) rosszabbul teljesít, mint a kis kövekkel rendelkező betegek csoportja, még akkor is, ha utóbbiak az alsóbbrendű B kezelést alkalmazták (kettes csoport).

AlegsaOnline.com - 2020 / 2023 - License CC3