Simpson-paradoxon
A Simpson-paradoxon egy statisztikai paradoxon. Nevét Edward H. Simpson brit statisztikusról kapta, aki 1951-ben írta le először. Karl Pearson statisztikus 1899-ben írt le egy nagyon hasonló hatást.- Udny Yule leírása 1903-ból származik. Néha Yule-Simpson-effektusnak is nevezik. Amikor csoportok statisztikai pontszámát nézzük, ezek a pontszámok változhatnak attól függően, hogy a csoportokat egyenként vizsgáljuk, vagy egy nagyobb csoportba vonjuk össze őket. Ez az eset gyakran előfordul a társadalomtudományokban és az orvosi statisztikában. Összezavarhatja az embereket, ha gyakorisági adatokat használnak egy ok-okozati összefüggés magyarázatára. A paradoxon más elnevezései közé tartozik a fordított paradoxon és az összeolvadási paradoxon.
Példa: Vesekő kezelése
Ez egy valós példa egy orvosi tanulmányból, amely a vesekő két kezelésének sikerességét hasonlítja össze.
A táblázat a sikerességi arányokat és a kezelések számát mutatja a kis és nagy veseköveket érintő kezelések esetében, ahol az A kezelés az összes nyílt eljárást, a B kezelés pedig a perkután nefrolitotómiát foglalja magában:
A kezelés | B kezelés | |||
siker | hiba | siker | hiba | |
Kis kövek | 1. csoport | 2. csoport | ||
a betegek száma | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Nagy kövek | 3. csoport | 4. csoport | ||
a betegek száma | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Mindkettő | 1+3 csoport | 2+4 csoport | ||
a betegek száma | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
A paradox következtetés az, hogy az A kezelés hatékonyabb, ha kis köveken, és akkor is, ha nagy köveken alkalmazzák, ugyanakkor a B kezelés hatékonyabb, ha mindkét méretet egyszerre vesszük figyelembe. Ebben a példában nem volt ismert, hogy a vesekő mérete befolyásolja az eredményt. Ezt a statisztikában rejtett változónak (vagy lappangó változónak) nevezik.
Azt, hogy melyik kezelés tekinthető jobbnak, két arány (sikerek/összesség) egyenlőtlensége határozza meg. Az arányok közötti egyenlőtlenség megfordulása, amely a Simpson-paradoxont hozza létre, azért történik, mert két hatás együttesen jelentkezik:
- A lappangó változó figyelmen kívül hagyása esetén egyesített csoportok mérete nagyon eltérő. Az orvosok hajlamosak a súlyos eseteket (nagy kövek) jobb kezelésben részesíteni (A), az enyhébb eseteket (kis kövek) pedig rosszabb kezelésben (B). Ezért az összegeket a hármas és a kettes csoport uralja, és nem a két sokkal kisebb, egyes és négyes csoport.
- A lappangó változónak nagy hatása van az arányokra, azaz a sikerességi arányt erősebben befolyásolja az eset súlyossága, mint a kezelés megválasztása. Ezért a nagy kövekkel rendelkező betegek A kezelést alkalmazó csoportja (hármas csoport) rosszabbul teljesít, mint a kis kövekkel rendelkező betegek csoportja, még akkor is, ha utóbbiak az alsóbbrendű B kezelést alkalmazták (kettes csoport).