Simpson-paradoxon

A Simpson-paradoxon egy statisztikai paradoxon. Nevét Edward H. Simpson brit statisztikusról kapta, aki 1951-ben írta le először. Karl Pearson statisztikus 1899-ben írt le egy nagyon hasonló hatást.- Udny Yule leírása 1903-ból származik. Néha Yule-Simpson-effektusnak is nevezik. Amikor csoportok statisztikai pontszámát nézzük, ezek a pontszámok változhatnak attól függően, hogy a csoportokat egyenként vizsgáljuk, vagy egy nagyobb csoportba vonjuk össze őket. Ez az eset gyakran előfordul a társadalomtudományokban és az orvosi statisztikában. Összezavarhatja az embereket, ha gyakorisági adatokat használnak egy ok-okozati összefüggés magyarázatára. A paradoxon más elnevezései közé tartozik a fordított paradoxon és az összeolvadási paradoxon.

Példa: Vesekő kezelése

Ez egy valós példa egy orvosi tanulmányból, amely a vesekő két kezelésének sikerességét hasonlítja össze.

A táblázat a sikerességi arányokat és a kezelések számát mutatja a kis és nagy veseköveket érintő kezelések esetében, ahol az A kezelés az összes nyílt eljárást, a B kezelés pedig a perkután nefrolitotómiát foglalja magában:

	A kezelés		B kezelés
	siker	hiba	siker	hiba
Kis kövek	1. csoport		2. csoport
a betegek száma	81	6	234	36
	93%	7%	87%	13%
Nagy kövek	3. csoport		4. csoport
a betegek száma	192	71	55	25
	73%	27%	69%	31%
Mindkettő	1+3 csoport		2+4 csoport
a betegek száma	273	77	289	61
	78%	22%	83%	17%

A paradox következtetés az, hogy az A kezelés hatékonyabb, ha kis köveken, és akkor is, ha nagy köveken alkalmazzák, ugyanakkor a B kezelés hatékonyabb, ha mindkét méretet egyszerre vesszük figyelembe. Ebben a példában nem volt ismert, hogy a vesekő mérete befolyásolja az eredményt. Ezt a statisztikában rejtett változónak (vagy lappangó változónak) nevezik.

Azt, hogy melyik kezelés tekinthető jobbnak, két arány (sikerek/összesség) egyenlőtlensége határozza meg. Az arányok közötti egyenlőtlenség megfordulása, amely a Simpson-paradoxont hozza létre, azért történik, mert két hatás együttesen jelentkezik:

A lappangó változó figyelmen kívül hagyása esetén egyesített csoportok mérete nagyon eltérő. Az orvosok hajlamosak a súlyos eseteket (nagy kövek) jobb kezelésben részesíteni (A), az enyhébb eseteket (kis kövek) pedig rosszabb kezelésben (B). Ezért az összegeket a hármas és a kettes csoport uralja, és nem a két sokkal kisebb, egyes és négyes csoport.
A lappangó változónak nagy hatása van az arányokra, azaz a sikerességi arányt erősebben befolyásolja az eset súlyossága, mint a kezelés megválasztása. Ezért a nagy kövekkel rendelkező betegek A kezelést alkalmazó csoportja (hármas csoport) rosszabbul teljesít, mint a kis kövekkel rendelkező betegek csoportja, még akkor is, ha utóbbiak az alsóbbrendű B kezelést alkalmazták (kettes csoport).

Simpson-paradoxon

Példa: Vesekő kezelése

Keresés betűvel