A nagy számok törvénye (LLN) egy statisztikai tétel. Tekintsünk valamilyen folyamatot, amelyben véletlenszerű eredmények fordulnak elő. Például egy véletlen változót ismételten megfigyelünk. Ekkor a megfigyelt értékek átlaga hosszú távon stabil lesz. Ez azt jelenti, hogy hosszú távon a megfigyelt értékek átlaga egyre közelebb kerül a várható értékhez. A törvény megadja, hogy bizonyos feltételek mellett a mintaátlag (az első n megfigyelés átlagértéke) konvergál a populációs átlaghoz, amikor n növekszik.

Mit jelent pontosan?

Gyakorlati értelemben az LLN azt mondja: ha sokszor megismétlünk egy kísérletet (önálló, azonos eloszlású próbák), akkor a tapasztalati átlag közelít a valós, elméleti várható értékhez. Jelölve X1, X2, …, Xn független, azonos eloszlású véletlen változókat, és μ = E[X1] a várható érték, akkor a mintaátlag

X̄n = (1/n) · (X1 + X2 + … + Xn)

konvergál μ-hoz, azaz X̄n → μ (valamilyen értelemben, lásd alább), ha n → ∞.

Gyenge és erős törvény

  • Gyenge nagy számok törvénye (WLLN): általában azt állítja, hogy X̄n konvergál μ-hoz valószínűség szerint (convergence in probability). Ez azt jelenti, hogy bármely kis ε > 0 esetén P(|X̄n − μ| > ε) → 0, amikor n → ∞.
  • Erős nagy számok törvénye (SLLN): erősebb állítás, amely szerint X̄n konvergál μ-hoz majdnem biztosan (almost surely, vagyis valószínűséggel 1). Ez azt jelenti, hogy a realizációk többségénél a sorozat határértéke μ lesz.

Feltételek és megjegyzések

  • Leggyakoribb feltétel: a megfigyelések függetlenek és azonos eloszlásúak (i.i.d.), továbbá a várható értékük véges: E[|X1|] < ∞. Sok bizonyításnál további feltételeket (például véges variancia) használnak, de a legfontosabb, hogy ne legyen „végtelen várható érték”.
  • Az LLN nem mond semmit arról, hogy milyen gyorsan történik a konvergencia — erre vonatkoznak a további eredmények (például koncentrációs egyenlőtlenségek vagy a központi határeloszlás).
  • Ne tévesszük össze a gambler’s fallacy-vel: az, hogy hosszú távon az átlag közelít a várható értékhez, nem jelenti azt, hogy rövidebb sorozatokban a véletlen "kiegyenlítődne" vagy hogy az egyes, rövid távon ritka események előfordulási valószínűsége megváltozna.

Különbség a központi határeloszlástól (CLT)

Az LLN arról szól, hogy a mintaátlag maga közelít a várható értékhez. A központi határeloszlás (CLT) viszont azt írja le, hogyan viselkedik az átlagtól való eltérés: a megfelelően normált eltérések eloszlása közelít egy normális eloszláshoz. Röviden: LLN → helyhez való konvergencia (a közép felé), CLT → a fluktuációk eloszlása.

Példa kockadobással

Kockadobáskor az 1, 2, 3, 4, 5 és 6 számok a lehetséges eredmények. Mindegyik egyformán valószínű. A kimenetek populációs átlaga (vagy "várható értéke") a következő:

(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5.

Mivel minden dobás független és azonos eloszlású, az LLN szerint a dobások átlagát (összeadva az eredményeket, majd osztva a próbák számával) egyre jobban megközelíti 3,5-öt, ha sokszor dobunk. Kezdetben az átlag nagy ingadozásokat mutathat, de idővel stabilizálódik.

A következő grafikon egy kockadobási kísérlet eredményeit mutatja. Ebben a kísérletben látható, hogy a kockadobások átlaga kezdetben vadul változik. Az LLN által megjósolt módon az átlag a megfigyelések számának növekedésével a 3,5-es várható érték körül stabilizálódik.

A demonstration of the Law of Large Numbers using die rolls

Gyakorlati következmények

  • Statisztikai becslés: az LLN alapozza meg a mintaátlagot, mint konzisztens becslőt a populációs átlagra.
  • Szimulációk és Monte Carlo módszerek: sok véletlenszerű mintavétel eredményének átlaga megbízható becslést ad egy várható értékre.
  • Közgazdasági és mérnöki alkalmazások: megbízhatóság, kockázatbecslés és várható értékek számítása nagy minták esetén.

Összefoglalás

A nagy számok törvénye egy alapvető statisztikai elv, amely megmutatja, hogy sok ismételt, független megfigyelés esetén a mintaátlag konvergál a várható értékhez. Fontos megérteni a feltételeit, a gyenge és erős változat közti különbséget, valamint azt, hogy ez nem ad információt a konvergencia sebességéről — erre további elméleti eszközök szolgálnak (például koncentrációs egyenlőtlenségek és a központi határeloszlás).