Konfidenciaintervallum – definíció, számítás és példa 95%-ra
Konfidenciaintervallum: érthető definíció, 95%-os konfidenciaszint számítása lépésről lépésre és gyakorlati példa — gyors statisztikai útmutató.
A statisztikában a konfidenciaintervallum egy bizonyos paraméter becslésének egy speciális formája. Ezzel a módszerrel egyetlen érték helyett a paraméter elfogadható értékeinek teljes intervallumát adjuk meg, azzal a valószínűséggel együtt, hogy a paraméter valós (ismeretlen) értéke az intervallumon belül van. A konfidenciaintervallum a mintából származó megfigyeléseken alapul, ezért mintánként eltérő. Annak valószínűségét, hogy a paraméter az intervallumban lesz, konfidenciaszintnek nevezzük. Ezt nagyon gyakran százalékban adják meg. A megbízhatósági intervallumot mindig a megbízhatósági szinttel együtt adják meg. Az emberek beszélhetnek a "95%-os konfidenciaintervallumról". A konfidenciaintervallum végpontjait konfidenciahatároknak nevezik. Egy adott helyzetben egy adott becslési eljárás esetében minél magasabb a konfidencia-szint, annál szélesebb a konfidencia-intervallum.
A konfidenciaintervallum kiszámításához általában feltételezésekre van szükség a becslési folyamat természetével kapcsolatban - ez elsősorban egy parametrikus módszer. Az egyik gyakori feltételezés az, hogy annak a populációnak az eloszlása, amelyből a minta származik, normális. Mint ilyen, az alább tárgyalt konfidenciaintervallumok nem robusztus statisztikák, bár a robusztusság növelése érdekében változtatásokat lehet végrehajtani.
Mit jelent a 95% konfidenciaszint?
A 95%-os konfidenciaszint azt jelenti, hogy ha azonos módon sok, független mintát veszünk ugyanabból a populációból és minden mintára kiszámítjuk a 95%-os konfidenciaintervallumot, akkor a módszerrel kapott intervallumok körülbelül 95%-a fogja tartalmazni a valódi (ismeretlen) populációs paramétert. Ez nem azt jelenti, hogy az adott, már kiszámolt intervallumnak 95% az esélye arra, hogy a paraméter benne legyen — a paraméternek nincs valószínűségi eloszlása a klasszikus (frequentista) megközelítésben; a bizonyosság a procedúra hosszú távú viselkedésére vonatkozik.
Alapképletek és számítások
Általános formában egy konfidenciaintervallum a becsült érték ± kritikus érték × standard hiba formában írható:
- CI = becslés ± z* × SE, ahol z* a standard normál eloszlás kritikus értéke (pl. 1,96 a 95%‑hoz).
- Ha a populáció szórása ismeretlen és a minta kicsi, helyette a Student-féle t eloszlás kritikus értékét (t_{df}) használjuk: CI = becslés ± t_{df} × SE.
Standard hibák:
- Átlag esetén: SE = s / sqrt(n), ahol s a minta szórása és n a minta elemszáma.
- Arány (proporcionális jelenség) esetén: SE = sqrt(p̂(1 − p̂) / n), ahol p̂ a mintabeli arány.
Példa 95%-os konfidenciaintervallumra (átlag)
Tegyük fel, hogy egy minta átlaga 100, a minta szórása 15 és n = 25. Ha feltételezzük, hogy a populáció normális vagy a minta elég nagy:
- Normál-közelítés (z* = 1,96): SE = 15 / sqrt(25) = 15 / 5 = 3. Margin = 1,96 × 3 ≈ 5,88. CI ≈ 100 ± 5,88 → [94,12; 105,88].
- T-eloszlás (df = 24, t ≈ 2,064): Margin = 2,064 × 3 ≈ 6,19. CI ≈ 100 ± 6,19 → [93,81; 106,19].
Megjegyzés: kis minták esetén a t-eloszlás használata helyesebb, mert a kritikus érték nagyobb, így szélesebb (és reálisabb) intervallumot ad.
Példa 95%-os konfidenciaintervallumra (arány)
Ha egy felmérésben p̂ = 0,60 (60%) és n = 100, akkor:
- SE = sqrt(0,6 × 0,4 / 100) = sqrt(0,24 / 100) ≈ 0,049
- Margin = 1,96 × 0,049 ≈ 0,096
- CI ≈ 0,60 ± 0,096 → [0,504; 0,696] (azaz 50,4%–69,6%).
Ha az n kis, vagy p̂ nagyon közel 0-hoz vagy 1-hez, akkor a Wilson- vagy exact (Clopper–Pearson) módszerek megbízhatóbbak lehetnek a legegyszerűbb normál-approximációnál.
Fontos megjegyzések és gyakori félreértések
- Interpretáció: A 95%-os CI nem adja meg annak a valószínűségét, hogy a paraméter benne van a konkrét intervallumban (klasszikus értelemben). A helyes megfogalmazás: "a módszer kb. 95% eséllyel ad olyan intervallumot, amely tartalmazza a valódi paramétert".
- Konfidenciaszint és intervallum szélessége: Magasabb konfidenciaszint (pl. 99%) → szélesebb intervallum; alacsonyabb szint (pl. 90%) → keskenyebb intervallum.
- Minta nagysága: Nagyobb minta → kisebb standard hiba → szűkebb konfidenciaintervallum.
- Feltételezések: Általában szükség van független, véletlen mintavételre és gyakran normális eloszlásra a populációban (vagy elég nagy minta esetén a központi határeloszlás miatt). Ha ezek nem teljesülnek, használjunk robusztus vagy nemparametrikus módszereket (bootstrap, permutációs eljárások).
- Ismert vs. ismeretlen szórás: Ha a populáció szórása ismert (ritka a gyakorlatban), használjuk a z-értéket; ha ismeretlen, a t-eloszlás javasolt, különösen kis mintánál.
- Többszörös összehasonlítások: Ha egy vizsgálatban sok CI-t számítunk, a "családi" lefedettség csökken — ekkor korrekciókat (pl. Bonferroni) lehet alkalmazni.
Gyors útmutató a helyes gyakorlatra
- Mindig tüntesse fel a konfidenciaszintet (pl. 95%).
- Jelezze a minta elemszámát (n) és hogy melyik módszert használták (z, t, Wilson, bootstrap stb.).
- Adja meg a feltételezások fő korlátait (pl. normális eloszlás, független mintavétel).
- Szükség esetén fontolja meg robusztusabb módszerek használatát (bootstrap CI kisebb feltételezásokkal dolgozik).
Összefoglalás
A konfidenciaintervallum hasznos eszköz a paraméter-becslés pontosságának és bizonytalanságának szemléltetésére. A 95%-os CI a leggyakoribb gyakorlatban, de mindig figyelni kell a minta méretére, a szórás ismeretére és az alkalmazott eloszlási feltételezésekre. A helyes értelmezés és a módszer részletes megadása (szint, n, alkalmazott eljárás) elengedhetetlen a megbízható statisztikai kommunikációhoz.
A "bizalom" kifejezés jelentése
A bizalom kifejezésnek a statisztikában hasonló jelentése van, mint a köznapi használatban. A köznapi használatban a 95%-os megbízhatóságra vonatkozó állítást általában úgy értelmezik, mint ami gyakorlatilag bizonyosságot jelent. A statisztikában a 95%-os megbízhatóságra vonatkozó állítás egyszerűen azt jelenti, hogy a kutató a nagyszámú lehetséges intervallum közül egy lehetséges intervallumot látott, amelyből húszból tizenkilenc intervallum tartalmazza a paraméter valódi értékét.
Gyakorlati példa

Egy gép margarinnal tölti meg a poharakat. A példában a gépet úgy állítják be, hogy a poharak tartalma 250 g margarin legyen. Mivel a gép nem tud minden poharat pontosan 250 grammal megtölteni, az egyes poharakba töltött tartalom némi szórást mutat, és X véletlen változónak tekintjük. Ezt a szórást feltételezzük, hogy normális eloszlású a kívánt 250 grammos átlag körül, 2,5 grammos szórással. Annak megállapításához, hogy a gép megfelelően kalibrált-e, véletlenszerűen kiválasztunk egy n = 25 margarinos pohárból álló mintát, és a poharakat megmérjük. A margarin súlya X1, ..., X25, egy véletlenszerű minta X-ből.
Ahhoz, hogy képet kapjunk a μ várakozásról, elegendő egy becslést adni. A megfelelő becslő a mintaátlag:
μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. }
A minta az x1, ...,x25 tényleges súlyokat mutatja, átlagértékkel:
x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 gramm . {\displaystyle {\bar {x}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gramm}}. }
Ha egy másik 25 csészéből álló mintát veszünk, könnyen számíthatunk arra, hogy 250,4 vagy 251,1 grammos értékeket találunk. A 280 grammos mintaátlagérték azonban rendkívül ritka lenne, ha a csészék átlagos tartalma valóban közel 250 gramm. A 250,2-es mintaátlag megfigyelt értéke körül egy egész intervallum van, amelyen belül, ha a teljes populáció átlaga valóban ebben a tartományban van, a megfigyelt adatok nem tekinthetők különösen szokatlannak. Az ilyen intervallumot a μ paraméter konfidenciaintervallumának nevezzük. Hogyan számoljuk ki az ilyen intervallumot? Az intervallum végpontjait a mintából kell kiszámítani, tehát ezek statisztikák, az X1, ..., X25 minta függvényei, tehát maguk is véletlen változók.
Esetünkben a végpontokat úgy határozhatjuk meg, ha figyelembe vesszük, hogy egy normális eloszlású mintából származó X mintaátlag szintén normális eloszlású, ugyanolyan μ várakozással, de σ/√n = 0,5 (gramm) standard hibával. A standardizálással egy véletlen változót kapunk
Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {\X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {\X}}-\mu }{0.5}}}}
a becslendő μ paramétertől függő, de a μ paramétertől független standard normális eloszlással. Ezért lehetséges olyan -z és z számokat találni, amelyek függetlenek μ-től, ahol Z a kettő között fekszik 1 - α valószínűséggel, ami egy mérték arra, hogy mennyire akarunk biztosak lenni. Mi 1 - α = 0,95-nek vesszük. Tehát van:
P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0,95.\,}
A z szám a kumulatív eloszlásfüggvényből következik:
Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}}
és megkapjuk:
0,95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ X ¯ + 0,98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}}
Ezt úgy lehet értelmezni, hogy: 0,95 valószínűséggel találunk egy olyan konfidenciaintervallumot, amelyben a μ paramétert a sztochasztikus végpontok között találjuk.
X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,}
és
X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,}
Ez nem jelenti azt, hogy a számított intervallumban 0,95 valószínűséggel találkozunk a μ paraméterrel. Minden egyes mérés megismétlésével a minta X átlagának más értéke lesz. Az esetek 95%-ában μ az ebből az átlagból számított végpontok között lesz, de az esetek 5%-ában nem. A tényleges konfidenciaintervallumot a mért súlyok képletbe való beírásával számítjuk ki. A mi 0,95-ös konfidenciaintervallumunk a következő lesz:
( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}
Mivel a μ kívánt 250-es értéke a kapott konfidenciaintervallumon belül van, nincs okunk feltételezni, hogy a gépet rosszul kalibrálták.
A kiszámított intervallumnak rögzített végpontjai vannak, amelyek között μ lehet (vagy nem). Így ennek az eseménynek a valószínűsége vagy 0, vagy 1. Nem mondhatjuk: "az μ paraméter (1 - α) valószínűséggel a konfidenciaintervallumban van". Csak azt tudjuk, hogy ismétléssel az esetek 100(1 - α) %-ában μ a számított intervallumban lesz. Az esetek 100α %-ában azonban nem. És sajnos azt sem tudjuk, hogy az esetek közül melyikben történik ez. Ezért mondjuk azt: "100(1 - α) % megbízhatósági szint mellett μ a megbízhatósági intervallumban van. "
A jobb oldali ábra egy adott μ populációs átlagra vonatkozó konfidenciaintervallum 50 megvalósítását mutatja. Ha véletlenszerűen választunk egy megvalósítást, 95%-os valószínűséggel olyan intervallumot választunk, amely tartalmazza a paramétert; azonban lehet, hogy nem vagyunk szerencsések, és rosszat választottunk. Soha nem fogjuk megtudni; megrekedünk az intervallumunkkal.

A függőleges vonalszakaszok a μ bizalmi intervallum 50 megvalósítását jelölik.
Kérdések és válaszok
K: Mi az a bizalmi intervallum a statisztikában?
V: A konfidenciaintervallum egy speciális intervallum, amelyet egy paraméter, például a populáció átlagának becslésére használnak, és amely egyetlen érték helyett a paraméter elfogadható értékeinek tartományát adja meg.
K: Miért használnak konfidenciaintervallumot egyetlen érték helyett?
V: A konfidenciaintervallumot egyetlen érték helyett azért használják, hogy figyelembe vegyék a paraméter mintán alapuló becslésének bizonytalanságát, és megadják annak valószínűségét, hogy a paraméter valós értéke az intervallumon belül van.
K: Mi az a megbízhatósági szint?
V: A megbízhatósági szint annak a valószínűsége, hogy a becsült paraméter a megbízhatósági intervallumon belül van, és gyakran százalékos formában adják meg (pl. 95%-os megbízhatósági intervallum).
K: Mik a konfidenciahatárok?
V: A konfidenciahatárok a konfidenciaintervallum végpontjai, amelyek a becsült paraméter elfogadható értéktartományát határozzák meg.
K: Hogyan befolyásolja a megbízhatósági szint a megbízhatósági intervallumot?
V: Egy adott becslési eljárásban minél magasabb a konfidenciaszint, annál szélesebb lesz a konfidenciaintervallum.
K: Milyen feltételezések szükségesek a konfidenciaintervallum kiszámításához?
V: A konfidenciaintervallum kiszámításához általában a becslési eljárás természetére vonatkozó feltételezésekre van szükség, például arra a feltételezésre, hogy a populáció eloszlása, amelyből a minta származik, normális.
K: A konfidenciaintervallumok robusztus statisztikák?
V: A konfidenciaintervallumok, amint azt alább tárgyaljuk, nem robusztus statisztikák, bár a robusztusság növelése érdekében kiigazításokat lehet végezni.
Keres