Ugrás a tartalomhoz

Statisztika online - oktatási portál

Vág András

Typotex

4.4. Az eloszlások típusai

4.4. Az eloszlások típusai

Az eloszlások típusaival, tulajdonságaik felderítésével és megismerésével a valószínűségszámítás foglalkozik. A matematikai statisztika viszont minden megállapítását, következtetését erre alapozza. A statisztikai módszerek használatánál az eloszlások ismerete hasznos, de nem elengedhetetlen. A mélyebben érdeklődők számára a bőséges magyar nyelvű valószínűségszámítási szakirodalmat ajánljuk. Itt csak néhány eloszlásról szólunk, vázlatosan.

A diszkrét eloszlások közül az egyik legfontosabb az ún. egyenletes eloszlás. Ez a lehető legegyszerűbb eset: valamennyi értékhez ugyanakkora gyakoriság tartozik. A relatív gyakoriság a különböző kategóriák, osztályok számának reciprokával egyenlő: a „férfi-nő”, ill. „fej, vagy írás” esetében két osztály van, s ezért egyketted, azaz 0,5 (50%) a relatív gyakoriság; a dobókockánál egyhatod (0,167 = 16,7%); a 10. ábránál alkalmazott dekaédernél egytized (10%); de az az eloszlás nem volt egyenletes… A folytonos eloszlások közül a legfontosabb a normális eloszlás. Leírása legpontosabban azzal a matematikai egyenlettel lehetséges, amely egyben az eloszlás görbéjét is meghatározza. Egy ? (kszí) folytonos valószínűségi változót normális eloszlásúnak nevezünk akkor, ha az egész számegyenesen értelmezve van ( - ? -től + ? -ig), és eloszlásfüggvénye az alábbi ( µ - várható érték, ? - szórás paraméterekkel):

a függvénygörbe pedig - amit az ún. „sűrűségfüggvény” ír le:

F ( x ) = P ( ξ /////<///// x ) = 1 σ 2 π - x e ( t - μ ) 2 2 σ 2 d t

10. ábra. Dekaéder-dobókocka 100-as sorozata

11. ábra. A normális eloszlás grafikonja

A normális eloszlás folytonos, szimmetrikus eloszlástípus. A grafikon, a függvény görbéje haranghoz hasonlít, a csúcsa lekerekített - sem lapos, sem hegyes nem lehet. Mindezek miatt „harang-görbének”, vagy Gaussgörbének is szokták nevezni.

Kétoldalt messze (elvileg végtelen messze) elnyúlik, de a maximumához viszonylag közel már annyira megközelíti az x tengelyt, hogy sem rajzolni nem lehet, sem számításba venni nem kell. Jellegén belül formája nagyon változatos lehet: kiemelkedőbb, vagy lapultabb; a függőleges y tengelyt is metszheti.

Kiemelését két dolog is indokolja: elsőül, hogy a legtöbb statisztikai eljárást, módszert (köztük éppen a legérzékenyebbeket, a „legjobbakat”) éppen a normális eloszlásra dolgozták ki.

Másodsorban - és talán ez a lényegesebb - nem is a matematikai egyszerűsége miatt foglalkoznak annyit vele: a természetben rengeteg jelenség eloszlása normális eloszlás. Ez ugyan gyakorlati tapasztalat, de a valószínűségszámítás egyik alapvető jelentőségű tétele, az ún. „centrális határeloszlástétel” is alátámasztja.

A centrális határeloszlás tétele

kimondja, hogy az eredetileg nem szükségképpen a normális görbével jellemzett mintasokaságból, populációból vett minták csoportjainak középértékei közelednek a normális eloszláshoz. Ez annyit jelent, hogy ha valamely értéket sok apró, egymástól független hatás együttesen alakít ki, akkor ez az érték normális eloszlású lesz, függetlenül attól, hogy maguk a hatások - ha elszigetelve tudnánk őket vizsgálni - milyen eloszlásúak. A való világ - különösen az élő világ - legtöbb tulajdonsága, bizony ilyen. A többnyire ismeretlen hatótényezőket nem keressük, csak azok „eredőjét” érzékeljük. Ha ezeknek a mért értékei alkotják mintánkat, akkor azok eloszlása az idézett tétel értelmében normális lesz.

Éppen ezek miatt az előnyök miatt törekszünk arra, hogy adataink normális eloszlásúak legyenek. Ritka eset, hogy ezt a mérési módszer megválasztásával megtehetjük; jobbára a már meglévő adatok matematikai átalakításával, transzformációjával érjük el. A továbbiakban - ha csak említés szintjén is - bemutatunk még néhány eloszlástípust.

4.4.1. Binomiális eloszlás

A diszkrét eloszlások nagyon sok esetben megállapítható változók viselkedését írják le jól. Abban a - legegyszerűbb - esetben, ha a változó csak két értéket vehet föl - hasonlóan a logikai értékekhez -, akkor az értékek eloszlása binomiális eloszlást határoz meg. (Ez - bizonyos esetekben jól közelíthető normális eloszlással).

4.4.2. Hipergeometrikus eloszlás

Ehhez az eloszlástípushoz az a kérdés vezet, hogy mi a valószínűsége annak, hogy egy urnából, melyben N golyó - köztük M fekete - van, n-et találomra kihúzva (n elemű mintát véve) éppen k feketét találunk azok között. A hipergeometrikus eloszlás bizonyos szempontból rokon a binomiális eloszlással: ha a golyókat visszatesszük, a soronkövetkező húzás eredménye független az előzőektől, s ezt a binomiális eloszlás írja le.

4.4.3. Poisson-eloszlás

A diszkrét eloszlások közül legfontosabb a Poisson-eloszlás - amely a binomiális eloszlás határeseként (bizonyos feltételek mellett) valósulhat meg. Az ad neki ekkora jelentőséget, hogy igen gyakran lép fel a természetben és jó közelítését adja a gyakorlatban előforduló véletlen változónak. Azt tapasztalhatjuk, hogy a pontok tér-, vagy időbeli elhelyezkedése akkor követ ilyen eloszlást, ha azok egymástól függetlenül és minden térrészben (időszakaszban) egyformán valószínűen oszolhatnak meg. Ilyen eloszlást mutat - többek között -:

  • a leszálló porszemek száma a tiszta papírlapon; a vérsejtek száma egy mikroszkóp látóterében [síkbeli eloszlások];

  • egy folyadékban, ill. annak meghatározott részében levő kolloid részecskék száma; a csillagok száma a tér egy kiválasztott szeletében; a halaké a vízben; folytonos, homogén anyag (üveg, fémtest) adott részében található idegen részecskék, buborékok száma [térbeli eloszlások];

  • a telefonközpontba (vagy szolgáltató egységbe) adott időszakban és időtartamban beérkezett telefonhívások (vásárlók) száma; valamely rádioaktív anyag adott idő alatt elbomló atomjainak száma; textilgyárban - meghatározott körülmények között - adott időtartamra eső fonalszakadások száma [időbeli eloszlás], stb.

4.4.4. Exponenciális eloszlás

Exponenciális eloszlást követnek bizonyos gépi berendezések élettartamai, azonban egy-egy alkatrész élettartama általában nem exponenciális eloszlású.

Az exponenciális eloszlású élettartam nevezetes, ún. „örökifjúság” tulajdonságú: feltéve, hogy a darab (egyed) egy bizonyos kort megért, ettől kezdve további élettartamának eloszlása megegyezik eredeti élettartamának eloszlásával. A valóságban az alkatrészek „öregszenek”; tehát az ilyen feltételezések csak közelítően, és az élettartamnak csak bizonyos időszakaira érvényesek. (Ezért szokták néha alkatrészek élettartamának eloszlását szakaszonként exponenciális eloszlással közelíteni).

4.4.5. Student (t-) eloszlás

Ezt az eloszlást W. S. Gosset állította fel a XX. század elején, s mivel ebben az időben „Student” álnév alatt írt, ezért lett ennek az eloszlásnak a neve: Student-eloszlás. Formálisan egy t statiszikai függvény eloszlásáról van szó. Statisztikai próbákban használatos a t-eloszlás táblázata.

4.4.6. Lognormális eloszlás

Bizonyos törési-aprítási folyamatoknál az őrlemény szemcsedarabjainak nagyság szerinti megoszlása lognormális eloszlást mutat. Ugyancsak jól közelíthető lognormális eloszlással egyes foglalkozási rétegek jövedelemeloszlása.