Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Bevezetés

Bevezetés

A félév folyamán sok szó esett a változók eloszlásáról. Megtanultuk ábrázolni őket, megvizsgáltuk a tulajdonságaikat, centrális tendencia és szóródási mutatókat készítettünk róluk. Az eddig látott eloszlások tapasztalati eloszlások voltak. Amiről a mai órán lesz szó, az egy elméleti eloszlás.

Az elméleti eloszlások nem konkrét adatokon, hanem valamilyen elméleti megfontoláson, függvényen alapulnak. Az ilyen elméleti eloszlások haszna az, hogy sok tapasztalati eloszlás valamelyi elméleti eloszláshoz közelít.

Nézzünk néhány példát emlékeztetőül az eloszlásokra! Miben hasonlítanak és miben különböznek egymástól?

A felhasznált adatok az ISSP 1995-ös adatfelvételéből származnak. Egy négy itemből (elemből) álló xenofóbia erősségének mérését célzó kérdéssort alkotnak.

Mind az öt ábra bizonyos szempontból hasonló volt egymáshoz: egy elméleti eloszlást közelítettek, amit normális eloszlásnak nevezünk.

A normális eloszlás is jellemezhető a centrális tendencia (középérték) mutatóival, a szóródás mutatóival, ábrázolható. Az előnye a tapasztalati eloszlásokhoz képest az, hogy pontosan ismerjük a matematikai tulajdonságait, így jól tudjuk jellemezni segítségükkel azokat a változókat, melyek eloszlása közelít a normálishoz. Az elmúlt alkalommal láttuk az is, hogy bizonyos elemzéseket csak normális eloszlású változóval végezhetünk (például csak ilyen lehet a regresszió függőváltozója). Fontos, hogy normális eloszlású csak intervallum-arányskála mérési szintű változó lehet.

Nézzük meg a fenti példákat, mennyire közelítenek a normális eloszláshoz!

Megfigyelhetjük, hogy többé-kevésbé illeszkednek a normális eloszláshoz. Két érdekességet is láthatunk a hisztogramokon.

Az egyik – ez az, ami statisztikai szempontból érdekel bennünket – az, hogy az úgynevezett xenofóbia index eloszlása jobban hasonlít a normális eloszláshoz, mint az egyes változók eloszlása. A xenofóbia indexet úgy kaptuk, hogy az előző négy változóra vonatkozó értéket minden megkérdezett esetén összeadtuk és 4-et levontunk az így kapott értékből. Így egy 0-16 intervallumú változót kaptunk. Általánosságban kijelenthető, hogy minél összetettebb egy változó (például minél több változóból hozzuk létre, azok összeadásával, kivonásával) annál közelebb áll az eloszlása a normális eloszláshoz.

A másik érdekesség, – ami inkább módszertani jelentőségű – hogy a hisztogramokat megnézve a negatív állításokkal kevésbé értenek egyet a megkérdezettek, mint amennyire elutasítják a pozitív állításokat. Ez is általános megfigyelés. Ezért nem mindegy, hogy hogyan kérdeznek rá egyes jelenségekre: ha csak negatív állításokat tartalmazó kérdéseket tesznek fel egy kérdőívben, azt várhatóan kevésbé fogják elfogadni, míg a pozitív állításokat inkább elutasítják a válaszadók. Ez az eredményekre is hatással lehet. Ha kutatási eredményeket olvasunk, figyeljünk oda erre a problémára!