Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Ordinális változók asszociációs mérőszámai

Ordinális változók asszociációs mérőszámai

Milyen közel érzi magához a kontinenst?

Összesen

Nagyon közel

Közel

Nem nagyon közel

Milyen közel érzi magához a várost, ahol él?

Nagyon közel

521

89,5%

41

7,0%

20

3,4 %

582

100,0 %

Közel

123

50,4%

106

43,4%

15

6,1%

244

100,0%

Nem nagyon közel

100

63,7%

36

22,9%

21

13,4%

157

100,0%

 Total

744

75,7%

183

18,6%

56

5,7%

983

100,0%

Ismétlő kérdések:

A százalékolás alapján mit gondolunk független változónak?

Van-e összefüggés?

Milyen mérési szintű változókat látunk?

Hogyan lehetne a PRE elvét érvényesíteni?

Ezúttal párosával vizsgáljuk az embereket. Próbáljuk megjósolni minden párra, hogy közelebb, vagy kevésbé közel érzi magához a kontinenst a pár másik tagjához képest, ha ismerjük, hogy a várost, ahol él közelebb érzi magához, mint a pár másik tagja.

Ismételjük meg az előbbi besorolást úgy, hogy ismerjük, mekkora azoknak a pároknak az aránya, akiknél igaz az, hogy amelyikük közelebb érzi magát a városához, az érzi közelebb magát a kontinenshez is, illetve akiknél nem igaz ez. Hogyan járnánk el?

Fejezzük ki a javulást!

Hány olyan pár található a mintában, akiknél igaz az, hogy amelyikük közelebb érzi magát a városához, az érzi közelebb magát a kontinenshez is (azonos sorrendű párok)?

Hogyan lehet ezt kiszámolni?

Vegyük sorra a cellákat a jobb alsó sarokból. Minden cellába eső megfigyelésünk számát szorzzuk meg a tőle balra és felfelé eső cellákba eső megfigyelések összegével. Ismételjük meg minden lehetséges cellára (a következő tábla az első lépést mutatja).

Milyen közel érzi magához a kontinenst?

Összesen

Nagyon közel

Közel

Nem nagyon közel

Milyen közel érzi magához a várost, ahol él?

Nagyon közel

521

89,5%

41

7,0%

20

3,4 %

582

100,0 %

Közel

123

50,4%

106

43,4%

15

6,1%

244

100,0%

Nem nagyon közel

100

63,7%

36

22,9%

21

13,4%

157

100,0%

Total

744

75,7%

183

18,6%

56

5,7%

983

100,0%

Ns=21*(521+41+123+106) + 15*(521+41) + 36*(521+123) + 106*521= 103 451

Hány olyan pár található a mintában, akiknél az igaz, hogy amelyikük közelebb érzi magát a városához, az távolabb érzi magát a kontinenstől (fordított sorrendű párok)?

Hogyan lehet kiszámolni?

Vegyük sorra a cellákat a bal alsó sarokból. Minden cellába eső megfigyelésünk számát szorozzuk meg a tőle jobbra és felfelé eső cellákba eső megfigyelések számának összegével. Ismételjük meg minden lehetséges cellára (a következő tábla az első lépést mutatja).

Milyen közel érzi magához a kontinenst?

Összesen

Nagyon közel

Közel

Nem nagyon közel

Milyen közel érzi magához a várost, ahol él?

Nagyon közel

521

89,5%

41

7,0%

20

3,4 %

582

100,0 %

Közel

123

50,4%

106

43,4%

15

6,1%

244

100,0%

Nem nagyon közel

100

63,7%

36

22,9%

21

13,4%

157

100,0%

Total

744

75,7%

183

18,6%

56

5,7%

983

100,0%

Nd=100*(41+20+106+15) + 123*(41+20) + 36*(15+20) + 106*20=29 083

Gammának nevezzük a következő asszociációs mérőszámot:

t_eq_14.png

Jelen esetben:

t_eq_15.png

Gamma tulajdonságai

- szimmetrikus

- értéke -1 és +1 között változhat

- függetlenség esetén értéke 0

- jelentése: az összes mindkét változó szerint sorbarendezhető pár közül mekkora arányban csökken a jóslás hibája a véletlenhez ( (Ns+Nd)/2 ) képest.

Egy másik lehetséges asszociációs mérőszám a Somer féle d.

Ennek kiszámításához számoljuk ki azokat a párokat, amelyek nem rendezhetők sorba a függő változó szerint (Nty). (Vegyük észre, hogy ezeket a párokat a gamma kiszámításánál teljesen figyelmen kívül hagytuk.)

Hogyan számoljuk?

Válasszuk ki a függő változó legkisebb értékét, keressük meg ezen belül a független változó legkisebb értékéhez tartozó cellát. Az itt található esetek számát szorozzuk meg a függű változó azonos értékéhez tartozó, a független változó nagyobb értékeihez kapcsolható cellákba eső esetek számának összegével. Ismételjük meg addig, amíg lehetséges (a következő tábla az első lépést mutatja).

Milyen közel érzi magához a kontinenst?

Összesen

Nagyon közel

Közel

Nem nagyon közel

Milyen közel érzi magához a várost, ahol él?

Nagyon közel

521

89,5%

41

7,0%

20

3,4 %

582

100,0 %

Közel

123

50,4%

106

43,4%

15

6,1%

244

100,0%

Nem nagyon közel

100

63,7%

36

22,9%

21

13,4%

157

100,0%

Total

744

75,7%

183

18,6%

56

5,7%

983

100,0%

Nty=21*(15+20)+15*20+36*(106+41)+106*41+100*(123+521)+123*521=139 156

A Somer féle d értéke a következő képlettel számítható ki:

t_eq_16.png

A konkrét esetben:

t_eq_17.png

A Somer d tulajdonságai:

- aszimetrikus

- értéke -1 és +1 közé esik

- függetlenség esetén értéke 0

Említés szintjén még egy mérőszám: a Spearman vagy rang korreláció.

Képlete:

t_eq_18.png

ahol

x, y az  ordinális változók, az értékekhez hozzárendelve, hogy hanyadik helyen állnak

N az elemek száma

Spearman (rang) korreláció tulajdonságai:

- szimmetrikus

- értéke -1 és +1 közé esik

- függetlenség esetén értéke 0

Ellenőrző kérdések

Melyik a nagyobb azonos adatok esetén: a gamma vagy a Somer d ?

Milyen mérőszámot használunk ordinális mérési szintű változók esetén, ha nem tudjuk, hogy melyik a függő változó (nem jelölhető meg) ?

Elgondolkodtató

Mit jelent a Somer féle d ?

Ha eltérünk a függetlenségtől hogyan változnak a most tanult asszociációs mérőszámok?