Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

A Kvalitatív Változékonyság Indexe (KVI)

A Kvalitatív Változékonyság Indexe (KVI)

(Index of qualitative variation)

A KVI kiegészítő anyag, nem fog szerepelni a vizsgán. Szerepeltetése amiatt fontos, hogy lássuk: minden mérési szinthez rendelhető szóródási mérőszám.

Nominális vagy ordinális változók esetén használható.

Értéke 0 és 1 közötti szám lehet.

Ha a minta minden eleme ugyanabba a kategóriába esik, 0 a KVI értéke. Ha minden kategóriába ugyanazon számú megfigyelés esik, értéke 1.

Példa (ISSP, 1998, Magyarország). Az iskolázottság megoszlása két munkaerőpiaci helyzet kategórián belül.

Iskolázottság

Érettségi nélkül

Érettségi

Diplomás

Együtt

Önálló

27

35,5%

32

42,1%

17

22,4%

76

100,0%

Alkalmazott

516

62,6%

195

23,7%

113

13,7%

824

100,0%

Láthatóan az alkalmazottak körében az iskolázottság egységesebb: kétharmaduk érettségi nélkül dolgozik. Számoljuk ki a KVI-t a két csoportra!

KVI = különbségek száma / a lehetséges különbségek maximális száma

Hogyan számítjuk ki a különbségek számát?

Ha az alábbi kis mintánk lenne …

        János           ÉRETTSÉGI ALATT         István          DIPLOMA         Károly        DIPLOMA         Ildikó          ÉRETTSÉGI

... akkor az alábbi párok különböznének:

János-István János-Károly János-Ildikó István-Ildikó Károly-Ildikó

Tehát 5 „különbséget” találunk. Egyszerűbb módszer a különbségek megszámlálására, ha az alábbi módon járunk el:

ÉRETTSÉGI ALATT           1 dolgozó DIPLOMA                            2 dolgozó ÉRETTSÉGI                         1 dolgozó

Különböző párok: ÉRETTSÉGI ALATT-DIPLOMA – 2 pár, ÉRETTSÉGI ALATT-ÉRETTSÉGI – 1 pár, DIPLOMA-ÉRETTSÉGI – 2 pár, az összesen 5 pár.

Ha K kategóriánk van, és fi jelöli az i. kategória gyakoriságát, ezt röviden ezt az alábbi formulával írhatjuk le:

Kep92

A formulát alkalmazva az önállókra, az alábbi érték adódik a különbségek számára:

27*32+27*17+32*17=1867

Míg az alkalmazottakra:

516*195+516*113+195*113=180963

Iskolázottság

Érettségi nélkül

Érettségi

Diplomás

Együtt

Önálló

27

32

17

76

Alkalmazott

516

195

113

824

Hogyan számítjuk ki a lehetséges különbségek maximális számát?

A maximális különbségek számára az alábbi formula alkalmazható:

Kep94

ahol K a változó kategóriáinak száma, N pedig a mintaelemszám.

Esetünkben az önállókra az alábbi érték adódik:

Kep94

Míg az alkalmazottakra:

Kep94

A KVI számítása

= különbségek száma / a lehetséges különbségek maximális száma

Az önállókra: 1867/1925 = 0,97

Az alkalmazottakra: 180.963/226.325 = 0,8

Vagyis a KVI értéke alátámasztja korábbi megfigyelésünket: az alkalmazottakon belül egységesebb az iskolázottság, más szóval: az önállókon belül nagyobb az iskolázottság változékonysága.

FIGYELEM!

A fentiekben ordinális mérési szintű változóra alkalmaztuk a KVI-t.

A KVI nem vesz tudomást arról, hogy rendezés van a kategóriák között. Alkalmazása ebből a szempontból információvesztéssel jár.

Megjegyzés:

A KVI képletében szereplő fi gyakoriságok helyett százalékos arányt is használhatunk, ugyanazt az értéket kapjuk. Pl. a fenti esetben az önállókra: KVI = (35,5*42,1+35,5*22,4+42,1*22,4)/((3*2/2)*(100/3)2) = 0,97

Példa

Rassz/Etnikum szerinti eloszlás az USA 8 államában. (kategóriák: fehér / fekete / ázsiai / spanyolajkú / amerikai bennszülött). Interpretáljuk az adatokat!

Tagállam            KVI Új Mexikó           0,7 Kalifornia            0,69 New York            0,58 Florida                0,52 Alaszka               0,48 Washington         0,29 Maine                  0,06 Vermont              0,04

Terjedelem

(Range)

Intervallum-arányskála esetében használatos.

Definíciója: a maximális és a minimális érték különbsége, vagyis az értékkészlet terjedelme.

Példa.

A 2006-os ISSP magyar adatain korábban már láttuk az átlagjövedelmet pártszimpátia szerinti csoportokon belül. Már ott említettük, hogy pl. az MDF-szavazók magas átlagjövedelme nem feltétlenül jelenti azt, hogy minden MDF szavazó jövedelme magas. A kérdés megvizsgálásához szükségünk lenne a szóródás valamely mértékére; válasszuk ehhez most a terjedelmet!

Pártszimpátia

Átlag

Minimum

Maximum

Terjedelem

MDF

224.050,00

43.000

500.000

457.000

SZDSZ

133.392,86

24.000

500.000

476.000

FKGP

57.166,67

40.000

70.000

30.000

MSZP

123.963,76

10.000

500.000

490.000

FIDESZ

125.898,94

15.000

500.000

485.000

Munkáspárt

75.400,00

37.400

125.000

87.600

MIÉP

165.433,50

23.000

500.000

477.000

Egyéb

159.100,00

54.000

500.000

446.000

Bizonytalan

148.636,12

2.000

500.000

498.000

Együtt

134.243,96

2.000

500.000

498.000

Ellenőrizzük le a minimum és maximum alapján a terjedelmek számítását!

Interpretáljuk a terjedelem értékeit! Nézzük meg az MDF esetét! Melyik párt esetén leghomogénebb a jövedelem?

Miért nem használhatjuk a terjedelmet nominális vagy ordinális mérési szint esetén?

Interkvartilis terjedelem

A terjedelem igen könnyen számolható

de

csak a két szélső értéket veszi figyelembe, ezért érzékeny a kiugró értékekre.

Ezért vezetjük be az interkvartilis terjedelmet:

Definíciója: a 75-ös és a 25-ös percentilis (vagyis a két szélső kvartilis) különbsége. Intervallum-arányskála esetén használható (ordinális szint esetéről később).

A fenti példára visszatérve:

Pártszimpátia

1. kvartilis

3. kvartilis

Interkvartilis terjedelem

Terjedelem

MDF

74250

500000

425.750

457.000

SZDSZ

50750

112500

61.750

476.000

FKGP

47500

68500

21.000

30.000

MSZP

53000

95000

42.000

490.000

FIDESZ

44500

90000

45.500

485.000

Munkáspárt

49100

113750

64.650

87.600

MIÉP

32851

396250

363.399

477.000

Egyéb

56500

218750

162.250

446.000

Bizonytalan

46000

110000

64.000

498.000

Együtt

49.250

100.000

50.750

498.000

Ellenőrizze a kvartilisek segítségével az interkvartilis terjedelem számítását! Interpretálja az értékeket! A terjedelemmel mérve a bizonytalanokon belüli változékonyság volt a legmagasabb, most megváltozott-e ez? Hogyan interpretálható ez a változás?

Példa

Terjedelem vagy interkvartilis terjedelem? Gyermekek száma anyák két különböző csoportjában.

Kep101