Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Kumulatív eloszlás

Kumulatív eloszlás

Olyan ábrázolás, ahol a változó egy értékéhez, vagy értékeinek csoportjához nem az értékhez kapcsolható esetek, hanem az adott értékhez vagy annál kisebb értékekhez kapcsolható esetek számát (kumulatív gyakoriság) vagy százalékos arányát (kumulatív százalékos gyakoriság) rendeljük.

Milyen mérési szintek esetén értelmes ez?

Olyan ábrázolás, ahol a változó egy értékéhez, vagy értékeinek csoportjához nem az értékhez kapcsolható esetek, hanem az adott értékhez vagy annál kisebb értékekhez kapcsolható esetek számát (kumulatív gyakoriság) vagy százalékos arányát (kumulatív százalékos gyakoriság) rendeljük.

Milyen mérési szintek esetén értelmes ez?

Példa (ISSP 2006):

„Az államnak kötelessége-e munkahelyet biztosítani mindenkinek, aki dolgozni akar?”

Gyakoriság

Kumulatív gyakoriság

Százalék

Kumulatív százalék

Feltétlenül kötelessége

516

516

51,7

51,7

Kötelessége

389

905

38,9

90,6

Inkább nem kötelessége

84

989

8,4

99,0

Semmi esetre sem kötelessége

10

999

1,0

100,0

Együtt

999

100,0

A táblázatban könnyen megállapítható:

- a válaszadók mekkora része tartja valamilyen mértékben kötelességének (90,6 %),

- mekkora részük az, aki nem azt gondolja, hogy semmi esetre sem kötelessége (99,0 %).

Vissza a kvantilis képzéshez.

A kumulatív százalékos eloszlás segítségével kijelölhetők az egyes kvantilisek. Pl. az első kvintilis az, aminél kisebb a megfigyelések 20%-a.

Ez nem mindig adható meg egészen pontosan, lásd alább, életkor.

Szabálytól függően az életkornál: az első kvintilis 30, ha a 20%-hoz legközelebbi értéket, vagy a 31, ha a 20%-ot átlépő első értéket tekintjük határnak.

Hol van a második, harmadik, negyedik kvintilis?

Életkor

Gyakoriság

Százalék

Kumulatív százalék

18

13

1,3

1,3

19

13

1,3

2,6

20

17

1,7

4,3

21

12

1,2

5,5

22

11

1,1

6,6

23

13

1,3

7,9

24

17

1,7

9,6

25

8

,8

10,4

26

31

3,1

13,5

27

13

1,3

14,8

28

16

1,6

16,4

29

15

1,5

17,9

30

15

1,5

19,4

31

14

1,4

20,8

32

19

1,9

22,7

33

15

1,5

24,2

34

19

1,9

26,1

35

20

2,0

28,1

36

15

1,5

29,6

37

21

2,1

31,7

38

14

1,4

33,1

39

22

2,2

35,3

40

20

2,0

37,3

41

28

2,8

40,1

42

27

2,7

42,8

43

16

1,6

44,4

44

19

1,9

46,3

45

23

2,3

48,6

46

23

2,3

50,9

47

16

1,6

52,5

48

20

2,0

54,5

49

17

1,7

56,2

50

13

1,3

57,5

51

22

2,2

59,7

52

13

1,3

61

53

14

1,4

62,4

54

17

1,7

64,1

55

16

1,6

65,7

56

17

1,7

67,4

57

17

1,7

69,1

58

15

1,5

70,6

59

7

,7

71,3

60

14

1,4

72,7

61

16

1,6

74,3

62

21

2,1

76,4

63

17

1,7

78,1

64

14

1,4

79,5

65

12

1,2

80,7

66

17

1,7

82,4

67

16

1,6

84

68

10

1,0

85

69

18

1,8

86,8

70

17

1,7

88,5

71

12

1,2

89,7

72

12

1,2

90,9

73

14

1,4

92,3

74

9

,9

93,2

75

7

,7

93,9

76

8

,8

94,7

77

2

,2

94,9

78

10

1,0

95,9

79

7

,7

96,6

80

4

,4

97

81

5

,5

97,5

82

4

,4

97,9

83

6

,6

98,5

84

2

,2

98,7

85

2

,2

98,9

86

2

,2

99,1

87

4

,4

99,5

88

4

,4

99,9

89

1

,1

100

Együtt

1000

100,0

További példák kvantilisekre:

kvartilis (4 részre osztva):

Gyakoriság

Százalék

18-34

261

26,1

35-46

248

24,8

47-62

255

25,5

63+

236

23,6

Együtt

1000

100,0

decilis (10):

Gyakoriság

Százalék

18-25

104

10,4

26-31

104

10,4

32-37

109

10,9

73+

91

9,1

Együtt

1000

100,0

tercilis (3):

Gyakoriság

Százalék

18-39

353

35,3

39-56

321

32,1

57+

326

32,6

Együtt

1000

100,0

Alkalmazási példa: két gyakorisági eloszlás összevetése

Pl. két korfa.

A modern, ipari társadalmak kialakulása során azonos változások mennek végbe a korfán:

  1. várható élettartam növekedése

  2. és a  csecsemőhalandóság csökkenése,

  3. majd a születések arányának csökkenése.

Döntsd el az alábbi tercilisek alapján, hogy melyik eloszlás jellemez fejlett ipari társadalmat, és melyik tartozik fejlődő országhoz!

Kep33

Másik példa a decilisek használatára: decilis-hányados, lásd a 6. előadást, illetve a társadalmi mérőszámok témakört.

Problémák:

1. Hogyan állapítsuk meg az osztályok határait?

Láttuk, hogy ez gondot jelent, és több megoldás lehetséges. A továbbiakban kövessük azt a megegyezést, hogy azt az értéket választjuk, ahol az eloszlás legelőször átlépi a kérdéses százalékhatárt (pl. kvartilis esetén a 25, 50, 75%-ot)!

2. Milyen értékkel azonosítsuk az osztályt?

Valós gyakorlati probléma.

Pl. vagyoni jellegű kérdéseknél gyakori kérdezéstechnikai fogás, hogy nem konkrét számösszeget kérünk, hanem csak besorolást egyes osztályokba.

Pl:

Becsülje meg ingatlanvagyonának (lakás, ház, telek, nyaraló) összértékét!

Válaszlehetőségek:

0-10 millió Ft

10-20 millió Ft

20-30 millió Ft

30-50 millió Ft

Több, mint 50 millió Ft

Miért használjuk ezt?

  1. a vagyoni helyzet érzékeny téma, inkább hajlandóak a kérdezettek egy kategóriát megjelölni, mint pontos értéket

  2. a legtöbben nincsenek tisztában pontos vagyoni helyzetükkel

Ha magas mérési szintű változóként akarjuk kezelni ezt a változót, értéket kell hozzárendelni. Pl. egyéni összvagyon (ingatlan + ingóság + megtakarítások) kiszámításához.

Egy lehetséges megoldás az osztályhoz rendelni az adott intervallum középpontját:

0-10 millió Ft                  5 millió Ft

10-20 millió Ft                15 millió Ft

20-30 millió Ft                25 millió Ft

30-50 millió Ft                40 millió Ft

Több, mint 50 millió Ft        ?

Az utolsó kategória felső határát nem ismerjük; ezt meg kell becsülnünk, pl. más adatforrás segítségével.