Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

A medián megtalálása a gyakorisági megoszlás ismeretében (nagy mintaelemszám)

A medián megtalálása a gyakorisági megoszlás ismeretében (nagy mintaelemszám)

  1. a medián megkeresése: a kumulatív százalékos eloszlás (lásd 3. előadás) alapján

  2. legtöbb esetben pontosan ilyen érték nincs

  3. ilyenkor (ahogyan a kvantilisek meghatározásánál már megállapodtunk) intervallum-arányskála esetén megkeressük az „első”, 50-nél nagyobb kumulatív százalékhoz tartozó értéket, és ez lesz a medián.

Pl. Japánban az ISSP 2006 alapján a heti munkaidő mediánja 45 óra, mert a változó kumulatív százalékos megoszlása:

Heti munkaidő (óra)

Gyakoriság

Százalék

Kumulált százalék

2,0

1

,1

,1

3,0

2

,3

,4

4,0

3

,4

,9

5,0

3

,4

1,3

6,0

4

,6

1,8

7,0

2

,3

2,1

8,0

6

,9

3,0

9,0

10

1,4

4,4

10,0

5

,7

5,1

11,0

1

,1

5,2

12,0

9

1,3

6,5

13,0

2

,3

6,8

15,0

5

,7

7,5

16,0

5

,7

8,2

17,0

2

,3

8,5

18,0

7

1,0

9,5

19,0

2

,3

9,8

20,0

21

3,0

12,8

21,0

3

,4

13,2

22,0

2

,3

13,5

23,0

2

,3

13,8

24,0

4

,6

14,3

25,0

12

1,7

16,0

26,0

1

,1

16,2

27,0

1

,1

16,3

28,0

3

,4

16,7

29,0

1

,1

16,9

30,0

27

3,8

20,7

31,0

2

,3

21,0

32,0

3

,4

21,4

33,0

2

,3

21,7

34,0

1

,1

21,8

35,0

17

2,4

24,3

36,0

6

,9

25,1

37,0

3

,4

25,5

38,0

5

,7

26,2

39,0

1

,1

26,4

40,0

100

14,2

40,6

41,0

2

,3

40,9

42,0

19

2,7

43,5

43,0

7

1,0

44,5

44,0

3

,4

45,0

45,0

47

6,7

51,6

46,0

5

,7

52,3

47,0

2

,3

52,6

48,0

46

6,5

59,1

50,0

95

13,5

72,6

51,0

4

,6

73,2

52,0

4

,6

73,8

54,0

6

,9

74,6

55,0

25

3,5

78,2

56,0

11

1,6

79,7

57,0

3

,4

80,1

58,0

2

,3

80,4

59,0

1

,1

80,6

60,0

60

8,5

89,1

61,0

1

,1

89,2

62,0

2

,3

89,5

63,0

2

,3

89,8

65,0

8

1,1

90,9

66,0

4

,6

91,5

67,0

1

,1

91,6

68,0

1

,1

91,8

70,0

16

2,3

94,0

72,0

7

1,0

95,0

75,0

4

,6

95,6

76,0

1

,1

95,7

78,0

2

,3

96,0

80,0

8

1,1

97,2

84,0

2

,3

97,4

85,0

2

,3

97,7

90,0

2

,3

98,0

91,0

1

,1

98,2

95,0

1

,1

98,3

96 vagy több

12

1,7

100,0

Együtt

705

100,0

A medián megadása ordinális mérési szint esetén ugyanígy megy: a medián az első, legalább 50%-os kumulált százalékos gyakoriságot adó kategória (fontos: a kategóriák rendezve kell, hogy szerepeljenek!).

Példa: ISSP 20006, USA adatok. „Az Ön véleménye szerint az állam kötelessége-e...”:

…munkát biztosítani mindenkinek, aki dolgozni akar?

…egészségügyi ellátást biztosítani a betegek számára?

Gyakoriság

Százalék

Kumulált százalék

Gyakoriság

Százalék

Kumulált százalék

Feltétlenül kötelessége

239

15,9

15,9

850

56,4

56,4

Kötelessége

356

23,7

39,6

502

33,3

89,8

Inkább nem kötelessége

521

34,6

74,2

116

7,7

97,5

Semmi esetre sem kötelessége

388

25,8

100,0

38

2,5

100,0

Együtt

1504

100,0

1506

100,0

Keressük meg a változónkénti mediánt, interpretáljuk az eredményt!

A mediánok eltérésének interpretációja: az amerikaiak a munkahelyteremtésben kisebb állami szerepvállalást várnak el, mint az egészségügyi ellátásban.

Gyakorlati alkalmazás: időbeli változások

Egyesült Államok, General Social Survey (GSS), 1991 és 1994, a kormányzati védelmi kiadások nagyságáról (válaszkategóriák: ”túl sok”, „túl kevés”, „megfelelő”).

1991

1994

Százalék

Kumulált százalék

Százalék

Kumulált százalék

Túl kevés

14,5

14,5

16,5

16,5

Megfelelő

57,6

72,1

49,3

65,8

Túl sok

27,9

100,00

34,2

100,0

Együtt

100,0

100,0

A medián helyzete nem változott 1991 és 1994 között: mindkét esetben a „Megfelelő” kategória adja a mediánt. Azaz: a védelmi kiadásokkal kapcsolatos közvélemény lényegében nem változott az eltelt 3 évben.

Megjegyzés: itt a medián elfedi, hogy a kiadásokat sokallók aránya negyedével nőtt.