Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Tő-és-levél ábra (stem and leaf plot)

Tő-és-levél ábra (stem and leaf plot)

Intervallum-arányskála mérési szintű változókra.

A változó értékeit „tövekre” és „levelekre” bontjuk számjegyeik alapján, általában az első vagy első két helyiértéket választva tőnek (figyelem: első helyiértéket és nem első számjegyet!).

Ezután növekvő sorrendbe rendezzük a töveket, majd az azonos tőhöz tartozó leveleket soronként ismét rendezzük. Az így kapott ábra kissé hasonlít egy elfordított hisztogramra, azzal a különbséggel, hogy attól eltérően a tényleges értékeket ábrázolja.

Példa: országonként az átlagos heti munkaidő (növekvő sorrendben, órában):

NL-Netherl

35.29948

CA-Canada

37.26501

IE-Ireland

37.39599

GB-Great B

37.47162

CH-Switzer

37.82437

NZ-New Zea

37.88102

FI-Finland

38.23138

FR-France

38.54045

SE-Sweden

38.5873

DK-Denmark

38.61125

NO-Norway

38.61965

DE-Germany

38.90488

HU-Hungary

39.9765

ZA-South A

40.52171

AU-Austral

40.85112

VE-Venezue

40.9579

PT-Portuga

41.2068

ES-Spain

41.40199

IL-Israel

41.76869

RU-Russia

41.82076

US-United

42.31947

LV-Latvia

42.35688

SI-Sloveni

42.75

UY-Uruguay

42.80439

HR-Croatia

43.5

PL-Poland

44.04636

CL-Chile

44.23623

JP-Japan

44.5078

CZ-Czech R

45.4177

DO-Dominic

45.51872

PH-Philipp

47.18957

KR-South K

48.71251

TW-Taiwan

49.48805

A megfelelő tő-és-levél ábra (az első két helyiértéket definiálva tőnek):

Gyakoriság: tő-és-levél

35*        3 36*        37*        34589 38*        256669 39*        40*        059 41*        02488 42*        3488 43*        5 44*        025 45*        45 46*        47*        2 48*        7 49*        5

Gyakran tovább bontják a töveket, pl. két részre osztva, a 0-4 és 5-9 decimális jegyekhez tartozó intervallumoknak megfelelően.

Az alábbi ábra a fentinek egy ilyen, tovább bontott változata:

35*        3 35.        36*        36.        37*        34 37.        589 38*        2 38.        56669 39*        39.        40*        0 40.        59 41*        024 41.        88 42*        34 42.        88 43*        43.        5 44*        02 44.        5 45*        4 45.        5 46*        46.        47*        2 47.        48*        48.        7 49*        49.        5

FIGYELEM: Az utóbbi ábra kevésbé „sima”, mint az előző. Ez a magas mérési szintű változók esetén már korábban látott általános probléma: minél finomabb beosztással definiáljuk a kategóriákat (itt a töveket), annál egyenetlenebb gyakorisági képet kapunk.

Milyen ábrát kapnánk az első változatból, ha a számoknak nem az első kettő, hanem csak az első decimális jegye alapján képeznénk a töveket?

Statisztikai térkép

Leggyakrabban intervallum-arányskála mérési szintű változókra.

Példa: Egy kórházi ápolási esetre eső átlagos ápolási napok száma, kistérségenként, 2007-ben.

Milyen megfigyeléseket tehetünk a térkép alapján? Mi magyarázhatja az ellátás igénybevételének területi mintázatát és egyenlőtlenségeit? (Segítség – két szempont is felmerülhet: az ellátottak eltérő szükséglete; ill. az ellátórendszer eltérő működési hatékonysága.)

Kep53

Forrás: az Egészségmonitor kutatási jelentése

Idősor ábra

Intervallum-arányskála mérési szintű változókra.

Az x-tengelyen az időt ábrázolja, az y-tengelyen egy időben változó (intervallum-arányskála mérési szintű) mutató gyakoriságát/százalékarányát.

Az adott időpontokhoz tartozó „mérési eredményeket” ábrázoljuk, majd összekötjük.

Példa: Jövedelmi egyenlőtlenségek változása a kelet-európai országokban a rendszerváltozások során.

Forrás: Flemming J., and J. Micklewright, “Income Distribution, Economic Systems and Transition”. Innocenti Occasional Papers, Economic and Social Policy Series, No. 70. Florence: UNICEF International Child Development Centre.

Amit most elég tudni:

  1. A Gini értékkészlete a [0;1] intervallum

  1. 0 az értéke, ha a populáció minden tagja azonos jövedelemmel rendelkezik, tehát tökéletes az egyenlőség.

  2. értéke 1, ha minden jövedelem egyetlen személy kezében összpontosul, azaz teljes egyenlőtlenség esetén.

Az alábbi ábra a GINI együttható alakulását mutatja négy volt szocialista ország esetében, a rendszerváltást követő években.

Összevetésképpen: a 90-es években Latin-Amerikában volt a Gini értéke a legmagasabb (0,5 körüli átlaggal), az iparosodott nyugati államokban 0,35 körül mozgott.

Milyen általános trend figyelhető meg mind a négy ország esetében? Megfelelnek-e várakozásainak a kapott eredmények? Milyen országok közötti különbségek olvashatók le?