Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Lineáris kapcsolat

Lineáris kapcsolat

Bevezető definíció:

  • Két magas mérési szintű változó közötti kapcsolat lineáris, ha a független változó egységnyi emelése mellett a függő változó várható értéke minden esetben azonos mértékben és irányban változik.

  • Két magas mérési szintű változó kapcsolata jellemezhető azzal az egyenessel (és annak tulajdonságaival), amelyre az adatok illeszkednek (ha ilyen egyenes létezik).

Illesszünk egyenest a fenti ábrába!

Az illesztett egyenest (az illesztés módjával az óra későbbi részében foglalkozunk) két paraméterrel jellemezhetjük:

  •  a meredekséggel

  •  és az y tengely metszéspontjával

Az egyenes egyenlete általános esetben (emlékeztetőül a középiskolai matematika órák nyomán):

y=a+bx

ahol

a        az a pont, ahol az egyenes metszi az y tengelyt (y értéke, amikor x=0) (intercept)

b        az egyenes meredeksége, azaz egységenkénti emelkedése (ha az x tengelyen 1-et lépünk jobbra hányat kell lépni az y-on)

Mit jelenthet a meredekség?

Az egyenes meredéksége jellemzi az összefüggés irányát és mértékét:

  • negatív meredekség: fordított irányú összefüggés (minél nagyobb a független változó értéke, annál kisebb a függőé)

  • pozitív meredekség: egyenes irányú összefüggés

  • zérus meredekség: függetlenség

  • a meredekség abszolút értéke jellemzi a hatás erősségét

Nézzük meg a következő két ábrát és a hozzájuk tartozó egyenesek egyenletét!

A két ábrán az látjuk, hogy noha azonos adatokat használtunk, változott az összefüggés erősségét jelző b érték. Az egyetlen különbség a mértékegységben volt. Fontos tanulság, hogy a b értéke függ a felhasznált változók (mindkettő) mértékegységétől.

Ezért, ha több különböző adatforrást (például több országban elvégzett azonos kutatást) felhasználva hasonlítanánk össze az összefüggés erősségét, akkor ehhez figyelembe kell vegyük a mértékegységet. Ugyancsak így kell eljárjunk, ha több külöböző független változó hatását akarjuk összehasonlítani egy adott függő változóra (például arra vagyunk kíváncsiak, hogy a jövedelemet inkább az életkor vagy az elvégzett iskolai évek száma befolyásolja).

Itt nem részletezett módon (de egy kis gondolkodás után beláthatóan) a b értéke hasonlóan függ a szórás mértékétől is. A valódi megoldást a változók strandardizálása jelentheti (erről a következő fejezetben lesz szó).

Mit jelent az y-tengely metszéspont (intercept)?

Alapvetően könnyen beláthatjuk, hogy ha a független változó értéke nulla lenne, akkor ennyi lenne a függőváltozó értéke.

Vajon van-e ennek valódi (társadalomtudományi) jelentése? Ez attól függ, hogy milyen változókról van szó. Az életkor és jövedelem kapcsolatának vizsgálatakor az intercept nem értelmezhető, mert – elméleti ismereteink és mindennapi tudásunk alapján – tudjuk, hogy 0 éves életkorra semmilyen jellemző személyes jövedelem nem adható meg. A későbbiekben találkozunk olyan példával, ahol az intercept értéke értelmezhető.

Ismétlésként: Mit mondhatunk el az életkor és a jövedelem kapcsolatáról az eddigi ismeretek birtokában?