Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

A legjobban illeszkedő egyenes megtalálása (lineáris regresszió)

A legjobban illeszkedő egyenes megtalálása (lineáris regresszió)

A legjobb egyenes megtalálásához valamilyen módon minimalizálnunk kell az egyenes és az adatokat reprezentáló pontok távolságát (azaz az egyenes illeszkedését kell maximalizálnunk).

Ennek egyik lehetséges módja, ha a négyzetes távolságot minimalizáljuk a függő változó mentén. Ez az elv az úgynevezet legkisebb négyzetes eltérés módszere (angolul: least squares method). Más eljárásokat is követhetnénk, például az adatpontjaink távolságának abszolút értékeit összegezve kereshetnénk a minimumot, azonban egyéb, itt nem részletezett tulajdonságai miatt a négyzetes eltérés minimalizálása terjedt el. Azt az eljárást, amellyel megtaláljuk az adatainkhoz legjobban (értsd lekisebb négyzetes eltérés összeggel) illeszkedő egyenest, lineáris regressziónak nevezzük.

Illusztráció:

Év

Munkanélküliségi ráta

(gazd. akt. %-a)

Bűnözési ráta

(100 ezer főre)

1999

7

5009

2000

6,4

4496

2001

5,7

4571

2002

5,8

4135

2003

5,9

4076

2004

6,1

4140

2005

7,2

4323

2006

7,5

4227

2007

7,4

4241

2008

7,8

4066

2009

10,0

3928

Forrás: KSH és Belügyminisztérium