Ugrás a tartalomhoz

Matematikai statisztika

Tómács Tibor

Kempelen Farkas Hallgatói Információs Központ

6. fejezet - Regressziószámítás

6. fejezet - Regressziószámítás

Regressziós görbe és regressziós felület

Jelentse a Duna egy árhullámának tetőző vízállását Budapesten cm-ben, az árhullámot kiváltó csapadék mennyiségét mm-ben és a Duna vízállását Budapestnél az esőzés kezdetekor cm-ben. Joggal gondolhatjuk, hogy és értéke erősen behatárolja az értékét. Keressünk olyan függvényt, melyre teljesül, hogy

Az eltérés mértéke legyen

hasonlóan a szórásnégyzethez, ami a és eltérésének mértéke. Ha sikerülne olyan függvényt találni, amelyre a lehető legkisebb, akkor és mérésével közelítőleg meg lehetne jósolni , azaz az árhullám tetőzésének mértékét.

Általánosítva, ha az valószínűségi változók esetén az a feladat, hogy adjuk meg a lehető legjobb

közelítést adó függvényt, akkor az úgy értendő, hogy az

értékét kell minimalizálni. Ez az úgynevezett legkisebb négyzetek elve. Az így kapott továbbá ismeretében megbecsülhető lesz .

6.1. Tétel. Legyenek valószínűségi változók és . Az összes Borel-mérhető függvényt figyelembe véve akkor a legkisebb, ha

Bizonyítás. Legyen és . Ekkor

másrészt

Így kapjuk, hogy

melyből adódik az állítás.

6.2. Definíció. Ha valószínűségi változók, értékkészlete és véges, akkor a

függvényt az valószínűségi változó -ra vonatkozó regressziós felületének, illetve ennek meghatározását regressziószámításnak nevezzük. Speciálisan esetén regressziós görbéről beszélünk. Ha a regressziós felület lineáris függvénnyel írható le, akkor azt esetén (elsőfajú) regressziós egyenesnek, míg esetén (elsőfajú) regressziós síknak nevezzük.

6.3. Megjegyzés. Ismert, hogy esetén léteznek olyan konstansok, hogy . Tehát ha valószínűségi vektorváltozó normális eloszlású, akkor a regressziós felület egy lineáris függvénnyel írható le.