Ugrás a tartalomhoz

Matematikai statisztikai elemzések 3., Becsléselmélet: alapfogalmak, nevezetes statisztikák, intervallum-becslés

Prof. Dr. Závoti József (2010)

Nyugat-magyarországi Egyetem

3.2 Becsléselméleti alapfogalmak

3.2 Becsléselméleti alapfogalmak

A matematikai statisztika egyik fő területe a becsléselmélet: A valószínűségi eloszlások jellemző mennyiségeinek meghatározását paraméterbecslésnek nevezzük.

Példa: a mintában található selejtarány alapján következtetünk az egész sokaságban valószínűsíthető selejtszámra.

Konfidencia intervallum becslése: Mivel a becsléssel kapott érték általában nem azonos a keresett elméleti értékkel, ezért műszaki biztonsági okokból szükséges, hogy alsó és felső határt adjunk meg a becsült paraméterre.

3.2.1 A statisztikai minta fogalma

Definíció:

A statisztikai minta valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés eredménye, azaz véges sok azonos eloszlású valószínűségi változó.

Jelölés: Tekintsük a valószínűségi változót, ekkor a -re vonatkozó n elemű minta

1, 2,....., n

Az n számú kísérlet elvégzése során a i mintaelem egy-egy konkrét számértéket vesz fel:

1 = x1, 2 = x2 ,..., n = xn

A statisztikai minta reprezentatív, ha a mintaelemek eloszlása megegyezik a vizsgált valószínűségi változó eloszlásával, hiszen mindegyik kísérletnél magát a valószínűségi változót figyeljük meg.

A statisztikai minta elemei független valószínűségi változók, mivel a kísérleteket egymástól függetlenül végezzük.

3.2.2 Statisztikák

A mintaelemekből tapasztalati jellemzőket, u.n. statisztikákat konstruálunk.

Definíció:

A statisztika a mintaelemek valamely függvénye:

A statisztika maga is valószínűségi változó, és eloszlásának meghatározása fontos feladat.

A valószínűségszámítás tárgyalása során láttuk, hogy a valószínűségi változók eloszlása néhány számadattal (várható érték, szórás,...) kielégítően jellemezhető.

A várható érték az eloszlás súlypontjáról, a szórás a változó értékeinek szétszórtságáról ad felvilágosítást. Ezekre az elméleti jellemzőkre a mintaelemekből igyekszünk következtetni úgy, hogy a 1, 2, ...,n mintából különböző függvényeket képezünk. Valamely n = n(1,2,....,n) függvény minden konkrét minta esetén egyetlen számadatba tömöríti a mintaelemekben rejlő információt.

Milyen függvényt konstruáljunk a mintaelemekből, hogy minél jobb közelítését kapjuk az elméleti várható értéknek, az elméleti szórásnak és egyéb paramétereknek?

  1. Mintaközép

Tétel:

Ha a valószínűségi változó várható értéke μ, szórása σ, akkor a mintaközépre

Bizonyítás:

  1. Rendezett minta:

A véletlen, az észlelés sorrendjében kapott mintaelemeket rendezzük nagyság szerint. Jelölje a nagyság szerint a legkisebbet , a megmaradók közül a legkisebbet , stb.

Ekkor

A rendezett mintaelemek már nem függetlenek és nem is azonos eloszlásúak.

  1. Mintaterjedelem:

  1. Medián:

Ha a mintanagyság páratlan, akkor a középső mintaelem a medián - páros mintanagyság esetén a két középső átlaga.

  1. Tapasztalati (empirikus) szórásnégyzet:

A mintaközéptől vett eltérések négyzetének átlaga:

  1. Korrigált tapasztalati szórásnégyzet:

  1. Variációs tényező (relatív szórás):

3.2.3 A statisztikai becslések követelményei

  1. Torzítatlan becslés:

Ha a valószínűségi változó elméleti jellemzője az a paraméter, és az statisztikai mintából kívánjuk becsülni, akkor elvárjuk, hogy az statisztika értékei az 'a' szám körül ingadozzanak, azaz várható értéke ’a’ legyen:

Példa:

Az s2 tapasztalati szórás nem torzítatlan becslése a σ2 elméleti szórásnak.

Bizonyítás:

  1. Konzisztens becslés:

A minta elemszámának növelésével az statisztika egyre jobban közelítse meg az 'a' paramétert:

  1. Elégséges becslés:

Az statisztika tartalmazza az 'a' paraméterre vonatkozó összes információt.

  1. Efficiens becslés:

A legkisebb szórású torzítatlan becslés.