Ugrás a tartalomhoz

Matematikai statisztika

Tómács Tibor

Kempelen Farkas Hallgatói Információs Központ

Paraméteres hipotézisvizsgálatok

Paraméteres hipotézisvizsgálatok

Ha a nullhipotézis ismert eloszláscsaládból származó valószínűségi változók eloszlásainak paramétereire vonatkozik, akkor paraméteres hipotézisvizsgálatról beszélünk.

Egymintás u-próba

5.1. Feladat. Legyen , ahol ismeretlen és ismert, továbbá legyen a -re vonatkozó minta. A

hipotézisekre adjon adott terjedelmű próbát, ahol rögzített.

Megoldás. Először próbastatisztikát adunk. Korábban már bizonyítottuk, hogy teljesülése esetén

A kritikus tartomány megadásánál vegyük figyelembe, hogy az torzítatlan becslése, így teljesülése esetén várhatóan kritikus értékben eltávolodik 0-tól. Következésképpen a standard normális eloszlás szimmetriája miatt célszerűnek tűnik, ha az elfogadási tartomány alakú. Ha , akkor

így esetén . Tehát

elfogadási tartománnyal olyan próbát kapunk, melynek a pontos terjedelme . Ezt a statisztikai próbát nevezzük egymintás u-próbának.

5.2. Feladat. Az előző feladatot oldja meg illetve úgynevezett egyoldali ellenhipotézisekre is.

Megoldás. Itt is az előbbi próbastatisztikát fogjuk használni. Először legyen az ellenhipotézis . Ennek teljesülése esetén várhatóan kritikus értékben alatt van. Így az elfogadási tartomány jellegű. Ha , akkor

így esetén . Tehát

elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Ezután legyen az ellenhipotézis . Ennek teljesülése esetén várhatóan kritikus értékben fölött van. Így az elfogadási tartomány jellegű. Ha , akkor

így esetén . Tehát

elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

5.3. Feladat. Vizsgálja meg az egymintás u-próbában a másodfajú hiba valószínűségét. Bizonyítsa be, hogy a próba torzítatlan és konzisztens.

Megoldás. Először számoljuk ki az várható értékét és szórását:

Mivel az bármely értéke esetén normális eloszlású, ezért azt kapjuk, hogy

Most tekintsük a kétoldali ellenhipotézis esetét. Ekkor jelöléssel az erőfüggvény

Deriváljuk -t, melyből azt kapjuk, hogy szigorúan monoton csökken a intervallumon, illetve szigorúan monoton nő az intervallumon, továbbá minimum helye van -ban, és a minimum értéke . Az is könnyen látható, hogy . A következő ábrán grafikonját láthatjuk paraméterekkel.

Mindezek alapján tehát, ha teljesül, akkor , melyből következik, hogy a próba torzítatlan. Ha -t mint függvényét tekintjük, akkor könnyen láthatjuk, hogy minden esetén , melyből már következik, hogy a próba konzisztens, azaz a mintaelemek számának növelésével a másodfajú hiba valószínűsége 0-hoz tart.

Érdekes még azt is megvizsgálni, hogy miként változik a másodfajú hiba valószínűsége, ha az első fajú hiba valószínűségét, azaz -t csökkentjük. Ha csökken, akkor nő, hiszen növekvő függvény. Másrészt, ha -t mint függvényét tekintjük, akkor könnyen ellenőrizhető, hogy , azaz csökkenő. Mindezekből tehát kapjuk, hogy csökkentésével is csökken, azaz a másodfajú hiba valószínűsége nő.

Ezután tekintsük a egyoldali ellenhipotézist. Ekkor az erőfüggvény jelöléssel

szigorúan monoton növekvő, ezért szigorúan monoton csökkenő. Az is könnyen látható, hogy és . A következő ábrán grafikonját láthatjuk paraméterekkel.

Mindezek alapján, ha teljesül, akkor , melyből következik, hogy a próba torzítatlan. Ha -t mint függvényét tekintjük, akkor minden esetén , melyből már következik, hogy a próba konzisztens.

Ha csökken, akkor is csökken, másrészt ekkor növekedése miatt csökken. Mindezekből tehát kapjuk, hogy csökkentésével is csökken, azaz a másodfajú hiba valószínűsége nő.

A eset tárgyalását az Olvasóra bízzuk.

5.4. Megjegyzés. Érdemes még megfontolni a következőket. Tegyük fel, hogy az terjedelmű egymintás u-próbában -t elutasítjuk a kétoldali ellenhipotézissel szemben, azaz bekövetkezett az esemény. Ha most még azt is feltesszük, hogy is bekövetkezett (azaz ), akkor

miatt esetén biztosan -gyet, míg esetén biztosan -t fogadjuk el.

Viszont, ha a kétoldali ellenhipotézis elfogadása esetén következett be (azaz ), akkor

miatt esetén biztosan -gyet, míg esetén biztosan -t fogadjuk el.

Hasonlóan látható be, hogy ha -t elfogadjuk a kétoldali ellenhipotézissel szemben, akkor az egyoldali ellenhipotézisekkel szemben is elfogadjuk.

Így tehát, ha elvégeztük az egymintás u-próbát kétoldali ellenhipotézisre, akkor már fölösleges egyoldalira is megcsinálni, hiszen azok eredménye ebből már megadható a következő táblázat alapján:

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elfogadjuk

-t elfogadjuk

-t elutasítjuk

A táblázat úgy is értelmezhető, hogy esetén , esetén , illetve esetén mellett döntünk terjedelemmel.

5.5. Megjegyzés. A kritikus értékek kiszámolásánál az eddigiek alapján szükség van a ismeretére. Valójában azonban elég csak a használata. Ugyanis ellenhipotézisre vonatkozó döntés esetén az elfogadási tartomány ekvivalens azzal, hogy

Hasonlóan, illetve ellenhipotézisre vonatkozó döntés esetén az elfogadási tartomány ekvivalens azzal, hogy

Kétmintás u-próba

5.6. Feladat. Legyen független valószínűségi változók, ahol ismeretlenek és ismertek. Legyen a -re vonatkozó, illetve az -ra vonatkozó minta. A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

Megoldás. Ha igaz, akkor könnyen látható, hogy

Először vizsgáljuk a kétoldali ellenhipotézist. Ha ez teljesül, akkor várhatóan kritikus értékben messze van 0-tól. Következésképpen a standard normális eloszlás szimmetriája miatt célszerűnek tűnik, ha az elfogadási tartomány alakú. Ebből az egymintás u-próbával megegyező módon bizonyítható, hogy

elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Most legyen . Ha ez teljesül, akkor várhatóan kritikus értékben 0 alatt van. Így az elfogadási tartomány jellegű. Ebből az egymintás esettel megegyező módon bizonyítható, hogy elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Hasonlóan, esetén elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Ezt a statisztikai próbát nevezzük kétmintás u-próbának.

Itt is érvényes, hogy ha elvégeztük a kétmintás u-próbát kétoldali ellenhipotézisre, akkor már fölösleges egyoldalira is megcsinálni, mert azok eredménye ebből már megadható a következő táblázat alapján:

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

A táblázat szerint esetén , esetén , illetve esetén mellett döntünk terjedelemmel.

5.7. Feladat. Bizonyítsuk be, hogy a kétmintás u-próba esetén

(1) a próba torzítatlan;

(2) a két minta elemszámainak növelésével a másodfajú hiba valószínűsége 0-hoz tart;

(3) az elsőfajú hiba valószínűségének csökkentésével a másodfajú hiba valószínűsége nő.

Megoldás. Csak kétoldali ellenhipotézisre bizonyítunk, az egyoldaliakat az Olvasóra bízzuk. Könnyen látható, hogy az bármely értékei esetén

így jelöléssel

Tekintsük ezt, mint szerinti kétváltozós függvényt. Ekkor a szokásos eljárással kapjuk, hogy pontosan esetén van minimuma a függvénynek és ott az értéke. Ebből már adódik, hogy a próba torzítatlan.

Másrészt, ha -t, mint szerinti kétváltozós függvényt tekintjük, akkor esetén a határértéke 1. Ebből adódik a (2) állítás. Végül a (3) állítást hasonlóan kell belátni, mint az egymintás u-próbánál.

Egymintás t-próba

5.8. Feladat. Legyen , ahol és ismeretlenek, továbbá legyen a -re vonatkozó minta . A

hipotézisekre adjon adott terjedelmű próbát, ahol rögzített. A feladatot oldja meg illetve egyoldali ellenhipotézisekre is.

Megoldás. Korábban bizonyítottuk, hogy teljesülése esetén

A kétoldali ellenhipotézis teljesülése esetén várhatóan kritikus értékben messze van 0-tól. Következésképpen a t-eloszlás szimmetriája miatt célszerűnek tűnik, ha az elfogadási tartomány alakú. A továbbiakban legyen . Ha , akkor

így esetén . Tehát

elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Most legyen . Ennek teljesülésekor várhatóan kritikus értékben 0 alatt van. Így az elfogadási tartomány jellegű. Ha , akkor

így esetén . Tehát elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Hasonlóan, esetén elfogadási tartománnyal olyan próbát kapunk, melynek a pontos terjedelme.

Ezt a statisztikai próbát nevezzük egymintás t-próbának.

5.9. Megjegyzés. Az egymintás u-próbával vett analógia miatt itt is érvényes, hogy a kétoldali ellenhipotézis esetében meghozott döntés meghatározza az egyoldaliakkal szemben hozott döntéseket az ott található táblázat szerint. Szintén ezen analógia miatt erre a próbára is teljesül, hogy torzítatlan, konzisztens és az elsőfajú hiba valószínűségének csökkentésével a másodfajú hiba valószínűsége nő. Ennek bizonyításában az egymintás u-próbánál leírtakhoz képest csak annyit kell még felhasználni, hogy konzisztens becsléssorozata -nak.

Kétmintás t-próba, Scheffé-módszer

5.10. Feladat. Legyenek független valószínűségi változók, ahol ismeretlenek és . Legyen a -re vonatkozó, illetve az -ra vonatkozó minta . A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

A feladat megoldásához szükségünk lesz a következő tételre.

5.11. Tétel. Legyenek függetlenek, a -re, illetve az -ra vonatkozó minta . Ekkor

Bizonyítás. Korábban már bizonyítottuk, hogy függetlenek, továbbá

Ezekből kapjuk, hogy , továbbá . Könnyen látható, hogy

melyből kapjuk a tételt.

Most térjünk vissza a feladat megoldásához.

Megoldás. Az előző tételben bizonyítottuk, hogy esetén

Speciálisan esetén

A kétoldali ellenhipotézis teljesülésekor várhatóan kritikus értékben messze van 0-tól. Következésképpen a t-eloszlás szimmetriája miatt célszerűnek tűnik, ha az elfogadási tartomány alakú. A továbbiakban legyen . Ha , akkor

így esetén . Tehát

elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Hasonlóan az egymintás t-próbához kapjuk, hogy esetén elfogadási tartománnyal, míg esetén elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Ezt a statisztikai próbát nevezzük kétmintás t-próbának.

5.12. Feladat. Oldjuk meg az előző feladatot akkor is, ha az ismeretlen szórások viszonyát nem ismerjük.

Szükségünk lesz a következő tételre.

5.13. Tétel. Legyenek független valószínűségi változók és a -re vonatkozó, illetve az -ra vonatkozó minta . Ekkor és jelölésekkel

független valószínűségi változók.

Bizonyítás. Az állítás esetén triviális. Legyen és

Ekkor

másrészt és jelölésekkel

így

melyből kapjuk, hogy . Mivel alakú, azaz független normális eloszlású valószínűségi változók lineáris kombinációja, ezért . Még a függetlenséget kell belátni. Ehhez elég a megmutatása.

ezért esetén

Ezzel a bizonyítást befejeztük.

Most térjünk rá a feladat megoldására.

Megoldás. Az általánosság megszorítása nélkül feltehetjük, hogy . Az előző tétel szerint van olyan normális eloszlású várható értékű valószínűségi változó, hogy

-ra vonatkozó minta. Vegyük észre, hogy esetén . Végezzük el erre a mintára az egymintás t-próbát választással. Ekkor

miatt ennek a próbának a hipotézisei egybeesnek a feladat hipotéziseivel. Tehát legyen

és . Ekkor esetén elfogadási tartománnyal a próba pontosan terjedelmű. Másrészt esetén elfogadási tartománnyal, míg esetén elfogadási tartománnyal olyan próbát kapunk, melynek pontos terjedelme .

Ezt az eljárást Scheffé-módszernek nevezzük, amely tehát nem egy önálló próba, hanem egy eljárás, melynek révén úgy transzformáljuk a mintát, hogy azon az egymintás t-próba végrehajtható legyen, és ebből dönteni tudjunk a hipotézisekre vonatkozóan.

5.14. Megjegyzés. Tegyük fel, hogy a -re és -ra vonatkozó minták nem függetlenek, hanem úgynevezett párosított minták, azaz valójában a kétdimenziós vektorváltozóra vonatkozik. A feladat pontosan az, mint a Scheffé-módszernél volt, azaz a várható értékeket kell összehasonlítani. Ha teljesül, hogy normális eloszlású, akkor könnyen láthatóan, a Scheffé-módszer ( eset) itt is alkalmazható, azaz a különbség mintára kell végrehajtani az egymintás t-próbát választással.

F-próba

A kétmintás t-próbát azzal a feltétellel tudjuk alkalmazni, hogy az ismeretlen szórások megegyeznek. Ennek a feltételnek a teljesülését vizsgáljuk ebben az alszakaszban.

5.15. Feladat. Legyenek független valószínűségi változók, ahol ismeretlenek. Legyen a -re vonatkozó, illetve az -ra vonatkozó minta . A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

Szükség lesz a következő tételre.

5.16. Tétel. Legyenek független valószínűségi változók, a -re vonatkozó, illetve az -ra vonatkozó minta . Ekkor

Bizonyítás. Korábban bizonyítottuk, hogy

így ezek függetlensége miatt

Most térjünk vissza a feladat megoldására.

Megoldás. Az előző tétel szerint, ha igaz, akkor

A ellenhipotézis teljesülésekor várhatóan kritikus értékben messze van 1-től, hiszen a korrigált tapasztalati szórás torzítatlan becslése a szórásnak. Ezért az elfogadási tartomány alakú, ahol . A továbbiakban legyen . Tegyük fel, hogy esetén

azaz és . Mivel (lásd az F-eloszlás leírásánál található lemmát), így biztosan teljesül. Ezért az ezzel ekvivalens is teljesül. Mivel esetén

így elfogadási tartománnyal terjedelmű próbát kapunk.

A teljesülésekor várhatóan kritikus értékben kisebb 1-től. Ezért az elfogadási tartomány alakú, ahol . Mivel -ra

így esetén . Az biztosan teljesül esetén, így is teljesül. Tehát elfogadási tartománnyal terjedelmű próbát kapunk.

Végül ellenhipotézis teljesülése esetén várhatóan kritikus értékben nagyobb 1-től. Ezért az elfogadási tartomány alakú, ahol . Ekkor -ra

így esetén . Mivel biztosan teljesül, ha , ezért is teljesül. Tehát elfogadási tartománnyal terjedelmű próbát kapunk.

Ezt a statisztikai próbát F-próbának nevezzük.

5.17. Megjegyzés. Legyen és . Kétoldali ellenhipotézis esetén láttuk, hogy

elfogadási tartománnyal terjedelmű próbát kapunk. Mivel teljesülése esetén , ezért

elfogadási tartománnyal szintén terjedelmű próbát kapunk.

Ha , akkor válasszuk az első elfogadási tartományt. De ebben az esetben miatt biztosan teljesül. Tehát ekkor az elfogadási tartomány .

Ha , azaz , akkor válasszuk a második elfogadási tartományt. De ebben az esetben miatt biztosan teljesül. Tehát ekkor az elfogadási tartomány .

Ezzel bizonyítottuk a következőt. Legyen , továbbá , ha illetve , ha . Ekkor

elfogadási tartománnyal terjedelmű próbát kapunk. Ezzel a módszerrel tehát nem két, hanem csak egy kritikus értéket kell számolni.

Khi-négyzet próba normális eloszlás szórására

5.18. Feladat. Legyen , ahol és ismeretlenek. Legyen rögzített és a -re vonatkozó minta . A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

Megoldás. Tudjuk, hogy esetén

Mivel és a szórásnégyzet torzítatlan becslése, így teljesülése esetén várhatóan kritikus mértékben messze van -től. Így az elfogadási tartományt válasszuk alakúnak, ahol . A továbbiakban legyen . Tegyük fel, hogy esetén

azaz és . Mivel (lásd a khi-négyzet eloszlás leírásánál található lemmát), így biztosan teljesül. Ezért az ezzel ekvivalens is teljesül. Mivel esetén

így elfogadási tartománnyal terjedelmű próbát kapunk.

A ellenhipotézis teljesülésekor várhatóan kritikus mértékben kisebb -től. Azaz az elfogadási tartomány alakú, ahol . Mivel -ra

így esetén . Erre teljesül, hogy , mert . Tehát így elfogadási tartománnyal terjedelmű próbát kapunk.

Ha teljesül, akkor várhatóan kritikus mértékben nagyobb -től, azaz az elfogadási tartomány alakú, ahol . Mivel -ra

így esetén . Másrészt ekkor miatt esetén . Tehát így elfogadási tartománnyal terjedelmű próbát kapunk. Ez az úgynevezett khi-négyzet próba.

Statisztikai próba exponenciális eloszlás paraméterére

5.19. Feladat. Legyen , ahol ismeretlen. Legyen rögzített és a -re vonatkozó minta. A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

Megoldás. A intervallumbecslésénél láttuk, hogy esetén

Mivel az torzítatlan becslése, így a ellenhipotézis teljesülésekor várhatóan kritikus mértékben messze van -től. Azaz az elfogadási tartomány alakú, ahol . A továbbiakban legyen . Tegyük fel, hogy esetén

azaz és . Mivel (lásd a gamma-eloszlás leírásánál található lemmát), így biztosan teljesül. Ezért az ezzel ekvivalens is teljesül. Mivel esetén

így elfogadási tartománnyal terjedelmű próbát kapunk.

A ellenhipotézis teljesülésekor (ellentétben a korábbi próbákkal) várhatóan kritikus mértékben nagyobb -től. Azaz az elfogadási tartomány alakú, ahol . Mivel -ra

így esetén . Másrészt ekkor miatt esetén . Tehát így elfogadási tartománnyal terjedelmű próbát kapunk.

A ellenhipotézis teljesülésekor (ellentétben a korábbi próbákkal) várhatóan kritikus mértékben kisebb -től. Azaz az elfogadási tartomány alakú, ahol . Mivel -ra

így esetén . Erre teljesül, hogy , mert . Tehát így elfogadási tartománnyal terjedelmű próbát kapunk.

5.20. Megjegyzés. Vigyázzunk arra, hogy itt a egyoldali ellenhipotézisek esetében fordítva vannak az elfogadási tartományok, mint a korábbi próbáknál. Ennek megfelelően változik az is, hogy kétoldali ellenhipotézisnél meghozott döntés ismeretében mik lesznek a egyoldali ellenhipotézisekre a döntések. Ezt a következő táblázatban foglaljuk össze:

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

-t elutasítjuk

-t elfogadjuk

A táblázat úgy is értelmezhető, hogy esetén , esetén , illetve esetén mellett döntünk terjedelemmel.

Statisztikai próba valószínűségre

5.21. Feladat. Legyen , ahol ismeretlen. Legyen rögzített és a -re vonatkozó minta. A

hipotézisekre adjon adott terjedelmű próbát. A feladatot oldja meg

egyoldali ellenhipotézisekre is.

5.22. Megjegyzés. Ha egy esemény és , akkor , ahol az valószínűsége. Ezért a feladat úgy is megfogalmazható, hogy adjon az előző hipotézisekre terjedelmű próbát, ahol egy esemény valószínűsége.

Megoldás. Ismert, hogy ha igaz, akkor

Ha egy esemény indikátorváltozója, akkor az esemény bekövetkezéseinek a számát jelenti kísérlet után. Mivel a torzítatlan becslése, ezért esetén várhatóan kritikus mértékben eltávolodik -tól. Így ekkor az elfogadási tartomány alakú, ahol és . Az és feltételek azért kellenek, hogy a kritikus tartományban illetve ne legyenek lehetetlen események. Keressük meg a legkisebb illetve pozitív egész számokat, melyekre esetén teljesül, hogy

Az így definiált és esetén, ha , akkor

így ilyenkor elfogadási tartománnyal terjedelmű próbát kapunk. Az feltétel mindig teljesíthető és alkalmas megválasztásával.

esetén várhatóan kritikus mértékben alatt van, azaz az elfogadási tartomány alakú, ahol és . Legyen a legkisebb pozitív egész, melyre esetén teljesül, hogy

Az így definiált esetén, ha , akkor

azaz elfogadási tartománnyal terjedelmű próbát kapunk. Az feltétel itt is mindig teljesíthető és alkalmas megválasztásával.

esetén várhatóan kritikus mértékben felett van, azaz az elfogadási tartomány alakú, ahol és . Legyen a legkisebb pozitív egész, melyre esetén teljesül, hogy

Ekkor tehát elfogadási tartománnyal terjedelmű próbát kapunk. Az feltétel itt is mindig teljesíthető és alkalmas megválasztásával.

Az első két ellenhipotézisnél azért nem úgy választottuk a kritikus értékeket, hogy az elfogadási tartomány valószínűsége esetén -val egyenlő is lehessen, mert egyrészt ez csak ritkán érhető el az eloszlás diszkrétsége miatt, másrészt ekkor Excellel nehezebben tudnánk számolni.

Ha elég nagy, akkor az előbbi kritikus értékek kiszámolásához használhatunk egyszerűbb közelítő formulát is. Ehhez szükségünk lesz az úgynevezett folytonossági korrekcióra.

Folytonossági korrekció. Ha a feltétel teljesül, akkor és jelöléssel értékét nagyon jól közelíti . Legyen . Ekkor a következő ábráról látható, hogy az lépcsőssége és a folytonossága miatt még pontosabban megközelíti értékét.

Tehát és esetén

közelítések már nagyon jónak tekinthetők. Például, ha , , akkor teljesül, ezért használhatjuk a közelítést. Például értéke közelítőleg

ami öt tizedesjegyre kerekítve 0,02624. Ha nem használjuk a folytonossági korrekciót, akkor a

értéket kell használni közelítésnek, amely öt tizedesjegyre kerekítve 0,03310. Összehasonlításként igazi értéke 0,02478 öt tizedesjegyre kerekítve. Ebből jól látható, hogy a folytonossági korrekcióval pontosabb közelítést kaptunk.

5.23. Feladat. Az előző megoldásban felírt kritikus értékekre adjunk közelítő képletet esetén, a folytonossági korrekciót alkalmazva.

Megoldás. Az előző megoldás jelöléseit fogjuk használni. Az előbbiek miatt

melyből – figyelembe véve, hogy és alsó kritikus értéket jelent – kapjuk, hogy

jelöléssel . Hasonlóan kapjuk, hogy , és .