Ugrás a tartalomhoz

Biostatisztika

Fidy Judit dr., Makara Gábor dr. (2005)

InforMed 2002 Kft.

A statisztikai becslés

A statisztikai becslés

A fejezet tanulmányozásához szükséges előismeretek

  • Változók típusai, a folytonos változók

    • A minta és az alapsokaság

    • Hisztogram, relatív gyakoriság sűrűség, sűrűségfüggvény

      • A valószínűség mérőszáma: görbe alatti terület p(a,b) (Ellenőrző kérdések)

    • A minta jellemzése, a sokaság paraméterei

      • Átlag és szórás, a várható érték és a szórás (Ellenőrző kérdések)

  • A normális eloszlás és jellemzői (egyebek mellett: 68-95-99,7%)

    • Mintapélda: hallgatók testmagassága

      • A minta mérete és várható terjedelme. (a szórás „működése”, a „3 szabály”)

      • A std normális eloszlás és értelmezése (Ellenőrző kérdések)

    • A normális eloszlás kiemelt jelentősége az orvostanhallgatók számára:

      • A binomiális eloszlás és határeseti közelítése normálissal (Ellenőrző kérdések)

      • Az átlag eloszlása

        • Mintapélda: 16 fős csoportok átlagmagasságának eloszlása (Ellenőrző kérdések)

A pontbecslés

A statisztikai becslés egyszerű esete a pontbecslés. Az ismeretlent egy hozzá hasonlóval közelítjük (becsüljük). A „problémafelvetés” indító kérdéseinél a minta átlagát úgy tekinthetjük, mint a várható érték egy becslését, illetve a minta szórását úgy, mint a sokaság szórásának egy becslését.

Tulajdonképpen ugyanezt alkalmaztuk akkor, amikor az 50 hallgató testmagasság-adatából következtettünk (a normális eloszlásnál és az átlag eloszlásánál is alkalmazott példára utalok vissza): feltételeztük, hogy a hallgatók sokaságának várható értéke 170 cm pusztán azért, mert a testmagasság adatok átlagára ezt az értéket kaptuk. A –nek az

egy pontbecslése.

További alkalmazás e fejezetben, amikor az ismeretlen -t a mintából vett szórással, vagyis az sx-szel helyettesítjük: A -nak az sx egy pontbecslése.

Az intervallumbecslés

Második ilyen lehetőség az intervallumbecslés.

A probléma az előbbivel, a pontbecsléssel az volt, hogy nem igazán illeszkedik a célul kitűzött valószínűségi gondolkodásmódhoz: Nem rendelhetünk „valószínűséget”, „megbízhatóságot” a pontbecsléshez, pedig tudjuk, hogy ez csak egy többé-kevésbé bizonytalan közelítés. Az ok: folytonos eloszlásnál minden „éles” értékhez tartozó görbe alatti terület (= az adott érték bekövetkezési valószínűsége) nulla, ettől különböző valószínűség csak intervallumhoz tartozhat. (lásd: folytonos eloszlások, valószínűség sűrűség függvény)

Ezért felel meg az alább ismertetett (intervallummal becslő) gondolatmenet a valószínűségre alapozott döntéshozásnak (szemben a pontbecsléssel).

Az ismeretlen várható érték becslésénél az átlag és a szórás alapján két számot választunk – legyen ez a két szám „a” és „b” –, és az mondjuk, hogy az ismeretlen várható érték bizonyos valószínűséggel az (a,b) intervallumban – tehát „a” és „b” között – található. Ez a „bizonyos valószínűség” a becslés megbízhatósága, ami nyilván kisebb, mint 100%, de azért lehetőleg nem sokkal kisebb: Többnyire 99%, 95% vagy 90%-ot szoktunk választani.

Vagyis, arra a kérdésre, hogy „Mennyi (lehet) a értéke?”, ahelyett, hogy „a várható érték = (kb.)

” (ez lenne a pontbecslés), azt mondjuk: „a várható érték valahol az

körül, egy (a,b) intervallumban – „a” és „b” között – található „p” valószínűséggel (ez pedig az intervallumbecslés). Ez az (a,b) a várható érték p%-os megbízhatósági (idegen szóval: „konfidencia”) intervalluma.

Emlékezzünk, már korábban is használtunk ilyen nevezetes intervallumokat, melyekhez különböző valószínűség, megbízhatóság tartozott:Pl. az 5.1. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén adott intervallumba esés valószínűsége, és adott mintaelemszámnál az intervallumon belül és kívül eső elemek várható aránya. 5.1. táblázatban a testmagasság adatokra: Ha = 170 cm és = 8 cm (mint azt korábban feltételeztük – ez tehát pontbecslés!), akkor a ±2 intervallumban, tehát 154-186 cm-ig található az adataink kb. 95%-a. Ez úgy értelmezendő, hogy 1 adat esetén 95% a megbízhatósága, a valószínűsége annak, hogy az az 1 adat ebben az adott tartományban található. Sok adat esetén pedig az adatok 95%-a – pl 100 adatból 95 adat – található az adott intervallumban. Hasonlóan a ±3 tartomány az adatok 99,7%-át tartalmazza, stb.

5.1. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén adott intervallumba esés valószínűsége, és adott mintaelemszámnál az intervallumon belül és kívül eső elemek várható aránya.

   Arány (belül/kívül)
Interv Vsz.5-6201001000
 162-17868%4/1-2 14/668/32680/320
2154-18695%mind19/1 95/5 950/50
3146-19499,7% mindmind997/3


5.2. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén 16 elemű minták átlagainak adott intervallumba esésének valószínűsége, és adott csoportszámnál az intervallumon belül és kívül eső elemek várható aránya.

   Arány (belül/kívül)
/n168-17268%4/1-2 14/668/32680/320
2/n166-17495%mind19/1 95/5 950/50
3/n164-17699,7% mindmind997/3


Vagy, a 16 elemű minták átlagainak eloszlásánál (5.2. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén 16 elemű minták átlagainak adott intervallumba esésének valószínűsége, és adott csoportszámnál az intervallumon belül és kívül eső elemek várható aránya. 5.2. táblázat.) – amire = 170 cm és /n = 2 cm volt –, a ±2/n intervallum (a 166-174 cm közti tartomány), a csoportátlagok 95%.át tartalmazta (a sárga cella), és így tovább.

Ellenőrző kérdés: Az 5.2. táblázat szerint (a sárga cella alatt) a ±3/n tartományon belül – 164-176 cm közt – viszont már a 100 átlagból az összes belül található. Miért van ez így?

Válasz: Tudjuk, hogy a ±3/n tartományon belül 99,7%-a van az átlagoknak. Miért mondhatjuk, hogy ez gyakorlatilag az összes átlagot jelenti? Hogy értjük ezt a 99,7%-ot? Úgy, hogy 1000-ből 3 (100-ból 0,3) van kívül! Tehát átlagosan kb. minden 3 db ilyen 100-as csoportból – vagyis 3szor 100 ilyen, 16 elemű minta-átlagból – 1 olyan 100-as csoport lesz, amelyből 1 adat (átlag) kívül esik ezen a ±3/n tartományon. Ezért mondhatjuk, hogy, ha csak 1 ilyen 100-as csoportunk van, akkor abban várhatóan minden átlag belül lesz ezen a ±3/n tartományon. (Várhatóan, de nem feltétlenül)

Intervallumbecslés
-ra és alapján

A statisztikai intervallum-becslés gondolatmenetének megértéséhez induljunk ki a csoportátlagok már ismert eloszlásából. A testmagasság adatok példáján (5.2. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén 16 elemű minták átlagainak adott intervallumba esésének valószínűsége, és adott csoportszámnál az intervallumon belül és kívül eső elemek várható aránya. 5.2. táblázat) azt látjuk, hogy a körül ±1/n távolságban, tehát 168-172 cm-ig található az átlagok 68%-a. ±2/n távolságon belül, tehát 166-174 cm közt pedig a 95%-a. Ez azt jelenti, hogy 20 csoportátlag közül (sárga cella a táblázatban) várhatóan 19 ezen az intervallumon belül van, s csak 1 van ezen kívül. Az

5.1. ábra mutat egy ilyen lehetséges helyzetet, 20 különböző csoportátlagot külön (fekete) pontonként ábrázolva: 19 belül van a tartományon, 1 pedig kívül.

100 csoportátlag (kék pontok) közül viszont várhatóan 95 lesz belül a tartományon, s csak 5 kívül, ahogy itt az ábra alsó sorában a 100 pont mutatja.

Intervallumbecslés -re az
és alapján

Vegyük ezt a 100 különálló mintaátlagot, amit ez a 100 pont jelképez, (amit tehát úgy kaptunk, hogy 100, egyenként 20 fős csoport testmagasságait megmértük, és kiszámítottuk az átlagaikat), és rajzoljunk mindegyik köré egy ±2/n hosszúságú intervallumot. Tudjuk, hogy a körül egy ekkora intervallumon belül van 100 átlag közül kb. 95 (5.2. táblázat - = 170 cm = 8 paraméterű normális eloszlás esetén 16 elemű minták átlagainak adott intervallumba esésének valószínűsége, és adott csoportszámnál az intervallumon belül és kívül eső elemek várható aránya. 5.2. táblázat). A kérdés az, hogy ezen 100 különböző helyzetű, de egyforma hosszúságú intervallum közül hány tartalmazza a -t.

Ez jobban megérthető az 5.4. ábráról, amely ezeket az intervallumokat mutatja. Viszonyítási tartományként látszik a = 170 cm középpontú ±2/n = 8 cm széles tartomány (szaggatott vonallal). Látható, hogy:

Azon intervallumok, melyek közepe belül van ezen a ±2/n tartományon, azok tartalmazzák a -t. Hiszen az intervallumok közepe és a távolsága kisebb, mint a 2/n. Azt is tudjuk, hogy ilyen – a körüli viszonyítási intervallumon belüli – , vagyis 16-os csoportátlag, 95 volt a 100-ból.
A viszonyítási intervallumon kívüli 5 csoportátlag köré húzott ±2/n hosszúságú intervallumok pedig nem tartalmazzák a -t. Hiszen a -től ezen csoportátlagok távolabbiak, mint a 2/n.

Vagyis a 100 közül van 95 olyan átlagunk, ami köré húzott ±2/n intervallum tartalmazza, és van 5 olyan átlagunk, ami köré húzott ±2/n intervallum nem tartalmazza a -t.

Vegyük észre viszont, hogy a való életben csak egy átlagunk van, s nem tudjuk, hogy az iménti 100 közül valójában melyik az: a 95 közül, vagy az 5 közül egy? Ezt értjük azon, hogy: Ha 100 átlagunk lenne ugyanabból az eloszlásból, akkor azok köré húzott 95 intervallum tartalmazná a -t, 5 viszont nem. Ezt a 95-öt tekintjük az – ±2/n – becslés megbízhatóságának, az 5-öt pedig a hiba kockázat-ának.

Ez kulcsfontosságú: Megérteti a megbízhatóság fogalmát: „Ha 100 átlagunk lenne…”

Egy opcionális megjegyzés: Az imént ismertetett becslés, amikor

-ra és alapján készítettünk intervallumot, csak „elméleti jelentőségű”: Mivel a számunkra fontos helyzetekben sem a sem a nem ismert (sőt, meg sem ismerhető!), így ezzel a módszerrel csak ismeretlen jellemzők alapján lehetne becsülni ténylegesen ismert (megmérhető) értékeket. Ennek tehát „gyakorlati jelentősége” nincsen, csak az a szerepe, hogy az intervallumbecslés „konstrukcióját” bemutassa. A statisztikai becslés, mint döntéshozó eljárás célja épp fordított: ismert adatok/értékek alapján kell becsülni a nem megmérhető ismeretlent. Alább bemutatjuk, hogyan lehet a megfordítást, a gondolatmenet „talpára állítását” megtenni.

Az ismeretlen helyett használjuk az ismert sx-et! Hogy változik a megbízhatóság?

Most jön a fő probléma: Nem tudjuk létrehozni a ±2/n hosszú intervallumokat, mert nem ismerjük a -t! És itt jön a második kulcsgondolat ebben a gondolatmenetben: Helyettesítsük a -t a mintából vett szórással, vagyis az sx-szel. Erre az ad alapot, hogy a -nak az sx egy pontbecslése. Van azonban ennek az ötletnek egy „apró” problémája: Az sx lehet kisebb is és nagyobb is, mint a ! Így az sx/n is lehet kisebb is és nagyobb is – mint a /n volt – egy konkrét minta és a belőle számolt sx esetén. Hogy befolyásolja ez az imént megértett megbízhatóságot?

Az

5.3. ábrán: Nézzük először azt a 95 intervallumot, amely ±2/n hosszú intervallumként korábban még tartalmazta a -t. Ezek közül azok, amelyek hosszabbak lesznek (amelynél az sx nagyobb lett, mint volt: pl. az ábrán az első intervallum), azok továbbra is tartalmazni fogják. Azonban lesznek, amelyek ebből a 95-ből (a -nál rövidebb sx miatt) rövidebbek lesznek, s ezek egy része akár olymértékben is rövidülhet, hogy ezután már nem fogja tartalmazni. Mint itt az ábrán látjuk a második intervallumnál. Vajon ily módon hány eshet ki a 95-ből?

Egyelőre számoljuk ki azt, hogy hány lehet rövidebb! Feltételezhetjük, hogy az sx egyenlő (50%-50%) valószínűséggel lesz vagy kisebb, vagy nagyobb, mint a .

Ellenőrző kérdés: Hogyan becsülhető ez alapján, hogy a 95-ből hány intervallum rövidülhet?

Válasz: A rövidülő intervallumok lehetséges száma tehát becsülhető egy olyan binomiális eloszlás alapján, ahol az n = 95, a p = 0,5. Vagyis – a számolást elhagyom – 95% megbízhatósággal 40-60 azon intervallumok száma, melyek rövidebbek lesznek. Tehát ezek közül fordulhat elő néhánynál, hogy a továbbiakban már nem tartalmazza a -t.

Emlékezzünk, ez a becslés tehát az -ra és alapján tett becslésnél említett „elméleti jelentőségű” eljárás!

Nézzük, mi lehet az 5, eredetileg kívül levő közepű intervallummal? Néhány meghosszabbodhat, s ezek közül lehet olyan, amely ezután már tartalmazni fogja a -t, holott korábban nem tartalmazta. (Mint az ábra harmadik intervalluma.) Vajon az 5-ből hány lehet hosszabb? Ugye, legfeljebb 5!

Összegezve: 95-ből, ami eredetileg tartalmazta a -t legalább 40-nél van rá esély, hogy a rövidülés miatt ezután nem tartalmazza, míg az 5-ből, ami eredetileg nem tartalmazta, legfeljebb 5 tartalmazhatja ezután. A kérdés az, hogy: vajon mi a 95-ből kieső és az 5-ből hozzájövő egyenlege?

Nyílván ez attól függ, mennyire tér el az Sx/n (a standard hiba), a /n-től. Ez az eltérés pedig annál nagyobb lehet, minél kisebb az adatszám amiből kiszámoljuk Sx-et, hiszen annál bizonytalanabb a pontbecslés.

5.3. táblázat -

 N = 16adatN = 6adat
Megbízh.AlsóFelsőAlsóFelső
90%1,392,58  
95%1,292,712,823,20
99%1,112,96  

Vegyünk erre egy példát: Ha a /n = 2 cm lenne, akkor 16 adatnál az Sx/n lehetne a 2 helyett akár 1,29 vagy 2,71, tehát, mintegy 35%-kal eltérő a /n = 2 cm-től bármelyik irányban, lefelé és fölfelé is. Viszont, ha csak 6 adatból számoljuk ki az átlagot és a szórást, akkor a növelt bizonytalanság – szemben az előbbi 16 adatból kiszámolttal –, látszik abból, hogy ekkor az Sx értéke lehetne akár csak 0,8 vagy 3,2 (tehát mintegy 60%-kal lefelé is és fölfelé is eltérő) az eredeti 2 cm helyett. Ez látszik a mellékelt 5.3. táblázat - 5.3. táblázatból, ahol továbbá a biztonság vagy megbízhatóság hatása is jól követhető: Hogyan változnak ezen határok, ha a 95% helyett 90 vagy 99% megbízhatósággal kívánjuk ezeket az eltéréseket megadni.

Megjegyzés: Itt a intervallumbecslését Sx alapján (pontosabban annak visszafordítását) vetítettük előre. Ez nem része tananyagunknak (?), s a jelen gondolatmenethez nincs szükségünk az eredményére. Elég azt értenünk, hogy a – Sx cserével egyre jobban romlik a megbízhatóság, ha n csökken.

Összegezve: annál kisebb a megbízhatóság, minél kisebb a minták mérete, vagyis az n, annál nagyobb mértékű rövidülés lehet és így annál több intervallum eshet ki a „tartalmazza a -t” csoportból: Az eredeti 100-ból 95 helyett mondjuk csak 92, 90, 85, stb. A kérdés tehát:

Hogyan lehet ezt a megbízhatóság-csökkenést kompenzálni?

Mivel a hosszabb intervallum jelent(ett) nagyobb megbízhatóságot… … az a megoldás, hogy (emlékezzünk a normálisnál az 1-szeres /n-hez 68%, a 2-szereshez 95%, a 3-szoroshoz 99,7% tartozott!)

Növeljük az intervallumok hosszát, mégpedig az n-től függő mértékben! Minél kisebb az n, annál jobban kell növelni! A növelendő hossz a ±2Sx/n (vagyis 2 standard hiba), ebből azonban az Sx és a n is egy-egy fix érték. Növelni tehát csak a 2-es szorzófaktort tudjuk.

Honnan is jött (mit is jelentett?) ez a 2-es? Ez a normális eloszlásnál a 95% megbízhatósághoz tartozó eltérés (középtől a standard hiba egységekben mérve), és valójában a pontos értéke 1,96.

5.4. táblázat -

p% megb. Interv.: ± t*sx/n. – a t értékei:
Szbadságfok = n-1p = 95%p = 99%p = 99,7%
24,309,9220
52,574,035,51
82,313,364,28
102,233,173,96
152,132,953,59
202,092,853,42
502,012,683,16
10001,962,583,00
p% megb. Interv.: ± z*/n. . – a z értékei
 p = 95%p = 99%p = 99,7%
 1,962,583,00
 ? = 5%? = 1%? = 0,3%


Az 5.4. táblázat - 5.4. táblázat alján látjuk, hogy egy p% megbízhatóságú intervallum (a normális eloszlás alapján) n-től függetlenül az ± z*/n. A ’z’ konstans pár jellegzetes értéke (ezeket mutatja a táblázat): 95%-hoz 1,96, 99,7%-hoz 3.

Emlékezzünk, továbbá, hogy a z = 1-szeres távolsághoz 68% megbízhatóság tartozott.

A megbízhatóság szokásos mértéke még a 99%, és ehhez tartozna egy közbülső 2,58-as szorzófaktor, ami ugyancsak szerepel a táblázatban.

Vegyük azt is észre, hogy ezen p értékekhez tartozik egy-egy hibakockázati érték is (ezt itt most ?-val jelöltük): a 95%-hoz 5%, a 99-hez 1%, a 99,7-hez 0,3%.

A t eloszlás: az intervallumok n-től függő megnyújtása

Ugyancsak vegyük észre, hogy a táblázatban közölt 3 szám (tehát a megfelelő megbízhatósághoz tartozó távolság adatok), valójában a normál görbét határozzák meg:

Hiszen abból származtak. Tehát egy-egy ilyen számhármas meghatároz egy-egy megfelelő lefutású valószínűség-sűrűség függvényt: megadja, hogy mely intervallumon belül mekkora a valószínűség (görbe alatti terület).

Ezen pár fontos észrevétel után visszatérve a táblázat első részét vegyük szemügyre: hogyan is növeljük a szorzófaktort?

Maradjunk csak a 95% megbízhatóságnál: Így a kérdés az, hogyan is növeljük n-től függő mértékben az 1,96-os faktort? Az 5.7. táblázat felső része mutatja a megoldást: Ha nagyon nagy az n értéke (mondjuk 1000), akkor ez a növelés nagyon kicsi (észrevehetetlen), hiszen nagyon nagy n esetén az sx valószínűleg nagyon közel lesz a -hoz.

Tehát az Sx- cserenagy n esetén nem okoz érdemi intervallumhossz (s ezáltal megbízhatóság-) változást.

Azonban, ha csökken az n értéke (pl. ahogy a táblázatból látszik, n értéke 50 vagy az alatti lesz), akkor az eltérés az 1,96-hoz képest már jelentős: 2,0 – 2,1 – 2,2 – 2,3… (sőt, n = 5 körül felmehet 2,5-re), ahogy a táblázat mutatja.

Természetesen ugyanilyen növekedésre van szükség, ha 99%-os megbízhatóságot kérünk: akkor a 2,58 növekszik akár 4-ig vagy afölé, illetve a 99,7%-nál a 3 növekszik 4 … 5 … sőt efölé.

Vagyis, ahogy a táblázatból látjuk, minden n-hez tartozik egy-egy újabb számsor, szemben a normális eloszlásnál talált n-től független z értékekkel. Ezeket a számokat itt a táblázatban t értékeknek hívjuk. Minden egyes n-hez tartozó ilyen t értékek – ugyanúgy, ahogy az imént az adott z értékek a normális eloszlást –, egy-egy „t-eloszlás”-t határoznak meg: Minden n-hez egy-egy újabb „t-görbe” tartozik, amelyet az ún. szabadságfoka (n-1) határoz meg.

Így minden n-hez a megbízhatósági intervallum az ±t*sx/n módon lesz számolható. Magyarul: az intervallumot – a kívánt mértékben – egy növelt („t”) érték felhasználásával nyújtottuk meg. Konkrétan 16 adatnál – a táblázatból látjuk, ez megfelel n-1 = 15-ös szabadsági foknak –, tehát 16 adatnál az intervallum ±2,13*sx/n lesz, amely 95% megbízhatósággal tartalmazza a -t a korábban vett értelemben. (Tehát ezen azt értjük, hogy: „ha 100 átlagunk lenne, … stb.”)

A t-eloszlás jellegzetességei

Most itt közbevetőleg két további ábrán a t-eloszlással fogunk foglalkozni, s utána térünk vissza újra a konfidencia intervallumhoz. A kérdés az, hogy milyenek is ezek, a normálistól némileg különböző t eloszlások? Hasonlítsuk össze az

5.4. ábra alapján a std normálissal.

Emlékezzünk, hogy a folytonos eloszlásokat a valószínűség-sűrűség függvénnyel ábrázoltuk: Például a normális eloszlás esetén ez egy „harang alakú” görbe (Gauss görbe). A standard normális eloszlás esetén a vízszintes tengelyen mérjük a várható értéktől való eltérést std hiba egységekben. Egy adott (a,b) intervallumhoz tartozó görbe alatti terület pedig azt mutatja, hogy milyen valószínűséggel lehet ekkora (a és b közti mértékű) eltérés. A görbe alatti teljes terület 1 (100%), így bármely véges intervallumhoz 1-nél kisebb valószínűség tartozik.

Tudjuk, hogy t-eloszlás esetén a 95%-nyi görbe alatti terület a (normálisra jellemző ±2-szeres, pontosan 1,96 szoros helyett) a 2,1-, 2,2-, 2,3-, …stb. szeres std hibányi – vagyis az n-től függő mértékben egyre szélesebb – intervallumhoz tartozik. Tehát minden n-hez egy újabb t görbe tartozik mégpedig úgy, hogy középen kicsit alacsonyabbnak kell lenni (így lesz adott intervallumhoz tartozó terület/megbízhatóság kisebb). A széleken viszont kicsit magasabbnak, mint a std normális sűrűségfüggvénynek, hiszen a teljes görbe alatti terület mindegyik görbénél 1 kell legyen.

Az ábrán összevetünk egy ilyen t görbét – ez inkább csak ez eltérés jellegét mutatja – a std normális eloszlás sűrűségfüggvényével. A normális görbén (színezve az ábra jobb felén) a 95% megbízhatósághoz tartozó területfél (narancsszínnel satírozva), középtől az 1,96 std hibányi távolságig tart. Az ábra bal oldalán a T görbénél – ugye, ez a görbe középen kicsit alacsonyabb, ennek megfelelően a széleken kicsit magasabb –, ugyanakkora távolságnál levágva (a sárga terület) mindig kisebb, mint a normál görbe alatti (a narancs) volt – a kék terület pedig nagyobb, mint a zöld. Hogy ugyanakkora (95%) legyen ez a középső (sárga) terület, ahhoz kijjebb, a középtől távolabb kellene levágnunk. (Tehát amikor a levágott terület a két oldalon 5, egy oldalon 2,5%). Konkrétan pl. a T5-ös görbe esetén 2,57 std hibánál (lásd 5.7. táblázat adatai).

Tehát ez a fontos különbség a t görbék és a normális eloszlás sűrűségfüggvénye között a „farokrészen”, a görbék elnyúló, szélső szakaszán érzékelhető. Ezért nézzük meg néhány különböző t görbére, valamint a normális sűrűségfüggvényre összehasonlításként ezeket a külső széleket.

Az

5.5. ábrán jól látszik, hogy a normális (itt sárgával satírozott) görbe 2,5%-nyi területe (ami itt most a jobb oldalon a 95%-on kívül van), 1,96-tól indul kifelé.

A normális fölött haladó T10-es görbénél, ha ugyanitt vágnánk el, akkor a levágott terület jóval nagyobb lenne, mint a 2,5%, hiszen a T végig fölötte halad a normálisnak innen kifelé, ezen a külső szakaszon. Ezért, hogy a levágott terület ugyanakkora legyen, mint a normálisnál, hát kijjebb, itt konkrétan a 2,23-nál kell levágnunk. (Ezt jelenti az, hogy a T10-es görbénél a 95% valószínűséghez egy nagyobb távolság (nagyobb t érték), éspedig a 2,23 tartozik.)

Ugyanez a T5-ös görbén, amely még följebb fut: Ennek megfelelően még kijjebb kell levágni (éspedig 2,57-es távolságnál), hogy a levágott terület 95% legyen középen, és 2,5-2,5% a két végén.

Vagyis ezen „kritikus számok” (melyeket az 5.4. táblázat - 5.4. táblázatban láttunk) jelentése: Hol kell elvágni a görbét, hogy a középső terület 95%, a levágott két kis farokterület együtt 5% legyen.

Az
±t*sx/n intervallumbecslés a -re

Alkalmazzuk ezt most – visszatérve – a 100 mintaátlag köré húzott intervallumokra. Mit is alkalmazunk? Azt, hogy az n-től függő mértékben megnöveljük a 2-es szorzófaktort. Ha 16 adatból számítottuk a mintaátlagokat, akkor konkrétan 2,13-ra növeljük a szorzófaktort.

Magyarul, (a 100 különböző minta 100 átlaga és 100 szórása alapján) a különböző középpontú (különböző átlagú) és különböző hosszúságú (eltérő szórású) minták intervallumait úgy számoljuk ki, hogy a std hibát 2,13-al szorozzuk, szemben a normál eloszlásnál korábban használt 2-es (1,96-os) szorzófaktorral.

Nézzük meg, mi lesz ennek a hatása az eredetileg 95 belül levő átlag esetén. (Az Sx- csere miatt egy részük rövidebb, egy részük hosszabb lett, mint az eredeti, s most ezt mind egységesen – „t” mértékében – megnyújtjuk!)

Az Sx- csere miatt változott hosszúságú intervallumok egy része változatlanul tartalmazta -t. Ezek a t-vel történt megnyújtás után – ezt mutatja az

(Az ábra könnyebb olvashatósága miatt a /n helyett * jelölés szerepel.)

5.6. ábrán az az 1., 2., és 3. bejelölt mintát jelző intervallum – változatlanul tartalmazzák a -t. Viszont voltak olyan, eredetileg belül levő átlagú intervallumok, amely az Sx- csere („jelentős” rövidülés) miatt a továbbiakban már nem tartalmazzák: Ezek egy része a t-vel történt nyújtás után újra tartalmazhatja, más része azonban továbbra sem (az utóbbira példa az ábra 96-ként jelölt intervalluma).

Viszont az eredetileg kívül levő közepű 5 intervallumból (akár az Sx- csere miatti hossznövekedés, akár a t-vel történt megnyújtás miatt) lehet olyan, ami már ezután tartalmazni fogja a -t. Így kompenzálva az imént látott „eredetileg belső közepű, de az Sx- csere miatt -t nem tartalmazó” intervallumo(ka)t (lásd az ábra 95. jelű intervallumát).

E két hatás (vagyis a belül levő közepű, de túlzottan megrövidült és a kívül levő közepű, de eléggé megnyúlt intervallumok száma) épp kompenzálni fogja egymást.

A t értéke azért épp akkora, mert ennél a növekedésnél egyenlítődik ki éppen a kieső és a belépő intervallumok száma, vagyis áll helyre a megbízhatóság eredeti (Sx- csere előtti) értéke! Vagyis a 2-es faktor növelése miatt újra épp 95 intervallum fogja tartalmazni a -t.

Továbbá a 95 belső közepű, de sokat rövidült, s így ?-t már nem tartalmazó intervallum(ok) plusz mindazon külső közepűek, amik nem növekedtek meg eléggé az 5 közül, hogy ezután már tartalmazzák, azok együttvéve újra csak 5 intervallumot adnak a 100 közül, melyek továbbra sem tartalmazza a -t.

Tehát: Az

±t*sx/n módon készített 100 különböző középpontú (amelyek a minta-átlagainkat jelentik) és különböző hosszúságú (amelyek a minták szórásaiból adódnak) intervallumból – az n-től függő („t érték”) megnyújtás miatt – újra 95 fogja tartalmazni a -t. Vagyis az

±t*sx/n intervallum a -nek egy p% megbízhatóságú intervallumbecslése, ami abban az esetben, ha az n = 16 és p = 95%, akkor éppen t = 2,13-al számolandó.

Ez az a t-érték, amit a 5.5. táblázat - 5.5. táblázat tartalmazott: Mutatva, hogyan függ n-től és p-től ez a t érték. Amely mögött, ugye, az egyes t eloszlásokhoz tartozó görbék húzódtak. Minden statisztika könyvben részletes táblázatot találhatunk a különböző n-hez tartozó (tehát különböző szabadsági fokú) t-görbék különböző megbízhatósághoz tartozó t értékeiről. Javasoljuk, hogy ennek ellenére érdemes megjegyezni legalább a leggyakrabban használt 95%-os megbízhatósághoz tartozó alábbi értékeket:

5.5. táblázat -

Szab fok (= n-1)t-érték
a 95%-os megbízhatósághoz tartozó értékek
kb. 8kb. 2,3
kb. 12kb. 2,2
kb. 20kb. 2,1
kb. 50kb 2,0
Nagy, pl. 10001,96


Vagyis a gondolatmenetünk eredménye: elkészült egy tetszőleges – leggyakrabban 95%-os – megbízhatóságú becslés számolási formulája. Már csak alkalmaznunk kell konkrét számolási helyzetekre.

Mintafeladatok a -re vonatkozó ±t*sx/n intervallumbecslésre

1. mintapélda

Egy 16 fős hallgatói csoport testmagasság adataiból az átlag 175 cm, a szórás 10 cm. Kérdés, lehet-e a sokaság várható értéke a 170 cm? Magyarul: tulajdoníthatjuk-e a 170 és a kapott 175 cm közti eltérést csak a véletlennek?

Ha a 16 fős csoport hallgatói külföldiek, eltér-e lényegesen a külföldi hallgatók testmagassága a magyar hallgatókra jellemző 170 cm-es várható értéktől, vagy az eltérés tulajdonítható csak a véletlennek? (Megjegyzés: Emlékezzünk, a 170 cm-es várható értéket pontbecsléssel nyertük egy nagyobb létszámú magyar hallgatói minta átlagából!)

A számolás rendkívül egyszerű: Mivel t értéke 95% megbízhatóság és n-1 = 15szabadsági fok esetén: 2,13, a -re vonatkozó 95%-os megbízhatósági intervallum: 175±2,13*10/16 cm, vagyis 175±2,13*2,5 cm. Tehát az intervallum: 169,67 – 180,33 cm. A 170 cm ezen belül van, tehát egy lehetséges , egy lehetséges várható érték.(Tekintve, hogy a 95% megbízhatóságot használtuk, ezért ez a becslésünk 5% hibakockázattal jár.) Tehát a 175 cm nem tér el lényegesen a 170 cm-től!

2. mintapélda

Egy 9 fős beteg csoport szérum albumin adatára 3,9 mg/100 ml átlag és 0,6 mg/100 ml szórás adódott. Lehet-e vajon a betegek várható értéke az egészségesekre jellemző 4,2 mg/100 ml? Másként fogalmazva: lényegesen eltér-e a kapott 3,9 a várt 4,2-től? Még másként fogalmazva: lényegesen eltér-e a betegeknél kapott érték az egészségesekétől?

A számolás: A 95% megbízhatósági intervallum a -re: 3,9±2,3*0,6/9, vagyis 3,9±2,3*0,2. Vagyis 3,43 – 4,33 mg/100 ml. A 4,2 ezen belül van, tehát egy lehetséges várható érték – ismét 5% hibakockázattal. Tehát a 3,9 nem tér él lényegesen a 4,2-től!