Ugrás a tartalomhoz

Matematikai módszertani példatár

Vásárhelyi Éva (2013)

ELTE-TTK

6 Valószínűségszámítás, statisztika

6 Valószínűségszámítás, statisztika

Ebben a fejezetben célunk az, hogy összefoglaljuk és megvilágítsuk azokat a gondolkodási folyamatokat, eljárásokat, amelyek segíthetik a hallgatókat a feladatok megoldásában, azok megértésében. Nem azt tűztük ki célul, hogy nehezebbnél nehezebb feladatokat adjunk fel és oldjunk meg, hanem a saját gyakorlatunkból merítve, a felmerülő gondolkodási folyamatokra, a megoldási módszerek ismertetésére akarunk koncentrálni.

6.1 Alapfeladatok és kompetenciák

A valószínűségszámítási, statisztikai feladatok megoldása során fejlesztendő a diákok rendszerezőképessége. Az általános iskolai képzés végére a tanulók legyenek képesek adatsokaságot jellemezni, ábrákról adatsokaság jellemzőit leolvasni. Szisztematikus esetszámlálással tudják meghatározni egy adott esemény bekövetkezésének esélyét.

6.1.1 Valószínűségszámítás és matematikai statisztika az iskolai tananyagban. (10. tétel)

A véletlen esemény fogalma. Kombinatorikus és geometriai módszerek. Valószínűségszámítási szemléltetések (fa diagram, kettős fa diagram). Statisztika és valószínűségszámítás kapcsolata. Leíró statisztika alapvető céljai.

A valószínűségszámítás és matematikai statisztika tanítása az első négy osztályban folyó számolási-számítási, elemi gondolati, logikai kompetenciák megalapozása után, az ötödik osztályban kezdődik (tulajdonképpen már előbb is, véletlen a játékokban, adatgyűjtés, strigulázás a mindenkori tanterv függvényében már alsóban is szerepelhetnek). Természetesen az életkori sajátosságok figyelembevételével a gyakorlathoz és a mindennapi élethez kapcsolódó tevékenységekkel, feladatokkal kapcsolatban merülnek fel először azok az ismeretek, amelyek ehhez a témakörhöz tartoznak. A statisztika valamint a valószínűségszámítás felépítése egyre absztraktabb szinteken keresztül a 12. évfolyam végéig tart.

A téma az iskolai és az egyetemi tananyagban:

  1. Az 5.-8. osztályban a tanulóknak az alábbi ismeretanyaggal kell találkozniuk:Adatok, gyűjtése a tanulók közvetlen környezetéből, illetve 7.-8.-ban egyéb forrásokból, azok rendszerezése, táblázatba foglalása, ábrázolása.Lényegtelen, hogy a gyerekek saját fél- vagy egyperces szívverésüket számlálják, vagy a tanterem előtt adott időegység alatt elhaladó piros autókat, vagy fehér libákat. A lényeg az, hogy saját maguk gyűjtsenek adatokat, azokat valamilyen logikus elrendezés szerint rögzítsék és az osztályban a tanár vezetésével közösen feldolgozzák. Ebben az időszakban jelenik meg a gyakoriság, a relatív gyakoriság, a rendezett halmaz, a rendezett minta, valamint a középértékekre jellemző mérőszámok, azaz az átlag, a medián és a módusz. Ezek kiszámítása csak kevés számú adat esetén feladat. A továbbhaladási feltételek szerves részét képezi az adatok megjelenítése grafikonok, diagramok segítségével. Fontos téma a grafikonokkal történő manipulációk megismerése.A tanárnak ennél az anyagrésznél lehetősége nyílik a nagyon mély tantárgyi koncentráció megvalósítására, hiszen a történelem, földrajz, biológia ... tantárgyakban számolatlanul sok lehetőség nyílik táblázatok, grafikonok statisztikák használatára és elemzésére. Az egyes oszlop-, vonal- vagy pontdiagramok készítése elemi feladat, később a százalékszámítás megjelenése után pedig kör- és szalagdiagramokat is kell készíteni. Lényeges elem, hogy ne a tanulókat hidegen hagyó (Ausztrália GDP-jének alakulása a 60-as években) adatokból, hanem az ő érdeklődésüket is felkeltő, életkori sajátosságaikhoz igazodó adatokkal dolgozzunk az órákon.(SAJÁT PÉLDA)A relatív gyakoriság alapos megismerése után a tanulók elemi példákon keresztül becslik, illetve kiszámítják egyes elemi események valószínűségeit (kockadobások, sorsolások, leszámlálásos feladatok).Hasznos olyan esteket választani, amelyeknél valami logikával ki tudjuk számolni a valószínűséget, s ezt összevethetjük a relatív gyakoriság alakulásával.(SAJÁT PÉLDA)Ezekhez a fogalmakhoz az első 4-5 valószínűségszámítás előadás anyaga kapcsolódik szervesen, amikor a valószínűség axiomatikus bevezetése után belátjuk, hogy a Bernoulli-törvény értelmében (a nagy számok törvényének valószínűségekre vonatkozó alakja) egy A esemény bekövetkezésének relatív gyakorisága sztochasztikusan konvergál az adott esemény P(A) valószínűségéhez. A statisztika témakörben az egyetemi kurzusokon elhangzik a medián, a módusz és az átlag definíciója is, mint jellemző középértékek, sőt megismerkedünk a várható érték fogalmával és kiszámítási módjával is, kezdetben csak diszkrét valószínűségi változókra.Az elemi leszámlálásos feladatmegoldásokat kombinatorikus meggondolásokkal, illetve statisztikai döntésekkel támaszthatjuk alá.(SAJÁT PÉLDA).

  2. A 9.-12. osztályban a tanulóknak az alábbi ismeretekkel kell találkozniuk:Kezdetben, azaz a 9. osztályban csak az 5.-8. osztályban tanultak újragondolása, ismétlése és nagyobb adathalmazokra alkalmazása a feladat. Itt fontos szerepet kaphat a számítógép vagy a grafikus kalkulátor. Újra alkalmazzuk a mediánt, a móduszt és az átlagot, most már nem csak a számtani, hanem a súlyozott számtani közép esetében, valamint egyes esetekben megjelenik, mint jellemző érték a mértani közép.Említhető a harmonikus és a négyzetes közép is. Ezek megjelennek az egyetemi tananyagban általánosan, mint a várható érték tetszőleges függvényei, illetve mint egy valószínűségi változó függvényének várható értékei. Ismétlésre kerül még a diagramkészítés és ezzel együtt a valószínűségek arányokkal, illetve százalékokkal történő megadása.Módszertani szempontból ezeket a témaköröket is mint minden hasonló esetben a párhuzamosan futó tantárgyakkal, illetve a fiatalokat érintő-érdeklő adatokkal összefüggésben érdemes bemutatni.(SAJÁT PÉLDA)Ebben az évben, csakúgy, mint a korábbiakban, jelentős szerepe van a valószínűségi kísérletek végrehajtásának, azok valóságos kivitelezésének. Érdemes és tanulságos az egyes tanulók vagy tanulói csoportok eredményeinek összesítése, ahol a tanulók érezhetik, hogy eredményeikkel mennyire járulhatnak hozzá az osztály összességének eredményeihez, mekkora hatással vannak az átlagra.(SAJÁT PÉLDA)A 10.-11. osztályban bevezetésre kerül a terjedelem, majd az átlagtól való eltérés mérésének szükségessége, néhány ilyen mérőszám, köztük a szórás és megjelenik a valószínűségi kísérletek elvont végrehajtása, tehát amikor nem feltétlenül hajtunk végre kísérleteket, hanem azokat teoretikusan, idealizált körülmények között végezzük el. A tanulók megismerkednek a klasszikus’’ valószínűségi modellel, tehát amikor minden elemi esemény (csak véges sok!) egyenlő valószínűséggel következik be. Ekkor alkalmazni lehet a valószínűség meghatározására a mindenki által jól ismert

    valsznsg = kedvez esetek szma sszes esetek szma

    formulát. Nem keverendő a hasonló relatív gyakoriság formulával.Az egyes események valószínűségeinek meghatározása már nem csak leszámlálással, hanem kombinatorikus formulák segítségével is történhet. Sok-sok példán keresztül el kell sajátítani a binomiális eloszlásra vezető visszatevéses mintavételből származó egyes események valószínűségeinek kiszámítási módját. Ennek az eloszlásnak a fontossága a nagy számok törvényében csúcsosodik ki, mivel az egymásután végzett kísérletek modelljeként vezethető be.Más eloszlások, mint az egyenletes, illetve a visszatevés nélküli mintavételezésből származó hipergeometriai eloszlás is megjelennek, illetve egyéb kombinatorikus úton kiszámítható valószínűségek.Érdemes felhívni a figyelmet a feladatkitűzők által igen kedvelt sztenderd’’ megoldási eljárásokra: ilyenek az egyes esetek osztályokba sorolása, párokba rendezése, valamint az esemény tagadásának (komplementerének) meghatározása.(SAJÁT PÉLDA)12. osztály: A szórás kiszámításának különböző módjai, azok értelmezése, különböző konkrét eloszlások esetén, valamint a binomiális (és a hipergeometriai) eloszlás szórása általános esetben (utóbbi csak kiegészítő anyag!). További kitekintésként megjelenhetnek a folytonos eloszlások közül a normális eloszlás, különösen akkor, ha más tárgyakhoz köthető grafikonokat is elemeznek az órákon.(SAJÁT PÉLDA)

  3. Az iskolai tananyag megalapozása az egyetemi előadásokonAz egyetemi előadások és gyakorlatok jelentős mennyiségű elméleti hátteret adnak diszkrét állapotterű stacionárius átmenet-valószínűségű Markov-láncokhoz, valamint egyéb folytonos eloszlású valószínűségi változókhoz. Részletesen tárgyalja az előadó és a gyakorlatvezető a következő eloszlásokat: karakterisztikus, egyenletes, binomiális, hipergeometriai, Poisson, negatív binomiális, illetve a folytonos eloszlások közül az egyenletes, exponenciális, gamma és normális eloszlásokat. Bevezetésre kerül a várható érték és a szórás elméleti fogalma, azok kiszámítási módjai és tulajdonságai. Része még az anyagnak a korreláció, a lineáris regresszió, a Markov-, Csebisev-egyenlőtlenség, a nagy számok gyenge törvényei, a Moivre-formula, valamint statisztikából a becsléselmélet és a hipotézisvizsgálat alapjai. Ezek hasonlóan a többi egyetemi kurzushoz azt szolgálják, hogy a tanárnak átfogóbb, mélyebben kiterjedő tudása legyen, amelynek magasságából jobban átlátja a tárgy struktúráját, felépítésének lépéseit.

Irodalom

Bognárné-Nemetz-Tusnády: Ismerkedés a véletlennel. []

Pálfalvi Józsefné: Matematika didaktikusan. [] 148-166. Vancsó Ödön (szerk.): Matematika kézikönyv. [] 26. és 27. fejezet

Kitekintő irodalom

Vancsó Ödön: Lesz-e olyan pillanat, amikor minden táncos „halott”? []

Velkeyné Grétzy Alice - Vancsó Ödön: Hány üveg üdítőt kell átlagosan vennünk, hogy összegyűjtsük mind a 6 különböző kupont? []

6.1.2 A kerettanterv elvárásai

Alsó tagozat

  • Adatokról megállapítások megfogalmazása.

  • Tapasztalati adatok lejegyzése, táblázatba rendezése. Táblázat adatainak értelmezése.

  • Adatgyűjtés, adatok lejegyzése, diagram leolvasása.

  • Valószínűségi játékok, kísérletek értelmezése. Biztos, lehetetlen, lehet, de nem biztos tapasztalati ismerete.

Felső tagozat

  • Egyszerű diagramok készítése, értelmezése, táblázatok olvasása.

  • Néhány szám számtani közepének kiszámítása.

  • Valószínűségi játékok, kísérletek során adatok tervszerű gyűjtése, rendezése, ábrázolása.

  • Valószínűségi kísérletek eredményeinek értelmes lejegyzése, relatív gyakoriságok kiszámítása.

  • Konkrét feladatok kapcsán a tanuló érti az esély, a valószínűség fogalmát, felismeri a biztos és a lehetetlen eseményt.

  • Zsebszámológép célszerű használata statisztikai számításokban.

  • Néhány kiemelkedő magyar matematikus nevének ismerete, esetenként kutatási területének, eredményének megnevezése.

Középiskola

  • Adathalmaz rendezése megadott szempontok szerint, adat gyakoriságának és relatív gyakoriságának kiszámítása.

  • Táblázat olvasása és készítése; diagramok olvasása és készítése.

  • Adathalmaz móduszának, mediánjának, átlagának értelmezése, meghatározása.

  • Véletlen esemény, biztos esemény, lehetetlen esemény, véletlen kísérlet, esély/valószínűség fogalmak ismerete, használata.

  • Nagyszámú véletlen kísérlet kiértékelése, az előzetesen jósolt’’ esélyek és a relatív gyakoriságok összevetése.

  • Statisztikai mutatók használata adathalmaz elemzésében.

  • A valószínűség matematikai fogalma.

  • A valószínűség klasszikus kiszámítási módja.

  • Mintavétel és valószínűség.

  • A mindennapok gyakorlatában előforduló valószínűségi problémákat tudják értelmezni, kezelni.

  • Megfelelő kritikával fogadják a statisztikai vizsgálatok eredményeit, lássák a vizsgálatok korlátait, érvényességi körét.

6.1.3 Leszámlálással (is) megoldható feladatok

Nagyon gyakran előfordul, hogy a diákok nem találnak rá arra a helyes, esetleg nem is létező kombinatorikus alakra, ami az adott feladathoz könnyen megadja a keresett esemény valószínűségét. Bizonyos esetekben ilyenkor célravezető arra bíztatni őket, hogy nosza, írják fel a lehetséges összes esetet, majd vizsgálják meg, hogy azok egyenlő valószínűségűek-e. Ha kiválogatják közülük a keresett eseménynek megfelelőket, akkor már meg is oldották a példát. Sokszor nagyságrendekkel könnyebben lehetett felíratni a hallgatókkal az eseteket, mint megkerestetni a logikai hibát valamely kombinatorikus formulában. A további általános megjegyzések helyett álljon itt néhány példa az esetek bemutatására.

6.1. Feladat: Három kockát feldobunk. Mi a valószínűsége annak, hogy van köztük hatos, ha mindegyik dobás különböző.

MEGJEGYZÉSEK A FELADATHOZ:

Gyakran előfordul, hogy egy csoporton belül több megoldást is hoznak a hallgatók. Ezek néha jók, néha kicsit tévesek, néha rosszak. Ilyenkor érdemes feltenni a kérdést a tanulóknak: Fel tudnátok sorolni az összes lehetséges esetet?’’ A lustábbak zúgolódni szoktak, hogy ne már, az iszonyú sok , de mindig van aki neki áll. Ők nyernek. A táblán összesítve szépen rendezetten az alábbi számhármasok jelennek meg, félkövérrel szedve azok, amelyekben van hatos:

29. táblázat

Ezek után kacagtatóan egyszerű megszámolni, hogy 10 esetben van hatos, az összesen 20 számhármas között. Ha még azt is hozzáteszi valaki, hogy mindegyik eset egyforma valószínűségű, akkor máris megkapjuk a keresett 1/2 valószínűséget.

Igen, a hallgatók fele tudja, hogy fel lehet írni a megoldást sokféleképpen kombinatorikusan is. A mellett, hogy őket megdicsérjük, az is célunk kell legyen, hogy azok számára is világosságot gyújtsunk, akik a feladatot nehezebben látják át.

A sztenderd hibás megoldások a következők szoktak lenni:

Kell dobnom egy hatost. Erre egy lehetőségem van. A következő dobásom ötféle, a harmadik pedig négyféle lehet, ez összesen 154=20 lehetőség. Az összes lehetőség persze 654=120, így a keresett valószínűség 20120=16.

Ilyenkor mindig érdemes a tanulókat megkérdezni, hogy mi az ő véleményük, hol a hiba? Mindig előkerül a jó válasz. Amit korábban lefelejtettek, az egy hármas szorzó. Az egyetlen hatos nem csak az első, hanem a második, illetve a harmadik helyen is előfordulhat, azaz a kijavított módon ők is a helyes eredményt kaphatják:

1 5 4 + 5 1 4 + 5 4 1 120 = 3 20 120 = 1 2 .

Nagyon gyakori hiba, hogy a tanuló keveri az egyes leszámlálási módokat. Egy ilyen megoldási módszer, ami gyakran előkerül, a következő. Válasszunk egy hatost és két különböző számot a maradék ötből. Erre (52)=10 lehetőségünk van, ez lesz a kedvező esetek száma. Ugyanekkor a nevezőben az összes eset számánál sokan a 654=120 formulával számolnak, amiből a hibás 10120=112 eredmény adódik. Persze ezt is könnyen lehet korrigálni, ha vagy a számlálót vagy a nevezőt módosítjuk. Most is célszerű a tanulókkal megkerestetni a hibát, mert tipikus, hogy a klasszikus

P = # { kedvez esetek } # { sszes eset }

formulában más és más logika alapján következtetnek a számlálóra és a nevezőre. Ha a számlálót javítanánk, akkor a már korábban ismertetett alakú törtet kapnánk, javítsuk hát most a nevezőt. Az összes eset száma (63)=20, azaz a keresett valószínűség most is

( 5 2 ) ( 6 3 ) = 10 20 = 1 2 .

Egy másik hasonló jellegű feladat a következő:

6.2. Feladat: A Mancehester United focicsapata kétkapus edzést tart. Az első csapat keretéből éppen 20 játékos van jelen, akik sorsolással két 10 fős csapatot alkotnak. Mi a valószínűsége, hogy Ryan Giggs és Wayne Rooney egy csapatba kerül? (A játékosok neve a kor előrehaladtával tetszőlegesen frissíthető.)

MEGJEGYZÉSEK A FELADATHOZ:

A tanulók persze erre a feladatra is sokféle megoldást szoktak hozni. A két leggyakoribb a

( 10 8 ) ( 20 10 ) ,

illetve a

2 ( 10 8 ) ( 20 10 )

volt. Hogyan döntsünk, ha elvi alapon egyik csoportnak sem sikerült meggyőznie a másikat és nem akarjuk hatalmi szóval eldönteni a dolgot. Lehetne most is megoldás az összes eset felírása? Teoretikusan igen, de gyakorlatilag nyilván nem. Az összes eset nagy száma miatt nem embernek való kihívás azok felírása. Hogyan lehetne egyszerűsíteni az életet? Oldjunk meg egy egyszerűbb problémát, ahol kisebbek a számok és gondolkodjunk analóg módon. Legyen például csak 4 ember, akik 2-2 fős csapatba szerveződnek véletlenül. Legyenek ők F, G, Q, R. (G=Giggs, R=Rooney) Írjuk fel az összes lehetséges 2-2 főből álló csapatpárt:

30. táblázat

Látjuk hogy Giggs és Rooney a lehetséges 3 esetből egy esetben kerül egy párba, tehát ekkor a keresett valószínűség 1/3, ami megfelel a 2(20)(42) formulának.

Ez alapján kijelenthetjük, hogy 2(108)(2010) a helyes válasz. Az esetek felsorolásából látszik, hogy módszertani szempontból inkább

( 10 8 ) ( 20 10 ) / 2

alakba kellett volna inkább írni a megoldást, ha a két csapatot nem különböztetjük meg.

6.1.4 Lehetetlen és biztos események

Egy feladattal azt szerettem volna ellenőrizni, hogy a tanárok körében mennyire különül el a lehetetlen esemény és a kicsi, gyakorlatilag 0 valószínűségű esemény közötti különbség. Korábbi oktatási gyakorlataim során középiskolásoktól, de még egyetemi hallgatóktól is gyakran kaptam azt a tapasztalat szülte választ, hogy ez már annyira kicsiny valószínűségű, hogy lehetetlen’’. Ez természetesen tökéletesen összhangban van a tapasztalati szinten levont következtetésekkel, de tanároktól illetve tanárnak készülő egyetemi hallgatóktól elvárható lenne az absztrakciónak az a foka, amely pontosabb megfogalmazást ad, érzékelteti a gyerekekkel a lehetetlen és a csekély valószínűségű esemény közötti különbséget. Némely tankönyvben vannak ugyan logikai feladatok és ezeket a tanulók is jól oldják meg, de a szóhasználatuk ennek ellenére következetlenségeket tartalmaz.

A konkrét példa egy Mendel szabály szerinti öröklődést tárgyaló feladat:

6.3. Feladat: Volt egy csomó piros és sárga paradicsomunk. Ezeknek két generációját vizsgáltuk, és a következő eredményeket kaptuk.

31. táblázat

Melyik szín a domináns fenotípus?

Melyek a lehetséges és mik a valószínű fenotípusok a táblázatban megadott 5 keresztezésben?

MEGJEGYZÉSEK A FELADATHOZ:

Az első alapvető probléma, ami a biológia feladatok kapcsán felmerül, hogy gyakran tisztázni kell a probléma megértéséhez szükséges körülményeket, fogalmakat. Habár minden érettségizett ember találkozott a feladatban szereplő öröklődéstani fogalmakkal, mégis szükséges volt az öröklődés Mendel által megfogalmazott szabályait és a témakör szóhasználatát feleleveníteni. Például a következő kérdések szoktak elhangzani:

  • Az egyes sorokban más más utódokat kapunk-e?

  • Ugyanaz a szabály érvényes mindegyik sorban?

  • Lehet egy paradicsom egyik fele sárga a másik piros?

Megbeszéltük a domináns-recesszív öröklődés tulajdonságait, valamint a heterozigóta és homozigóta tulajdonságokat. Sokak szerint ez nem is matematika’’. További megbeszélés után felírtuk a táblára az öröklődési arányokat az egyes fenotípusok esetében. Tisztáztuk, hogy ha a domináns allél a sárga és a recesszív a piros (sztenderd módon a domináns allélt nagy- a recesszív allélt kisbetűvel jelöljük: S és p), akkor az első sor biztosan igaz, hiszen a keresztezési tábla alapján csak piros utódokat kaphatunk, azaz az első sor ebben az esetben biztos lenne. Valaki azt javasolta, hogy nézzük meg a negyedik sort, ahol két sárga paradicsomot kereszteztünk, és csak sárga utódokat kaptunk. Kapva kaptam az alkalmon és végigelemeztük a lehetséges szituációkat. Megállapítottuk, hogy csak a 4., 5. és 6. keresztezési tábla jöhet szóba és azt is sikerrel állapítottuk meg, hogy a 4. és az 5. tábla esetében az utódok mind sárgák lesznek. Némi rávezetés és számolgatás után azt mondták, hogy az utódok körülbelül negyede piros kellene legyen a 6. esetben, szóval ez lehetetlen. Gyakorlatilag igazuk volt, de szerencsére volt néhány ember a csoportban, akik azonnal fel tudták írni annak valószínűségét, hogy 64 sárga utód jön létre, ha mindkét szülő heterozigóta (0,756410-8), ami nem nulla, azaz logikailag nincs jogunk kizárni ezt az esetet sem.

32. táblázat

33. táblázat. Keresztezési táblák: a sárga (S) szín a domináns a piros (p) felett

Egy másik hallgató azt javasolta, hogy a második sor alapján döntsünk, mert ebben az esetben biztosan nem keletkezhetnek sárga utódok. Ezt az érvelést a többiek is hamar elfogadták, tehát elvethettük a sárga szín dominanciáját, azaz biztosak lehettünk abban, hogy a piros a domináns és sárga a recesszív tulajdonság.

34. táblázat

35. táblázat. Keresztezési táblák: a piros (P) szín domináns a sárga (s) felett

A kezdeti nehézségek után már viszonylag gyorsan ment a feladat megbeszélése. Először a negyedik sorról állították, hogy akkor ez biztosan igaz, majd a második sorról állapították meg, hogy egyetlen eset van: mindkét szülő heterozigóta. Ezek voltak a sárga szín dominanciájának feltételezésénél tárgyalt sorok. Kicsivel később megszületett a válasz az ötödik sorra is. Ha az egyik szülő sárga és a másik piros, akkor csak a 3. és 4. keresztezési tábla lehetséges, de a 3. esetben csak piros utódokat kapnánk. Ezért ekkor az egyik szülő (ss), a másik (Ps) típusú. Már csak az első és a harmadik sor volt hátra, de nemsokára ezekre is születtek megoldások. Az első esetben az 1., 2. és 6. táblák alapján jöhettek létre az utódok, és az első két esetben mind pirosak, ezek jók. A 6. tábla esetében azonban az utódok negyede sárga lenne, ez rossz.’’ A hallott mondatok tökéletesen tükrözik a gyakorlati szempontok érvényesülését és alapvetően igaz állítások. Kizárhatjuk-e a 6. tábla szerinti öröklődést? kérdeztem. Most már rutinosan válaszoltak hogy nem, csak iciri-piciri a valószínűsége, azaz ha felteszem hogy mindkét szülő heterozigóta, akkor is csak 0,75612,410-8 az esélye az utódok ilyen eloszlásának. Ebben az esetben tehát biztosat nem állíthatunk, csak azt hogy nagyon nagy valószínűséggel legalább az egyik szülő (PP) típusú allélekkel rendelkezik. Már csak a 3. sor volt hátra, ahol is megállapították, hogy az egyik szülő biztosan (ss) allélekkel, a másik pedig nagy valószínűséggel (PP) allélekkel rendelkezik, de nem zárhatjuk ki a (Ps) esetet sem, csak elhanyagolható az esélye. Összefoglalva a feladat végén mindenki láthatóan különbséget tudott tenni a közel 0 valószínűségű és a lehetetlen, illetve a közel 1 valószínűségű és a biztos esemény között. Matematikai logikai és valószínűségszámítási fogalmaik tisztábbak lettek, jobban tudtak figyelni saját állításaik megfogalmazására. Kifejezéseik precízebbek lettek, és különösen azt élvezték egy idő után, hogy ezt a biológia egy olyan területen tették, amelyről azt gondolták, hogy már réges-régen elfelejtették.

A hallgatók gyakran bonyolódnak bele a feltételes valószínűség csapdájába. A következő egyszerű feladatot három különböző módon is megoldjuk.

6.4. Feladat: Egy városban ugyanannyi nő van mint férfi. Minden 100 férfi közül 5 és minden 10000 nő közül 25 színtévesztő. Ha a színtévesztők közül választunk egyet, akkor mi a valószínűsége, hogy az férfi?

MEGJEGYZÉSEK A FELADATHOZ: Rögtön három lehetséges megoldást mutatunk.

1. Megoldás:

Csak logikai úton végiggondolva. Ha ugyanannyi nő lakik a városban mint férfi, akkor vegyünk mindkét nemű lakosból ugyanannyit. Ekkor 20-szor annyi férfi lesz színtévesztő mint nő, azaz a keresett valószínűség 2021.

2. Megoldás:

Készítsünk kis táblázatot. Mivel a valószínűség nyilván nem függ a lakosság lélekszámától, tegyük fel, hogy 20000 ember lakik a városban. Közülük 10000 férfi és 10000 nő.

36. táblázat

Töltsük ki a táblázatunk egyes sorait a megadott arányok segítségével. Észrevehetjük, hogy most nem is kell mindegyik sor, elég az első. A keresett valószínűség a konkrét számok alapján 500525=2021.

3. Megoldás:

Kicsit rövidítsük a szöveget, jelöljük azt, hogy valaki férfi F-fel, azt hogy nő N-nel, azt hogy színtévesztő Sz-szel. A feladatban megadták a következő valószínűségeket:

P ( F ) = 1 2 P ( N ) = 1 2 P ( S z | F ) = 5 100 P ( S z | N ) = 25 10000

Keressük a P(F|Sz) valószínűséget. A Bayes-tétel alapján

P ( F | S z ) = P ( S z | F ) P ( F ) P ( S z | F ) P ( F ) + P ( S z | N ) P ( N ) = 5 100 1 2 5 100 1 2 + 25 10000 1 2 = 20 21

Ebben a feladatban egyszerű volt áttekinteni az eseteket. A következőben is csak egy kicsivel lesz nehezebb dolgunk.

6.5. Feladat: Ma Magyarországon a felnőtt lakosság harmada dohányzik és a dohányosok 12,5%-a tüdőrákban hal meg. Ez az arány a teljes népességen belül mindössze 5%. Mennyi a valószínűsége, hogy egy nem dohányzó ember tüdőrákban hal meg? Ha Káin nem tüdőrákban halt meg, akkor mi a valószínűsége, hogy nem dohányzott?

MEGJEGYZÉSEK A FELADATHOZ:

Ismét több megoldási út kínálkozik.

1. Megoldás: Van a feladatban harmad, nyolcad, huszad, tehát ha 600 fős alapsokaságot veszünk fel, akkor nagyot nem tévedhetünk. A megadott adatok alapján a táblázat kitöltve

37. táblázat

Ezek alapján a válaszok

P ( egy nem dohnyz ember tdrkban hal meg ) = 5 400 = 1 80 = 0 , 0125

illetve

P ( nem dohnyzott | nem tdrkban halt meg ) = 395 570 = 79 114 0 , 693 .

2. Megoldás: Értelem szerinti rövidítésekkel felírva, tudjuk hogy

P ( D ) = 1 3 P ( T R | D ) = 0 , 125 P ( T R ) = 0 , 05 .

Ezek alapján

P ( D ¯ ) = 2 3 P ( T R | D ) = 0 , 125 P ( T R ¯ ) = 0 , 95

A teljes valószínűség tétele alapján

P ( T R | D ) P ( D ) + P ( T R | D ¯ ) P ( D ¯ ) = P ( T R )

behelyettesítve

1 8 1 3 + P ( T R | D ¯ ) 2 3 = 1 20 P ( T R | D ¯ ) = 1 80

Ezt az eredményt felhasználva, felírhatjuk, hogy P(TR¯|D¯)=1-P(TR|D¯)=7980. A Bayes-tétel alapján

P ( D ¯ | T R ¯ ) = P ( T R ¯ | D ¯ ) P ( D ¯ ) P ( T R ¯ | D ¯ ) P ( D ¯ ) + P ( T R ¯ | D ) P ( D ) = 79 80 2 3 79 80 2 3 + 7 8 1 3 = 79 114 0 , 693

6.2 Vertikális és horizontális kapcsolatok

6.6. Feladat: Káin és Ábel sorsot húznak, hogy ki írja meg a német fogalmazást, de csak egy dobókockájuk van kéznél. Nem lelkesedtek a feladatért, ezért Káin azt javasolta, hogy dobjanak fel egy kockát addig, amíg egyikük páros számot dob, és az menjen leckét írni. Már nyújtotta is a kockát Ábelnek, hogy kezdjen ő. Mekkora valószínűséggel megy Káin, illetve Ábel leckét írni?

MEGJEGYZÉSEK A FELADATHOZ:

Arra gyorsan rá szoktak jönni a tanulók, hogy ez a kezdőnek előnytelen, hiszen már az első lépésben 1/2 annak valószínűsége, hogy neki kell leckét írnia. Pár perc alatt egy komplett mértani sort is felírnak:

P ( A kezd veszt ) = 1 2 + ( 1 2 ) 3 + ( 1 2 ) 5 + = 1 2 i = 0 1 4 i = 1 2 1 1 - 1 4 = 2 3

Ez egy minden szempontból elfogadható és tökéletes megoldás, amely sok más esetben is alkalmazható.

Jussunk el másképp is a megoldáshoz:

Jelöljük p-vel annak a valószínűségét, hogy a soron következő játékos veszít. Ekkor annak valószínűsége, hogy a másik veszít, nyilván 1-p, mert könnyen látható, hogy a játék 0 valószínűséggel tart örökké. Nem tudjuk mekkora p, de felírhatunk rá egy egyenletet. Két eset van. Annak valószínűsége, hogy a soron következő játékos rögtön veszít 1/2, ha viszont nem veszít, akkor a rákövetkező játékban nem ő a soron következő játékos, és akkor 1/2(1-p) eséllyel veszít, ezért

p = 1 2 + 1 2 ( 1 - p ) p = 2 3

Szemmel láthatóan ugyanarra az eredményre jutottunk mint az előbb, csak nem kellett végtelen mértani sort összegeznünk. Elég volt egy darab egyismeretlenes elsőfokú egyenletet megoldani.

Barátkozzunk tovább az ilyen jellegű feladatokkal.

6.7. Feladat: Ábel az előző feladatban említett túlzott esély miatt másik javaslatot tett: Az menjen német leckét írni, aki először dob egyest vagy kettest, és kezdjen Káin! Mekkora valószínűséggel megy német leckét írni Káin, illetve Ábel?

MEGJEGYZÉSEK A FELADATHOZ: Az előző feladathoz teljesen hasonlóan felírhatjuk egy végtelen mértani sor segítségével, hogy a kezdő megy német leckét írni. A sor csak a kezdeti valószínűség miatti szimmetriáját veszíti el, de ettől még ugyanolyan jellegű marad.

P ( A kezd veszt ) = 1 3 + 1 3 ( 2 3 ) 2 + 1 3 ( 2 3 ) 4 + =

= 1 3 i = 0 ( 4 9 ) i = 1 3 1 1 - 4 9 = 3 5 = 0 , 6

Ismételjük meg az előző feladat gondolatmenetét. Miben módosul? Nyilván csak a valószínűségek változnak, ha tehát most is p-vel jelöljük annak valószínűségét, hogy a kezdő gyerek megy leckét írni, akkor a

p = 1 3 + 2 3 ( 1 - p ) p = 3 5 = 0 , 6

Ez természetesen megegyezik a végtelen sor összegeként kapott eredménnyel.

Talán még jobban megérezhetjük a módszer erejét, ha tanulmányainkat felhasználva megpróbáljuk megoldani a következő nem egyszerű feladatot.

6.8. Feladat: Egy-egy cédulára felírtuk az 1, 2, 3, illetve 4 számokat. Anna kihúz egy cédulát a négy közül, majd visszateszi a többi közé. Ezután Zsófi húz ki egy cédulát, utána visszateszi, majd ismét Anna következik, stb. A kihúzott számot mindig hozzáadják az addig kihúzott számok összegéhez. Az nyer, akinek a húzása után először lesz az összeg osztható 3-mal. mennyi a valószínűsége annak, hogy Anna nyer? (Az 1997-1998 évi matematika OKTV 4. feladat.)

MEGJEGYZÉSEK A FELADATHOZ:

Amit az első próbálkozások után észrevehetünk, az az a sajnálatos tény, hogy a feladat készítői elrontották a korábbi feladatokban fennálló szimmetriát. Esélytelenné vált közönséges mértani sor segítségével felírni az egyes eseteket. ha tovább keresgélünk a tanult ismeretek között, akkor olyan dolgok kell hogy eszünkbe jussanak mint átmenetvalószínűségek, Markov-láncok stb. A három lehetséges maradék nyilván 0, 1 illetve 2, s ezek valószínűségei P(m=0)=14, P(m=1)=24 illetve P(m=2)=14. Miután sokszor kell még hivatkoznunk rá, jelöljük az (14;24;14) sorvektort m-mel.

Jelölje továbbá a szokásoknak megfelelően az átmenetvalószínűség mátrixot

P = ( a 00 a 01 a 02 a 10 a 11 a 12 a 20 a 21 a 22 ) ,

ahol például a12 annak valószínűsége, hogy most az összeg maradéka 2, feltéve, hogy az előző maradék 1 volt. Ez úgy lehetséges, ha a soron következő lány éppen 1 maradékú számot tartalmazó cetlit húz, aminek a valószínűsége 12. Hasonlóan sorra véve az egyes átmenetek valószínűségeit kapjuk a következő mátrixot:

P = ( 0 0 0 1 4 1 4 2 4 2 4 1 4 1 4 ) .

Emlékezhetünk korábbról, vagy itt és most gyorsan meggondolhatjuk, hogyan lehet két lépés után eljutni az 1 maradékot adó esetből a 2 maradékú esetbe. Nyilván három lehetőség van, amelyek közül csak kettő lesz nem 0 valószínűségű. Az első lépés után kaphatunk 0, 1 vagy 2 maradékot és ezekből léphetünk tovább a 2 maradékot adó esetbe. A keresett valószínűség a teljes valószínűség tétele szerint

P ( kt lpsben jutok 1-rl 2-re = a 10 a 02 + a 11 a 12 + a 12 a 22 .

Ha minden esetet összegyűjtünk, akkor mátrix alakban is felírhatjuk, hogy két lépés után milyen valószínűséggel kapjuk az egyes maradékokat. Jelöljük ezt a mátrixot P(2)-vel.

P ( 2 ) = P 2 = ( 0 0 0 1 4 1 4 2 4 2 4 1 4 1 4 ) ( 0 0 0 1 4 1 4 2 4 2 4 1 4 1 4 ) = ( 0 0 0 5 16 3 16 4 16 3 16 2 16 3 16 ) .

Annak a valószínűsége, hogy Anna az első lépésben győz 14, hogy a harmadik lépésben győz, az az mP2 első eleme, hogy az ötödik lépésben győz az mP4 első eleme, azaz összesen

m I + m P 2 + m P 4 + = m ( I + P 2 + P 4 + ) = m ( I - P 2 ) - 1

első eleme.

m ( I - P 2 ) - 1 = ( 1 4 2 4 1 4 ) ( 1 0 0 - 5 16 13 16 - 4 16 - 3 16 - 2 16 13 16 ) - 1 =

= ( 1 4 2 4 1 4 ) ( 1 0 0 77 161 208 161 64 161 49 161 32 161 208 161 ) = ( 13 23 16 23 12 23 ) .

Azaz annak a valószínűsége, hogy Anna nyer 1323.

Nyilvánvaló, hogy ha ez egy középiskolások számára kitűzött OKTV feladat volt, akkor nem az előbb látott, mátrixokkal teletűzdelt megoldást várták el tőlük. Mit tanultunk azonban az előző két feladatból? Ott két játékos esetén egyetlen ismeretlen bevezetése elegendő volt, most 3 játékos esetén kettőre lesz szükségünk. Mint a korábbi feladatokban, most is fel lehet írni egy megfelelő egyenletrendszert. Szinte változtatás nélkül közöljük a javítókulcsban megjelent mintamegoldást:

A játék 1 valószínűséggel véget ér véges sok lépésben, hiszen legfeljebb (3/4)n annak a valószínűsége, hogy a játék n lépésen belül még nem fejeződött be, és ez az érték 0-hoz tart, ha n tart a végtelenhez.

Tegyük fel, hogy egy adott pillanatban az addig kihúzott számok összege 3k+1 alakú, és jelölje γ annak a valószínűségét, hogy ekkor a soron következő játékos fogja (valamikor majd) a játékot megnyerni. Hasonlóan jelölje δ egy 3k+2 alakú összegről a soron következő játékos valamikori nyerési esélyét. (A γ és δ valószínűségek valóban léteznek: ha γn annak a valószínűsége, hogy a soron következő játékos legfeljebb n lépésben nyer, akkor γn monoton növő sorozat és a (monotonitás miatt szükségképpen létező) határértéke éppen γ.)

Egy 3k+1 alakú összegről indulva 1/4 valószínűséggel a (a 3-as cédulát húzva) lesz az összeg ismét 3k+1 alakú, 1/2 valószínűséggel lesz 3k+2 alakú és 1/4 valószínűséggel 3k alakú. Az első esetben a húzást végrehajtó játékos nyerési esélye a húzás után 1-γ lett (hiszen ezután a másik játékos következik, és az nyer γ valószínűséggel), a második esetben a nyerési esélye 1-δ lett, a harmadik esetben pedig megnyerte a játékot. Innen a

γ = 1 4 ( 1 - γ ) + 1 2 ( 1 - δ ) + 1 4 1

egyenlőséget kapjuk.

A 3k+2 alakú összegről indulva ugyanígy a

δ = 1 4 ( 1 - γ ) + 1 4 ( 1 - δ ) + 1 2 1

összefüggés adódik.

A két egyenletből γ=1223,δ=1623.

A kezdő lépésnél Anna 14 valószínűséggel nyer azonnal, 12 valószínűséggel húz 1-et vagy 4-et, amivel a nyerési esélye 1-γ lesz, és 14 valószínűséggel húz 2-t, amivel a nyerési esélye 1-δ lesz. Innen Anna nyerési esélye

1 4 + 1 2 ( 1 - γ ) + 1 4 ( 1 - δ ) = 13 23

6.2.1 Átlag, várható érték

Minden középiskolában ki szoktak számolni 5-ös lottóval kapcsolatos feladatokat, mert közöttük sok viszonylag egyszerűen megfogalmazható és egyszerűen megválaszolható kérdés akad. Matematika tanár szakos hallgatóknak ugyanilyen okokból várható értékre vonatkozó feladatokat szoktunk feladni az 5-ös lottó témaköréből. Az egyik kérdés, amire mindenki pillanatok alatt válaszolni szokott az, hogy mennyi a kihúzott számok átlaga (45,5). A húzás után a számokat nagyság szerint rendezik, és így teszik közzé. A második kérdés az szokott lenni, hogy mennyi a középső szám átlaga. Persze erre is sokan rávágják a helyes választ, 45,5. Gyakran feladom, hogy nézzenek utána annak, mi az első, második, harmadik, negyedik, ötödik szám átlaga az eddigi húzások során. Letölthető táblázatok az eddigi húzásokról a következő címen találhatók:

http://www.szerencsejatek.hu/otoslotto

38. táblázat. Az 5-ös lottón 2012.02.10-ig kihúzott legkisebb ($x_1$), ... legnagyobb ($x_5$) számok átlagai

Ezek után szoktam feladni azt a feladatot, hogy

6.9. Feladat: Számítsuk ki az 5-ös lottón kihúzott számok maximumának várható értékét.

MEGJEGYZÉSEK A FELADATHOZ:

Azon esetek száma, amikor a legnagyobb kihúzott szám k, (5k90) éppen annyi, mint ahányféleképpen a nála kisebb k-1 szám közül négyet ki tudunk választani, ez pedig nyilván (k-14). Így a keresett valószínűség korábbi jelöléseinkkel P(x5=k)=(k-14)(905). A feladatban kérdezett várható érték pedig

E = k = 5 90 k P ( x 5 = k ) = k = 5 90 k ( k - 1 4 ) ( 90 5 )

Alakítsuk át a kifejezést, ekkor

E = k = 5 90 k ( k - 1 4 ) ( 90 5 ) = k = 5 90 5 ( k 5 ) ( 90 5 ) = 5 ( 91 6 ) ( 90 5 ) = 5 91 6 75 , 8333

A kapott érték meglehetősen jól egyezik a táblázatban látható tapasztalati átlaggal.

6.10. Feladat: Mennyi a (90-ből 5-ös) lottóhúzás második legnagyobb számának a várható értéke? [Várható érték: az összes lehetséges lottóhúzás mindegyikében kiválasztjuk a második legnagyobb számot, és ezeknek a számtani közepét képezzük (egy adott értéket természetesen annyiszorosan’’ kell figyelembe venni, ahány lottóhúzásban ez az érték második legnagyobb számként fellép). (2001-2002 III. kategória: Speciális matematika tantervű gimnáziumok Első iskolai forduló 5. feladat.)

MEGJEGYZÉSEK A FELADATHOZ:

Legyen 4k89, és jelöljük hk-val azoknak a lottóhúzásoknak a számát, ahol k a második legnagyobb szám. Mivel a legnagyobb számot ekkor (90-k)-féleképpen, a három legkisebb számot pedig (k-13)-féleképpen választhatjuk, ezért hk=(90-k)(k-13). Ennek alapján a keresett várható értéket E-vel jelölve

( 90 5 ) E = k = 4 89 k h k = = k = 4 89 k ( 90 - k ) ( k - 1 3 ) = k = 4 89 k ( 91 - ( k + 1 ) ) ( k - 1 3 ) = = 91 k = 4 89 k ( k - 1 3 ) - k = 4 89 ( k + 1 ) k ( k - 1 3 ) = = 91 4 k = 4 89 ( k 4 ) - 5 4 k = 4 89 ( k + 1 5 ) = = 4 91 ( 90 5 ) - 4 5 ( 91 6 )

Az első és az utolsó sort rendezve kapjuk, hogy

E = 4 91 - 4 5 ( 91 6 ) ( 90 5 ) = 4 91 - 4 5 91 6 = 4 91 6

A számolás után kicsit elgondolkoztathatjuk a hallgatókat. Az előbb 5916, most meg 4916 jött ki. Nem lehetett volna gyorsabban megkapni ezeket az eredményeket? Hogyan helyezkedhetnek el az átlagok, hogyan kapták meg a középső számok átlagát?

A középső számok átlaga 45,5, amire a szimmetria miatt mindenki gyorsan rá szokott jönni. ezt írhatjuk akár 3916 alakba is. Az elvi indoklás ezek után lehet például a következő. A kihúzott és nagyság szerint rendezett számok átlagai egyenletesen fognak elhelyezkedni az 1 és a 90 számok között, a végpontokat is beleértve. Ezért ezek az átlagok hat egyforma részre osztják az 1..90 halmazt, tehát minden részbe 1516 szám kell essen, azaz az i-dik osztópont éppen i916.

6.3 Problémamegoldás

A középiskolákban szinte minden tanuló megszokja, hogy bizonyos rendezési tulajdonságok érvényben vannak a gyakran használt alaphalmazokon. Ilyen tulajdonság például a (A<B s B<C)A<C. Ebben az alfejezetben néhány olyan feladatot ismertetünk, amelyek ezt a megszokást próbálják megkérdőjelezni. Lássuk az elsőt.

6.11. Feladat: Káinnak van három üres lapú dobókockája. Az elsőre felírja az 1, 4, 4, 4, 4, 4 számokat, a másodikra a 2, 2, 2, 5, 5, 5 számokat, a harmadikra pedig a 3, 3, 3, 3, 3, 6 számokat. A kockák közül Ábel választhat egyet, azután pedig Káin választ a maradék kettő közül. Mindketten dobnak a saját kockájukkal. Az megy német leckét írni, aki kisebbet dob. Kinek kedvez ez a játék?

MEGJEGYZÉSEK A FELADATHOZ:

Számozzuk meg a kockákat, hogy kényelmesebben tudjunk róluk beszélni. Legyen

I. kocka = { 1 , 4 , 4 , 4 , 4 , 4 }

II. kocka = { 2 , 2 , 2 , 5 , 5 , 5 }

III. kocka = { 3 , 3 , 3 , 3 , 3 , 6 }

Írjuk fel annak valószínűségét, hogy az I. kockával kisebbet dobunk mint a II. kockával. Az eseteket figyelembe véve

P ( I. < II. ) = 1 6 1 + 5 6 3 6 = 21 36 > 1 2

Leszűrhetjük a következtetést, a II. kocka kicsivel jobb’’ mint az I. kocka, azaz a kettő közül inkább azt érdemes választani.

Hasonlóan írhatjuk fel annak valószínűségét, hogy a II. kockával kisebbet dobunk, mint a III. kockával.

P ( II. < III. ) = 1 2 1 + 1 2 1 6 = 7 12 > 1 2

A III. kocka jobb’’ mint a II.

Már csak be kell zárnunk a kört. Írjuk fel a III. és az I. kocka párosát.

P ( III. < I. ) = 5 6 5 6 = 25 36 > 1 2

Itt van az, ami miatt az egészet végigszámoltuk. Bármely kockánál lehet jobbat’’ választani, azaz Káin már megint undok volt. Hiába választ akármilyen kockát Ábel, Káin tud a maradék kettőből olyat választani, amelyikkel 1/2-nél nagyobb valószínűséggel nagyobbat dob mint Ábel.

Ez néhány hallgatónak meg szokta feküdni a gyomrát, ezért más, hasonló jellegű feladatot is meg szoktunk oldani az órákon.

Ilyen például néhány fej-írás sorozat. Az egyik legkönnyebben végiggondolható eset a következő. Dobáljunk fel háromszor egymás után egy szabályos érmét. Mi lesz annak a valószínűsége, hogy az FFF sorozatot kapjuk? A válasz nyilvánvalóan 1/8. És mi a valószínűsége, hogy az IIF sorozatot kapjuk? Nyilván ez is 1/8, ugyanúgy ahogy tetszőleges rögzített három hosszúságú F-I sorozat valószínűsége.

Ilyenkor szoktam feltenni a kérdést a tanulóknak: Ha elkezdjük feldobálni az érmét, vajon melyik sorozat fog előbb felbukkanni? Miután kap az ember néhány választ, érdemes néhány dobássorozatot végigcsináltatni a tanulókkal. Pár perc alatt láthatják, hogy az egyik sorozat kezd elhúzni egy kicsit, mintha több IIF fordulna elő.

6.12. Feladat: Készítsünk egy fej-írás (F-I) sorozatot, amíg az IIF vagy az IFF hármas meg nem jelenik. Határozzuk meg az egyes sorozatok előfordulásának a valószínűségét.

MEGJEGYZÉSEK A FELADATHOZ:

Közösen szoktuk felrajzolni a lehetséges esetek ábráját, hogy mindenki egyformán követhesse az eseményeket. A kiindulási helyzetet szürke pötty jelöli, ahonnan egy-egy nyíl vezet az I illetve az F helyre, majd tovább. Az egyes nyilak a következő lehetséges helyzeteket jelölik. Mivel az érme szabályos, minden átmenet 1/2 valószínűségű. Jelöljük pi-vel annak valószínűségét, hogy az i-dik állapotból indulva az IIF következik be.

127. ábra. Az IIF vagy az IFF sorozat fordul elő korábban?

Ekkor az alábbi egyenletrendszert írhatjuk fel.

p 1 = 1 2 p 2 + 1 2 p 3 p 2 = 1 2 p 2 + 1 2 1 p 3 = 1 2 p 1 + 1 2 0 p 4 = 1 2 p 1 + 1 2 p 4

Az egyenletrendszert megoldva a p1=23, p2=1, p3=13, p4=23 eredményeket kapjuk, amiből akár ránézésre, akár számolással (12p1+12p4=23) a 23 eredményt kapjuk, azaz pont kétszer valószínűbb, hogy először az IIF jön ki, mint az IFF.

Hasonlítsuk most össze az IFF és az FFI sorozatokat is.

6.13. Feladat: Készítsünk egy fej-írás (F-I) sorozatot, amíg az IFF vagy az FFI hármas meg nem jelenik. Határozzuk meg az egyes sorozatok előfordulásának a valószínűségét.

MEGJEGYZÉSEK A FELADATHOZ:

Az előző feladathoz hasonlóan most is elkészíthetjük az egyes eseteket tartalmazó ábrát.

128. ábra. Az IFF vagy az FFI sorozat fordul elő korábban?

Ha pi most annak valószínűségét jelöli, hogy az i-dik helyről indulva az IFF be jutunk, akkor a következő egyenletrendszert írhatjuk fel:

p 1 = 1 2 p 1 + 1 2 p 3 p 2 = 1 2 p 1 + 1 2 p 4 p 3 = 1 2 p 1 + 1 2 1 p 4 = 1 2 p 4 + 1 2 0

Az egyenletrendszer megoldása helyett ésszel is meggondolhatunk egyes dolgokat, például p4=0.

Akár logikai úton oldjuk meg, akár mechanikusan, azt kapjuk, hogy p1=1, p2=12, p3=1, p4=0. Mivel 12p1+12p2=34, ezért 34 eséllyel az IFF-ben és 14 eséllyel az FFI-ben kötünk ki. (Kihasználtuk, hogy annak valószínűsége, hogy a végtelenségig dobálunk az 0.)

Ha tovább folytatjuk a hármasok vizsgálatát, akkor láthatjuk, hogy az FFI és az FII aránya 23:13, valamint az FII és az IIF aránya 34:14. Ezzel azonban a kígyó a saját farkába harapott, hiszen

IIF IFF FFI FII IIF

Ezzel ezt a nem tranzitív példát befejeztük. Figyeljünk arra, hogy óvatosan fogalmazzunk meg állításokat, legyünk körültekintők. Felhívnám a figyelmet a módszer hatékonyságára, amellyel számtalan hasonló jellegű feladatot oldhatunk meg.

6.3.1 Öröklődés, biológia

A hallgatók már általában túl vannak a feltételes valószínűség és a Bayes-tétel megismerésén. Ennek ellenére nagyon gyakran fordul elő, hogy a matematika szakos hallgatók egy része nem mindig tud megbírkózni azzal a helyzettel, amikor egy biológia feladat kapcsán kell alkalmazni matematikai ismereteket. Ugyanakkor a biológia szakos hallgatók zöme elbír az ilyen típusú feladatokkal, mert már korábban hozzájuk szokott. Tekintsük a következő feladatot:

6.14. Feladat: Autoszómás recesszív betegség öröklődését vizsgáljuk az alábbi családfán. Genotípusát tekintve egy személy lehet beteg (aa), egészséges hordozó (Aa), ill. egészséges, aki nem hordozza a hibás allélt (AA). Tudjuk, hogy az egészséges felnőtt lakosság 10%-a hordozó.

  • Mi a valószínűsége annak, hogy a születendő (11) gyermek beteg (aa), hordozó (Aa), illetve nem hordozó (AA)?

  • Mi lenne a valószínűsége annak, hogy (4) hordozó, ha még nem születtek volna gyermekei?

  • Mi a valószínűsége annak, hogy (4) hordozó? (Annak ismeretében, hogy (3), aki beteg, két egészséges gyermeket szült neki.)

  • Mi a valószínűsége annak, hogy (4) hordozó, ha két gyermek után újabb egészséges gyermeket szült neki (3)?

  • Mi a valószínűsége annak, hogy (4) hordozó, ha harmadikként beteg gyermekük született?

129. ábra. Családfa diagram (a szürkével jelölt egyedek betegek, a szaggatott szélűek a még meg nem születettek)

MEGJEGYZÉSEK A FELADATHOZ:

Válaszoljuk meg sorban a kérdéseket. A válaszok során ki fogunk térni azokra a részekre, amik a tapasztalatunk szerint problémát okoztak a feladat megoldása során.

(a) Általában segít a hallgatóknak, ha nem biológiai, hanem logikai feladatként tekintenek a problémára. Mivel az (1)-es és a (2)-es párnak született beteg és egészséges gyermeke is, ezért mindketten hordozók. A (7)-es gyermek egészséges, tehát vagy AA vagy Aa alléleket hordoz. Felidézve a keresztezési táblát,

39. táblázat. Keresztezési tábla, ha tudjuk, hogy a gyermek egészséges.

ennek valószínűsége P(7 hordoz)=P(7 h)=23 és P(7 egszsges homozigta)=P(7 e)=13, mivel meg volt adva, hogy (7) nem beteg.

A (8)-as utód csak egészséges hordozó lehet, mert a (3)-as szülő beteg, tehát tőle csak a allélt kaphatott.

A születendő (11)-es gyerek beteg, ha mindkét szülő hordozó és tőlük a beteg a allélt örökli. Ennek valószínűsége

P ( 11  beteg ) = P ( 11  b ) = 2 3 1 1 4 = 1 6

A születendő (11)-es gyerek hordozó, ha legalább az egyik szülő hordozó és tőle a beteg a allélt örökli. Erre két lehetőség van, (7) egészséges és (8) hordozó vagy (7) és (8) is hordozó.

P ( 11  hordoz ) = P ( 11  h ) = 1 3 1 1 2 + 2 3 1 1 2 = 3 6

A születendő (11)-es gyerek egészséges, ha mindkét szülőtől az egészséges A allélt örökli. Erre két lehetőség van, (7) egészséges és (8) hordozó vagy (7) és (8) is hordozó.

P ( 11  hordoz ) = P ( 11  h ) = 1 3 1 1 2 + 2 3 1 1 4 = 2 6

A feltételes valószínűségekkel történő felírást most mellőzzük.

(b) Ha feltesszük, hogy minden allél minden alléllel ugyanolyan eséllyel áll párba, akkor annak valószínűsége, hogy valaki beteg lesz p2, hogy hordozó az pq+qp=2pq és hogy egészséges az q2. Ekkor a

beteg : hordoz : egszsges = p 2 : 2 p q : q 2

ahol p és q a megfelelő allélek gyakoriságát jelentik (p+q=1). A hordozók aránya az egészségesek között

2 p q 2 p q + q 2 = 0 , 1 2 p p + 1 = 0 , 1 p = 1 19

amiből 2pq=P(hordoz)=36361110

(c) Most is két lehetőség van. A (4)-es szülő lehet hordozó 110, illetve egészséges 910 valószínűséggel.

Ha a (4) szülő hordozó, akkor (12)2 valószínűséggel lesz két egészséges gyermeke.

Ha a (4) szülő egészséges, akkor 12 valószínűséggel lesz két egészséges gyermeke.

Összesítve a (4)-es szülőnek 110(12)2+91012=3740 valószínűséggel lesz két egészséges gyermeke. Ebből 110(12)2=140 az az eset, ha a papa hordozó volt, tehát arány 1403740=137.

Ezt felírjuk a Bayes-tétel segítségével is. A két egészséges gyermeket 2E-vel jelöljük.

P ( h | 2E ) = P ( 2E | h ) P ( h ) P ( 2E | h ) P ( h ) + P ( 2E | e ) P ( e ) = ( 1 2 ) 2 1 10 ( 1 2 ) 2 1 10 + 1 2 9 10 = 1 37

(d) Az előző formula csak a számokban változik meg, azaz

P ( h | 3E ) = P ( 3E | h ) P ( h ) P ( 3E | h ) P ( h ) + P ( 3E | e ) P ( e ) = ( 1 2 ) 3 1 10 ( 1 2 ) 3 1 10 + 1 3 9 10 = 1 73

(e) Ez a kérdés a beugrató feladatok közé tartozik, mert sajnos sokan elkezdenek számolgatni mindenféle feltételes valószínűséget. Szerencsére sokan fel is ocsúdnak és megadják a helyes választ. Ez ekkor biztos esemény, azaz a valószínűsége 1.

A másik téma, ami gyakran szóba kerül, az a biológusok által Hardy-Weinberg szabály néven ismeretes.

(lásd például http://hu.wikipedia.org/wiki/Hardy-Weinberg-törvény.)

Ez olyan ideális populációkra vonatkozik, amelyekben kizárjuk a mutációt és egy csomó egyéb, a valóságban esetleg fellépő hatást. Ekkor azt állítjuk, hogy egy populáción belül nemzedékről nemzedékre a relatív allélgyakoriság változatlan marad. Igazából könnyebb belátni mint gondolnánk.

Írjunk fel egy teljes keresztezési táblát. Az egyes allélpárok valószínűségei legyenek rendre p, q és r. Ekkor az a allél gyakorisága éppen q+2r, mert a q valószínűségű hordozókban 1 darab, az r valószínűségű betegekben 2 darab van belőlük. A következő táblázat megadja az egyes utódokat és azok valószínűségeit.

40. táblázat

Szedjük össze, hogy az a allél milyen gyakorisággal fordul elő a keresztezés után. Egyszer kell figyelembe venni az Aa típusú utódoknál és kétszer az aa típusúaknál. Soronként haladva

1 2 p q + p r + 1 2 p q + 1 2 q 2 + 1 2 q r + 2 1 4 q 2 + 2 1 2 q r + p r + 1 2 q r + 2 1 2 q r + 2 r 2 =

q 2 + q r + p q + 2 q r + 2 r 2 + 2 p r = q ( q + r + p ) + 2 r ( q + r + p ) = q + 2 r

Ekkor persze a A allél gyakoriságára is automatikusan teljesül, hogy 2p+q.

Sokkal gyorsabban célhoz érhettünk volna, ha közvetlenül az allélek gyakoriságát jelöljük p-vel (az A allél gyakorisága), illetve q-val (az a allél gyakorisága). Mivel feltételeztük, hogy minden párosodás véletlenszerű és független, valamint az egyes nemekben is ugyanezek az arányok, ezért az utódokban megjelenő allélek eloszlása a következő:

41. táblázat

Az AA csak A allélt adhat, az Aa pedig fele-fele arányban ad A és a allélt, ezért az A allél gyakorisága p2+pq=p(p+q)=p.

Így egy kicsit gyorsabb belátnia a tételt, csak ügyelni kell a megfogalmazásra. Jó ha a középiskolai tanárok teljesen tisztában vannak ezekkel a formulákkal, mert az elmúlt években minden biológia érettségiben szerepelt valamilyen öröklődéshez kapcsolódó logikai vagy valószínűségszámítási feladat.

6.3.2 Statisztikai következtetések

Sajnos a tanulók, sőt az egyetemi hallgatók egy része is úgy éli le az életét, hogy soha nem vett részt valódi statisztikai adatok gyűjtésében és azok értékelésében. Vannak ugyan tankönyvi példák ezekre, de a tanárok egy része kihagyja, mert időrablónak és feleslegesnek érzi, holott az elvégzett és elemzett kísérletek nagyban hozzájárulhatnak a gyerekek valószínűségről alkotott fogalmainak tisztázásához. Az elvi különbség tulajdonképpen a megközelítésben rejlik. Vannak olyanok, akik ragaszkodnak ahhoz, hogy a logikai és matematikai úton kapott valószínűségi értékeket támasszuk alá statisztikai adatokkal. A másik nézőpont szerint a statisztikai adatok maguk a valóság, tehát ez alapján kell felépítenünk az elméleti valószínűségszámítást. Itt és most nem óhajtunk lándzsát törni egyik nézet mellett vagy ellen sem. Az iskolai oktatásban mindkettőnek lehet szerepe az ismeretek értő elsajátítása során.

Az egyik tankönyv rajzszögek feldobálását javasolja, és annak megszámlálását, hogy hányszor esik heggyel felfelé, illetve lefelé a rajzszög. Egy másik könyv gyufaskatulyákat pöcköltet a gyerekekkel, és azt számoltatja velük, hogy hányszor és melyik oldalára esik a gyufaskatulya. Ezeket a feladatokat csak részben tartom szerencséseknek.

Közös és nagyon jól használható bennük az, hogy olyan összetett fizikai jelenség áll a hátterükben, amelyet nem lehet egyszerűen modellezni, így a valószínűségek meghatározására nem kínálkozik jobb mód, mint a kísérletek nagyszámú végrehajtása, az adatok összegyűjtése és azok elemzése.

Ugyanakkor ezeknek a kísérleteknek vajmi kevés közük van a gyakorlati élethez. Miért lennénk kíváncsiak a rajzszögek hullására? (Gyufaskatulyás pöckölgetésekre szoktak ugyan fogadásokat kötni, de nem igazán elterjedt.)

Sokkal szerencsésebbnek tartom, ha olyan valódi adatokat kell gyűjteni a gyerekeknek, amelyek valóban hasznosak lehetnek. Ilyenek például a forgalomszámláláshoz kapcsolódó adatok, amelynek az is szerencsés vonzata, hogy kiadható házi feladatnak, azaz az adatok gyűjtése nem vesz el időt az oly rövid tanórából, ahol aztán az összegyűjtött adatokat elemezhetjük. Lehet például feladat, hogy a gyerekek utazzanak végig egy buszon és számlálják meg az egyes megállókban le- illetve felszálló utasok számát. Ha több gyerek is utazik a vonalon, akkor már értékelhető adatsorokat kaphatunk. Városi környezetben meg is lehet fordítani a feladatot, egyetlen megállóban állva figyelhetjük a buszok követési idejét (összevethetjük a menetrendi adatokkal), és rögzíthetik a le- illetve felszálló utasok számát. Természetesen tetszőleges a gyerekeket érintő adatsorral lehet foglalkozni (a telefonálási gyakoriságoktól kezdve a letöltési szokásokig bármivel).

Statisztikai adatgyűjtések segíthetnek döntést hozni olyankkor is, ha valamely ismert jelenség leírására több különböző kombinatorikus modellt is ajánlanak a gyerekek. A legegyszerűbb és egyben leggyakoribb példa az, amikor két érmét feldobunk és azt vizsgáljuk, hogy mi a valószínűsége a két fej, két írás, egyfej egy írás eseményeknek. Meggyőző tud lenni, ha az osztály minden tanulója csak hússzor végzi is el a kísérletet és az adatokat közösen összesítjük.

Néhány tapasztalati sorozat a következő volt:

42. táblázat

Egy másik ilyen gyakori probléma, hogy ha két kockát feldobok, akkor 21 vagy 36 eset lesz-e. Hosszú órákat töltöttem el az életemből azzal, hogy megpróbáltam elmagyarázni, a szemléletbeli eltéréseket és a kényelmes’’ számolás felé vezetni a tanulókat. Ugyanakkor megfelelő (az előző példához képest jelentősen több) kísérletet végeztetve a csoporttal fel lehet ismertetni a kívánt összefüggéseket.

Néhány tapasztalati sorozat a következő volt (az adatok alapján látszik, hogy 120 dobás nem ad elegendő alapot az általunk kívánt következtetéshez):

43. táblázat

A következő feladat kapcsán a statisztikai következtetéseket, azok logikáját ismételjük át. Azért tartom szükségesnek, mert a tanár szakos hallgatók tradicionálisan a félév utolsó két-három óráján találkoznak csak hasonló jellegű fogalmakkal és indoklásokkal, ami egyben azt is jelenti, hogy a gyakorlaton igen ritkán kerülnek szóba hasonló feladatok. Egyetlen példa alapján persze lehetetlen mindenre kitérni, de az alapvető fogalmakat áttekintjük.

6.15. Feladat: Az egyik gimnázium 12a osztályának egyik felébe 13 gyerek járt. A 2002-es és a 2003-as tanulmányi átlagaikat táblázatba rendeztük. Állíthatjuk-e ez alapján, hogy javult a gyerekek tanulmányi eredménye? Ha igen, milyen valószínűséggel? Ha nem, miért nem? Mit állíthatunk biztosan?

MEGJEGYZÉSEK A FELADATHOZ:

Sokféle módon járhatunk el. Az egyik kézenfekvő dolog az lenne, ha gyerekről gyerekre végignéznénk a tanulmányi eredmény változását. Ha csak azt vizsgálnánk, hogy az egyes gyerekek eredménye romlott vagy javult, akkor elég lenne azt nézni, hogy a változás pozitív vagy negatív-e? Egészítsük ki a táblázatot két sorral. Az elsőbe a változást írjuk be, a másodikba csak annak előjelét.

Először vizsgáljuk meg mi annak a valószínűsége, hogy 9 gyerek javítson és 4 rontson? Az első kérdés ami felmerül az, hogy honnan vegyünk ilyen valószínűségeket? Az egyik lehetőség, hogy nagyszámú korábbi statisztikai adat elemzésére támaszkodhatunk. A másik lehetőség az, hogy valamilyen előzetes feltevéssel élünk, és ezen feltétel mellett számoljuk ki a valószínűségeket. Ha a feltétel mellett a most megfigyelt események bekövetkezése kicsiny valószínűségű, akkor a feltételt elvetjük, más szavakkal nem fogadjuk el. Ezt a kezdeti feltételt gyakran nullhipotézisnek nevezik és H0-lal jelölik. Viszonylag kényelmesen számolható valószínűségeket kapunk, ha azt feltételezzük, hogy

H 0 : A gyerekek tanulmányi eredménye ugyanolyan eséllyel javult mint romlott, azaz mindkét irányú változás valószínűsége 1/2.

H 1 : A gyerekek tanulmányi eredménye javult, azaz a valószínűség nagyobb mint 1/2.

A szokásos eljárás az, hogy előre rögzítünk egy általában α-val jelölt valószínűséget: a mostani esetben és sok más példában is az α=5%, vagy más szavakkal az α=0,05 értéket választjuk. Ha az adott H0 feltétel mellett az adott minta bekövetkezésének valószínűsége a rögzített α-nál kisebb, akkor azt mondjuk, hogy ez olyan valószínűtlen esemény, hogy nyugodtan feltehetjük, hogy a feltétel hamis. Ezt úgy szokták mondani, hogy elvetjük a H0 hipotézist, vagy ami ezzel egyenértékű, elfogadjuk a H1 hipotézist.

Számoljunk. Hány gyereknek kellene javítani a 13 közül, hogy elvessük a H0 hipotézist?

44. táblázat

A táblázatban a vonal feletti valószínűségek összege 0,046143, a következő értéket is hozzáadva pedig már 0,133423, ami sokkal több mint az elfogadási határnak állított 5%. Döntési stratégiánk tehát a következő. Ha a társaságban 13, 12, 11 vagy 10 gyerek javított, akkor elvetjük a H0 hipotézist. Mivel a mi osztályunkban csak’’ 9 gyerek javított, ezért el kell fogadnunk a feltételünket, azaz ezen vizsgálat és döntési eljárás alapján nem állíthatjuk, hogy jegyeik változásánál a véletlenen kívül más is befolyásolta volna a gyerekek jegyeinek csoportját. Tömörebben szólva el kell fogadnunk a H0 hipotézist.

Az előző feltevés és teszt során egy csomó hasznos információt elhanyagoltunk, cserébe viszont egy könnyen számolható és könnyen ellenőrizhető kritériumot kaptunk.

Mi történne, ha nem csak a változások előjelét, hanem a nagyságát is figyelembe vennénk? Példánkban az átlagos változás 0,7 volt. Természetesen feltesszük, hogy a gyerekek teljesítménye egymástól független volt, és a változás normális eloszlást követ. Hipotéziseink most a következők lesznek:

H 0 : A gyerekek tanulmányi eredménye átlagosan nem változott. (m=0)

H 1 : A gyerekek tanulmányi eredménye átlagosan javult. (m>0)

Az egyszerűség kedvéért maradjunk most is az α=5% elfogadási illetve elutasítási szintnél és az egyszerűbb számolás kedvéért tegyük fel, hogy ismert a teljes sokaság elméleti szórása, σ=1,2.

Vizsgáljuk meg az átlag eloszlásának várható értékét és szórását. A H0 hipotézis alapján m=0, az átlag szórása pedig σx¯=σn=1,2130,3328. A normális eloszlás táblázata alapján az α=5%-os szinthez az x=1,645 tartozik. Ezek szerint, ha ennél nagyobb érték jön ki, akkor ennek valószínűsége kisebb mint 5%. Az adatokat sztenderdizálva

x ¯ - 0 σ x ¯ = 0 , 7 - 0 0 , 3328 2 , 0339 > 1 , 645

130. ábra. Elfogadási és elutasítási tartomány sztenderd normális eloszlás esetén ($\alpha=5\%$)

Ebből az következik, hogy most elutasítjuk a H0 hipotézist. Azaz két különböző statisztika, két különböző becslés, két különböző döntést eredményez ugyanolyan hibavalószínűség mellett. Vigyáznunk kell, ha megfogalmazunk valamit. Arról és csak arról tudunk nyilatkozni, amit éppen kiszámoltunk, és még arról is csak bizonyos valószínűséggel.

Gyakori, a hallgatók által elkövetett hibák lehetnek a feladat megoldása során, hogy:

  • Rosszul, vagy hibásan fogalmazunk meg feltételezéseket.

  • Olyankor is ki akarunk számolni valamit egy korábban tanult teszt segítségével, ha annak feltételei nem teljesülnek.

  • A végrehajtás után hibás következtetésre jutunk.

  • Olyan dolgot is állítunk, amiről a végrehajtott eljárás nem mond semmit.

Vizsgáljuk meg egy kicsit azt, ami minden előadássorozatban elhangzik, minden statisztika könyvben benne van, de mégis csak a hallgatók 50%-a érti meg és tudja alkalmazni. Milyen hibákat hordoz a döntési eljárásunk, milyen pontosak a következtetéseink?

Előfordulhat, hogy ugyanilyen adatok mellett a H0 hipotézis mégis fennáll. Ennek valószínűsége azonban korlátozott, ezt rögzítettük α=0,05-ban (elsőfajú hiba). Ezen kívül egy másik hibázási lehetőség is előfordulhat. Lehet, hogy a valóságban a H1 hipotézis áll fenn, de most épp olyan adatokat kaptunk véletlenül, amelyek ezt nem támasztják alá. Ez is egy lehetséges hiba, amelynek nagyságát nem mindig ismerjük és általában β-val jelöljük (másodfajú hiba). Ezek leírása rengeteg helyen megtalálható, de sokan szokták a közösségi lapokon kezdeni, például:

http://hu.wikipedia.org/wiki/Elsőfajú_és_másodfajú_hiba

131. ábra. Az $\alpha$ és a $\beta$ hibavalószínűségek

Látható, hogy ha α nő, akkor β csökken és fordítva. A β valószínűség nagyságáról általában nincs közvetlen információnk, de nyilván szeretnénk, ha viszonylag kicsi lenne, illetve ha 1-β nagy lenne. Ezt az 1-β kifejezést a próba erejének hívjuk.

132. ábra. Az $\alpha$ és a $\beta$ hibavalószínűségek

Célszerű a hallgatóknak két-három különböző grafikont is felrajzolni, és velük ábrázoltatni az 1-β kifejezés változását a H1 hipotézisben megfogalmazott átlag függvényében. Öt-hat különböző csoportra bontva a hallgatókat és velük különböző értékre végigszámolva, majd az eredményeiket összegezve szépen kirajzolódik a próba erejének görbéje.