Ugrás a tartalomhoz

Statisztika online - oktatási portál

Vág András

Typotex

4.6. Az átlag néhány fontos tulajdonsága

4.6. Az átlag néhány fontos tulajdonsága

4.6.1. Az átlag pontossága

Érdemes megbeszélnünk, hogy - az osztás miatt, amely a lehető legkevesebbszer végezhető el pontosan - vajon mennyi számjegyre érdemes kiszámítani az átlagot. Gyakorlati útmutatásul annyit adhatunk, hogy az átlagot eggyel több jegyre adjuk meg, mint ahányra a mintaelemek - az adatok - voltak. Ha tehát adataink egész számok, az átlagot egy tizedesjegy pontossággal kell megadnunk. (Ennél az utolsó jegynél azonban már kerekített értéket adjunk meg, tehát a második tizedesjegy értékét is figyelembe kell vennünk.) Csak megjegyzem, hogy a dBase AVERAGE-parancsával a teljes rendezett minta átlaga 76,31 (kg)-nak adódott.

4.6.2. Az átlag, mint súlypont

A Mo és Me viszonylag könnyedén volt értelmezhető geometriailag, és ha az átlagot is megpróbáljuk ilyformán értelmezni, akkor az alábbi következtetésre jutunk: az átlag a vízszintes tengelynek abban a pontjában van, ahol az a függőleges egyenes metszi a tengelyt, amely mentén az eloszlásgörbét úgy lehet alátámasztani, hogy egyensúlyban legyen. Ha a súlypontra a fizikában tanultakat alkalmazzuk (azaz, hogy ez az a pont, melyre nézve a forgatónyomatékok összege 0-val egyenlő), az alábbi képlethez jutunk:

( x i - x ) = x i - x = x i - n x = x i - n x i n = x i - x i = 0 .

(Az átalakítás közben a negatív előjelet éppen úgy emeltük ki a Σ-jel elé, mint bármilyen más állandó szorzótényezőt, hiszen a negatív előjel a - 1 szorzónak felel meg.)

A ( x i - x ) = 0 egyenlőséget érdemes megjegyeznünk.

Ugyanis a matematikai statisztika igen gyakran kihasználja. Ezen felül - ha belegondolunk –, ugyanolyan jól jellemzi az átlagot, mint az eredeti definíció. Ha úgy tetszik, akár definiálhatjuk is x -ot ennek segítségével…

4.6.3. Az átlag érzékenysége

Ahogy a Me-nál - a lineáris interpoláció után - említettük, ferde eloszlásoknál a medián „elvándorol” a ferdeség irányába. Ezt az átlag is tudja, sőt, jobban, mint a Me. Ami annyit jelent, hogy az átlag érzékenyebb, azaz a „kilógóan” kicsi/nagy értékeket jobban figyelembe veszi. Egymodusú, szimmetrikus eloszlásoknál - emlékeztetünk: a normális eloszlás ilyen - a modus, a medián és az átlag ugyanoda esik. Az ilyen típusú eloszlásoknál tehát beszélhetünk az eloszlás „közepéről”, a középérték-mérőszám pontosabb megjelölése nélkül is. Ezt azonban - most, hogy mélyebben megismertük ezeket - nem ajánljuk.

4.6.4. Az átlag értelmes használata

Most, hogy áttekintettük a gyakorisági eloszlások középérték-mérőszámait, s megállapítottuk, hogy az átlag kiválóan megfelel arra a célra, hogy az eloszlást jellemezzük vele, mielőtt még túlságosan is megörülnénk, nem lesz haszontalan néhány fenntartást is rögzítenünk. Van olyan eset, ha nem is sokszor, amikor az átlag vagy hamis képet ad az eloszlásról, vagy egyszerűen csak értelmezhetetlen. Sajnos, gondolkodásmódunkba annyira beleivódott az »átlagelv«, hogy ilyen eseteken hajlamosak vagyunk keresztülsiklani.

Az első esetre a mediánnál hosszabban - a többcsúcsú eloszlásoknál - írt fejtegetésünk szellemében csak a közismert „Átlag János és családja” - jellegű statisztikai/szociológiai adathalmazokat és a rajtuk alapuló elemzéseket hozzuk föl. Az átlagolás absztrakciója folytán nyert átlag-adat nagyon sok esetben nem is található meg az eredeti eloszlásban. A második esetre - amikor nincs jelentéstartalma az átlagnak - két példát hozunk:

  • ha az ember (mondjuk, egy dögmeleg nyáron) elmegy a boltba, és tejet vesz, megesik, hogy otthon szomorúan konstatálja: ez a tej bizony megsavanyodott. Abban a döntésben, hogy visszamenjen-e a boltba, és új kísérletet tegyen, korántsem az »átlag-elv« vezérli. Ha ugyanis úgy dönt, hogy visszamegy, és vesz még egyet, arra gondol: remélhetőleg ez a vásárlás már sikeres lesz (azaz: a tej élvezhető, emberi fogyasztásra alkalmas). Döntésében tehát nem a két liter, „átlagosan félsavanyú” tej ábrándképe a motivációs tényező. Ezt a - határelemzési - példát a Közgazdaságtan (Mikroökonómia) szakközépiskolai tankönyvből importáltuk.

  • ha valamely kórház valamely (mondjuk: bel-) osztályán a főnővér a főorvosi nagyviziten a beszámolót valahogy így kezdené: »Osztályunkon a betegek átlaghőmérséklete 37,4?«, valószínűleg mindenki úgy nézne rá, ahogy az ilyen kijelentés megérdemli. Mert ez hülyeség. Egy kórházi osztály összes betegének testhőmérséklet-adatait egy adattal, az átlaggal jellemezni nem lehet. Nem is azért, mert ez összemosná az imént exitált beteg (most már: tetem) lassan hűlő testhőfokát a magas lázában (mondjuk: 41,5?-on) már-már delirálóéval; hanem azért, mert ilyen esetben a minta nem jellemezhető az átlaggal (a Mo és a Me sem alkalmas).

Vegyük tudomásul: példáink elsősorban annak igazolására szolgálnak, hogy ha a sok adatból álló mintát (számítástechnikai frazeológiával: vektort) egy adattal - az átlaggal - (skalárral) jellemzünk/helyettesítünk, mindenképpen információt veszítünk.

Van olyan eset, amikor ez nem engedhető meg (kórházi példa). Az összes többi esetben ezzel számolnunk kell: ez az ára annak, hogy a könnyebb intellektuális feldolgozhatóság érdekében több adatot (egy eloszlást) egy adatba „sűrítünk”.

Az átlag, önmagában, nem jellemez elégséges pontossággal egy eloszlást. Ehhez tehát még más is szükséges lenne; főleg, hogy az „elvesztett” információ egyrészért „visszanyerjük”. Az ehhez szükséges statisztikai jellemzők további tárgyalása előtt hozunk minderre egy - most iskolai - példát: Legyen két tanulónk: X és Y-ka. (X nagyon okos, de lusta és szeszélyesen készül: ami érdekli, azt megtanulja, sőt, »ragad rá«; de amit nem érez magához közelállónak, azt semmi pénzért. Ezzel szemben Y-ka képességeit tekintve átlagos - de szorgalmas.) Egy tárgyból szerzett érdemjegyeik egy adott időszakban:

X : 1 5 x = 3 Y -ka : 3 3 y = 3

Látható, hogy x és y megegyeznek egymással (mindkettő közepes). Ám semmit sem mondanak arról, hogy ez a közepes átlagérték minek az eredményeként alakult ki: X-nél a két végletet „zsugorítja össze”, míg Y-ka esetében egyforma adatokat helyettesít. Fentiekből látható, hogy y pontosan, míg x rosszul jellemzi a mintát, azaz az eloszlást (amely itt diszkrét). Ezen csak úgy tudunk segíteni, ha a szóródás mérőszámait is igénybe vesszük a minta jellemzéséhez.