Ugrás a tartalomhoz

A magyar nyelv

Kiefer Ferenc, Bakró-Nagy Marianne, Bartha Csilla, Bánréti Zoltán, Borbély Anna, Cser András, Dömötör Adrienne, É. Kiss Katalin, Gerstner Károly, Gósy Mária, Gyuris Beáta, Haader Lea, Hattyár Helga, Holló Dorottya, Horváth László, Kassai Ilona, Kenesei István, Kiefer Ferenc, Kiss Jenő, Kontra Miklós, Korompay Klára, Kurtán Zsuzsa, Laczkó Krisztina, Nádasdy Ádám, Németh T. Enikő, Olaszy Gábor, Pléh Csaba, Prószéky Gábor, Sándor Klára, Sipőcz Katalin, Siptár Péter, Szabó Mária Helga, Tolcsvai Nagy Gábor, Váradi Tamás (2006)

Akadémiai Kiadó Zrt.

A beszéd képzése, akusztikai alkata és észlelése

A beszéd képzése, akusztikai alkata és észlelése

A beszéd képzése

Az élettani szervrendszernek a beszédképzésben szerephez jutó részei (1. ábra) a mellkasban elhelyezkedő tüdő (pulmo), a belőle kiinduló légcső (trachea) és az ennek tetején elhelyezkedő gégefő (larynx), valamint a gége feletti üregrendszer, az ún. toldalékcső (garat-, száj-, orrüreg). Ez az üregrendszer, amely egyedülállóan jellemző a homo sapiensre, az utóbbi másfélmillió év alatt fejlődött ilyenné[1] (3. ábra). A tüdő a képzés respirációs (légzési) szakaszát képviseli, a gégefő – a h hang képzésének kivételével – a fonációs szakasz, azaz a zöngeképzés szerve, a toldalékcső pedig az artikulációs szakaszt, azaz a beszédhangok képzését valósítja meg. E három szakaszt megelőzi a neurális, idegi szakasz, amelyben a beszédszervek beidegzése történik meg, ennek a folyamatnak a kérgi reprezentációjáról azonban még igen kevés ismerettel rendelkezünk.

A beszédet létrehozó szervek (Wacha–Kőrösi–Nagy 1980–81: I.3.a. nyomán)

A légzési szakasz

Élettani funkciójának[2] betöltésével párhuzamosan a tüdő szolgáltatja a beszédképzéshez szükséges levegőmennyiséget és levegőnyomást. A magyar nyelv – a legtöbb nyelvhez hasonlóan – a kilégzési szakaszt használja fel beszédképzésre, tehát beszédhangjait a tüdőből kiáramló levegőből bontja ki. A belégzési és kilégzési fázis átlagos tartama élettani (néma) légzéskor 2 mp. Amikor azonban beszéd céljából lélegzünk, a kilégzés fázisa a belégzés fázisához képest jelentősen megnyúlik, 0,3 másodperctől 40 másodpercig terjedhet, tehát a kilégzés időtartama tízszerese-hússzorosa is lehet a belégzés időtartamának. Ez az arányeltolódás ismét a beszédfunkció primátusát mutatja az élettani funkcióval szemben. Sőt, már a belélegzett levegő mennyiségét is jelentős részben a kimondandó közlemény terjedelmi mutatói határozzák meg.

Vannak kommunikációs helyzetek, amelyekben a belégzési levegő is felhasználható beszédképzésre. Például 3–10 éves gyerekeknél figyelhető meg olykor a kilégzés és belégzés közben folyamatosan produkált beszéd, annak a kommunikációs stratégiénak a jeleként, hogy a gyerek mindenáron magánál akarja tartani a szót.

Nem beszéd céljára szolgáló hangjelenségeket, mint amilyenek az állathívogatók, az elismerés jeleként produkált csettintés, a cuppogás a tüdő közreműködése nélkül, a hangképző szervek között fellépő szívóhatás révén képezünk. Számos nyelvben, főleg az afrikai kontinensen, az ilyen módon képzett hangjelenségek is beszédhangként működnek.

A zöngeképzés szakasza

A tüdőből kiáramló levegő a tüdőlebenyek felső végéhez csatlakozó légcsövön keresztül eljut a gégefőhöz, amely a légcső tetején helyezkedik el, annak mintegy a felső peremét képezi. A gégefő porcokból álló, sem nem csontos, sem nem szövetes anatómiai felépítésű szerv, amelyet öt porc alkot (2. ábra).

Legalul találjuk a pecsétgyűrűre emlékeztetű gyűrűporcot (cartilago cricoidea), amelynek kiszélesedő része hátul, a tarkónál van, karikája pedig körbeveszi a légcsövet. A gyűrűporcon helyezkedik el a pajzsporc (cartilago thyreoidea), amely hátul nyitott, elöl összeér, és ahol összeér, ott ki is csúcsosodik, mégpedig férfiaknál jobban, nőknél kevésbé. Köznyelvi megnevezése ádámcsutka. A gyűrűporc hátul kiszélesedő részén helyezkedik el a két kannaporc (cartilago arytaenoidea), amelyek háromszög alakú, gúlára emlékeztető, nagyon mozgékony kis porcok, függőleges tengelyük körül, valamint a gyűrűporcon egymáshoz közelítve és egymástól távolodva mozognak. Az ötödik porc a gégefedő (cartilago epiglottica), feladata a gége bejáratának reflexszerű elzárása nyeléskor (lásd az 1. ábra bal alsó sarkában kinagyított gégefőt). Nyelés és beszéd tehát valójában összeférhetetlen tevékenységek. A pajzsporc és a kannaporcok között helyezkedik el a hangszalagok nyalábja. Felül a pajzsporc összeérő éleihez, alul pedig a két kannaporc egy-egy sarkához, az ún. hangszalagnyúlványhoz tapadnak, oldalsó szélük a pajzsporc oldalfalához nőtt. A hangszalagok rugalmas izomkötegek, amelyek a gégeizmok és a kannaporcok tevékenysége révén változatos irányú és mértékű mozgásra képesek, eme képességük révén pedig alkalmasak arra, hogy a tüdőből kiáramló és a légcsövön feljutó levegőoszloppal együttműködve hangot keltsenek (ennek mechanizmusát lásd a „A beszéd mint fizikai jelenség”. pontban). A két hangszalag között található a hangrés (glottisz). Ennek hossza férfiaknál 21–27 mm, nőknél 17–26 mm. A nemekhez kötődő anatómiai különbség serdülőkorban alakul ki.

A gégefő szerkezete (Wacha–Kőrösi–Nagy 1980–81: I.5.a. nyomán)

Ha a tüdőből felfelé áramló levegő a hangszalagokat nyitott állapotban találja, akadálytalanul áramlik át közöttük, hogy feljusson a toldalékcsőbe. Ha azonban lazán összezárt hangszalagokba ütközik, megnövekedett nyomásával szétpattintja az egymáshoz tapadó hangszalagokat, hogy átjuthasson a keletkező résen. Ekkor kiegyenlítődik a hangrés alatti és feletti nyomás, és a rugalmas hangszalagok visszatérnek eredeti helyzetükbe, a zárt állásba. A levegő újból feltorlódik, és megismétlődik a hangszalagok szétpattintása, a nyomáskiegyenlítődés, majd a hangszalagok összezárulása. A hangszalagok nyitódózáródó mozgása nyomán átjutó levegőoszlopban nyomásingadozás lép fel, és rezgés keletkezik, méghozzá szabályos rezgés, mivel a nyitódás-záródás meglehetősen szabályos időközönként ismétlődik. Ezen a módon keletkezik a zönge, amely a magánhangzóknak alapeleme, egyes mássalhangzóknál pedig járulékos mozzanat (lásd alább, valamint a „A mássalhangzók”. és a „A magyar beszédhangok állománya”. pontban). Ha a hangrés a zöngeképzés során nem záródik össze teljesen, a levegőkiáramlás folyamatos, következésképpen „levegős” hang, ún. „mormolt” zönge keletkezik. Ha pedig a hangszalagok nem teljes terjedelmükben rezegnek, mint ahogy a beszédben megszokott mellhang vagy mellregiszter előírja, „recsegő hang” keletkezik. A zöngeképzés megindulása is különféle lehet: (1) ha a levegőkibőcsátáshoz képest késik a hangrés összezáródása, a zöngeképzés hehezetes zörej kíséretében indul meg, (2) ha a hangszalagok nyitott állásból indulnak neki a hangképzésnek és a gége alatti levegőnyomás alacsony, a zönge felépülése fokozatos, azaz lágy, végül (3) ha a hangszalagok induláskor feszesen zárnak, a zöngeképzés a feszes zár felpattintásával, keményen indul, s az eredmény kattanásszerű hang, a gégezárhang. A magyarban indulatos beszédben és katonai vezényszavakban gyakori a gégezárhanggal induló beszédképzés. A zöngeképzés befejeződésére ugyanezek a módozatok jellemzőek.

Az artikulációs szakasz

A gégefőn változatlan formában átáramló vagy rezgéssé átalakított levegő a felső üregrendszerbe kerül, amelyet a garat-, száj- és orrüreg alkot (3. ábra). A három üreg közül legfontosabb a szájüreg, hiszen benne találjuk a legtöbb aktív (mozgó) artikuláló szervet.

A garat-, száj- és orrüreg vázlatos rajza. A vonalkázott részek a mozgó artikuláló szervek (Wacha–Kőrösi–Nagy 1980–81: I.7.a–c. nyomán)

A garatüreg (pharynx) van legközelebb a gégefőhöz, belőle ágazik az út az orrüregbe és a szájüregbe. A hátsó garatfal mozgása révén változtatni tudja az alakját, a gége lesüllyedésével pedig a mérete változik, ezáltal a garati térség szerepet játszik a beszédhangok képzésében.

A szájüreg (cavum oris) az ajkaktól a garatig tart. Az ajkak jelentik a szájüreg bemenetét, az ajkak és a fogak közötti térség az ún. pitvar. Az alsó és a felső fogsor mögött domborodnak a fogmedrek (alveolae). A felső fogmeder folytatása a szájüreg boltozatát képező szájpadlás (palatum), amelynek két, természetes határral elkülönülő része van, a zápfogakig terjedő kemény szájpadlás vagy kemény íny (palatum durum) és ennek folytatása, a lágy szájpadlás vagy lágy íny (palatum molle vagy velum palatinum). A kemény szájpadlás, amely csontos boltozat, az egész szájpadlásnak kb. a 2/3 részét teszi ki. A lágy szájpadlást ezzel szemben mozgékony szövetek alkotják, s az igen mozgékony ínyvitorlában vagy ínycsapban (uvula) végződik. A szájüregen belül további finom osztások lehetségesek: a fogmedert is és a kemény szájpadlást is föl lehet osztani pre- (elülső), medio- (középső) és poszt- (hátulsó) területre. A szájüregben helyezkedik el a nyelv (lingua), amely a legmozgékonyabb lévén a legfontosabb artikuláló szerv. Ennek is megkülönböztetjük a hegyét (cacumen vagy apex), a peremét (corona) és a hátát (dorsum); ez utóbbi elég nagy terület lévén tovább osztható pre-, medio- és posztdorzális területre. (Ezekre a finom felősztásokra azért van szükség, hogy az artikulációs meghatározásokat minél pontosabbá tudjuk tenni.) A nyelvet a nyelvgyök (radix), valamint a belsejében található nyelvcsont (os hyoideum) rögzíti. Ezek segítségével emelhetjük, illetőleg szoríthatjuk lejjebb a gégefőt, e mozgás révén pedig csökkenthetjük, illetőleg növelhetjük a szájüreg térfogatát. A növelést az ajkak előretüremkedése, az alsó állkapocs leengedése és a gége lesüllyedése egyaránt előidézi, a csökkenést pedig az ajkak hátrahúzódása és/vagy a gége megemelkedése vonja maga után.

Az orrüreget (cavum nasi) az orrsövény két félüregre tagolja. Mivel nem mozgékony, az orrüreg nem aktív artikuláló szerv. A szerepe mindazonáltal jelentékeny, mert rezonanciás tulajdonságai révén nagymértékben képes árnyalni az egyes beszédhangokat.

A garatból a képzési levegő három módon jut tovább: (1) ha az ínyvitorla elzárja az orrüreg felé vezető utat, akkor a szájcsatornán áramlik keresztül és jut ki a szabadba (orális képzés), (2) ha az uvula a velummal együtt leengedett helyzetben van és egyidejűleg az ajkak vagy más képzőszervek zárják a szájüreget, a levegőoszlop az orrüregbe jut és onnan jut ki a szabadba (nazális képzés), (3) ha az uvula leengedett helyzetben van és a szájüreg nyitott, a képzési levegő megoszlik a két üreg között, s mindkettőből egyszerre távozik (nazoorális képzés).

Amikor zönge kerül a szájüregbe, s a mozgó artikuláló szervek megváltoztatják a szájüreg alakját és méretét, az alak- és méretváltozásoknak megfelelően alkalomról alkalomra módosul, formálódik a zönge felhangszerkezete, ezáltal pedig a keletkező beszédhang minősége. Így képezzük a magánhangzókat.

Amikor a hangrésből szabadon áramlik a levegő a felsőbb üregekbe, s itt találkozik valamilyen akadállyal, ezt előbb föl kell oldania ahhoz, hogy kijusson a szabadba. Az akadályt magát valamely szervpár állítja az ajkaktól a hangszalagokig, legtöbbször a nyelv és a szájpadlás együttesen. Milyenségét tekintve az akadály a teljes zárlattól a különböző keresztmetszetű résig terjedhet, sőt e két mozzanat együttesen is jelen lehet a képzés teljes tartamában. Az akadály felőldása során impulzus jellegű, valamint örvénylési és súrlódási zörejek keletkeznek, tehát a toldalékcső egyszerre tölti be a hangkeltés és a hangformálás funkcióját. Ezen a módon állnak elő a mássalhangzók, amelyek lényegük szerint akadályhangok, minőségüket az akadály helye, tartama és természete együttesen határozza meg.

A harmadik képzési lehetőség az előbbi kettő kombinációja, amikor a gégefőben mint hangforrásban keletkező zönge társul a felső üregrendszerben működő zörejes hangforrással, és a toldalékcső mindkét rezgéstípust egyszerre formálja. Ez a kombinált képzés jellemzi a zöngés mássalhangzókat.

A zöngétlen mássalhangzók képzésekor az artikulációban részt vevő izmok működése erőteljesebb, mint a zöngések képzésekor. Az történik ugyanis, hogy esetükben a hangrésen akadálytalanul átjutó képzési levegő energiája nem csökken, így visszatartásához az artikuláló szervek izmainak hatékonyabban kell működniük. A zöngés mássalhangzóknál ezzel szemben a zöngeálláson átjutó képzési levegő nyomása jelentősen csökken, így a képzőszervek kisebb izommunkával is fenn tudják tartani a mássalhangzó létrehozásához szükséges akadályt.

Amennyiben az artikulációs alakzat a képzés kezdetétől a képzés befejezéséig stabil, tehát a keletkező hang minősége teljes tartamában prototipikusan változatlan, az ún. állandó képzésű hangokhoz jutunk. Vannak azonban olyan hangzók is, amelyek a képzés kezdetétől a képzés befejezéséig észlelhető változást mutatnak a minőségükben. Az ilyen hangzókat változó képzésű hangoknak nevezzük. Mind a magánhangzók, mind a mássalhangzók között lehetnek változó képzésű hangok.

Ekként írható le dióhéjban a hangképzés globális menete, amely az emberi nem számára lehetőségként egyetemesen adva van. Minden nyelv ebből a lehetőséghalmazból bontja ki a maga sajátos hangalakját, azaz artikulációs bázisát. Az artikulációs bázis a legáltalánosabb és legelterjedtebb meghatározás szerint a hangképző szervek jellemző mozgásainak, helyzeteinek az összessége, amelyekkel a nyelvi rendszer elemeit a beszédben megvalósítjuk. A nyelvileg determinált artikulációs bázis a normatív anyanyelvi kiejtés feltétele. Kialakulásának kezdete az első életév második felére tehető, ekkor jelennek meg a kisgyerek hangadásaiban az első, hallásilag már elsajátított, az adott nyelvre jellemző (nyelvspecifikus) hangzási jegyek. A folyamat lezárulása a pubertáskor végén történik meg. Ettől kezdve spontán tanulás útján már nemigen vagyunk képesek valamely idegen nyelv kiejtését akcentus nélkül, azaz annak kiejtési normája szerint elsajátítani.

A beszéd mint fizikai jelenség

A beszédszervek működésének az eredménye hangjelenség, amelyet egy hangforrás és egy szűrőrendszer együttes tevékenysége hoz létre. Fizikai értelemben tehát a beszéd a hangrezgést jellemző három mennyiséggel írható le: a rezgés szaporaságával (frekvencia, mértékegysége a Hz, hertz), erősségével (intenzitás, gyakorlati mérőszáma a dB, decibel) és időtartamával (mértékegysége a s, szekundum és ennek tört részei).

A hangforrás egyszerű és összetett, valamint szabályos és szabálytalan mozgást egyaránt végezhet. Az eredmény ennek megfelelően egyszerű és összetett, valamint szabályos és szabálytalan rezgés. A beszédben mindegyik előfordul.

Szabályos rezgés: zenei hang

A hangszalagok nyitódó-záródó mozgását követik az átáramló levegő nyomásviszonyai, és rezgés keletkezik, mégpedig összetett rezgés, mert a hangforrás – látszólag egyszerű, ám valójában – bonyolult mozgást végez. Az összetett rezgés véges vagy végtelen számú egyszerű rezgés (tiszta hang) egyetlen rezgésben való összegződése. A tiszta hang a legegyszerűbb rezgés, az, amely a szinuszfüggvény törvényszerűségeit követi. Ha az összetett rezgésben az összetevő rezgések frekvenciái egymásnak egész számú többszörösei, a keletkezett összetett rezgés szabályos, zenei hang. Ebben a legkisebb frekvenciájú rezgésösszetevő neve alaprezgés vagy alaphang, a többi összetevő neve pedig részhang vagy felhang, mégpedig – szabályos rezgésről lévén szó – harmonikus felhang vagy felharmonikus. Az alaprezgés frekvenciája az alapfrekvencia. A gégefőben a „A magyar beszédhangok állománya”. pontban leírt módon keletkező zönge felhangokban gazdag összetett rezgés, alaphangja megegyezik a hangszalagok másodpercenkénti nyitódásával-záródásával.[3] Mivel a nyitódászáródás nem ismétlődik teljes szabályossággal, a zönge – legalábbis szorosan fizikai értelemben – csupán kváziperiodikus, azaz közelperiodikus. Ez a hang továbbjut a toldalékcső üregeibe, amelyek fizikailag rezonátorként viselkednek, azaz a zöngéből a sajátrezgésszámuknak[4] megfelelő vagy annak közelébe eső összetevő rezgéseket felerősítik, így formálják a gége szintjén egynemű zöngét (4. ábra). A fizika törvényeinek megfelelően a kisebb térfogatú üregek a magas frekvenciájú összetevőket erősítik fel, a nagyobb térfogatúak pedig az alacsonyabb összetevőket. A rezonátorterekben fölerősített felhangok neve formáns, amely tehát energiakoncentrációs helyet jelent, részhangok nyalábját. A formánsok az alaphangtól (F0) való távolságuk alapján indexszámokat kapnak. Az alaphanghoz legközelebb eső formáns jele F1, tőle távolabb található az F2, F3 és így tovább. Ezeknek a formánsoknak annál nagyobb a sávszélessége, minél távolabb helyezkednek el az alaphangtól, erejük, azaz amplitúdójuk viszont annál kisebb. A beszédhang egyedtől független minőségének a meghatározásához, tehát ahhoz, amitől az egyik hang i, a másik meg ó, már az első két formáns adatainak az ismerete is elegendő, de teljesebb hangszínélmény alakul ki az első három formáns, még inkább a teljes spektrum alapján. Artikulációsan az F1 nagyjából megfelel az alsó állkapocs mozgásának, illetőleg a szájüreg nyíltságának. Az F2 a nyelv vízszintes mozgásának, valamint az ajakmozgásnak a függvénye: minél hátrább húzódik a nyelv és minél erősebb a labializáció (ajakkerekítés), annál alacsonyabb az F2 értéke. E két tényezőt egyesítve: a szájcsatorna hosszanti irányú megnyúlása süllyeszti, megrövidülése pedig emeli az F2 frekvenciáját. Az F3 alakulása leginkább a lágyszájpadlás mozgásához köthető.

A formánsok frekvencia- és intenzitásértékei a rezonátor méretétől és alakjától függenek, gyakorlatilag függetlenek az alaphangtól. Ha változtatjuk a rezonátorüregek alakját és méretét, változnak a formánsok jellemző értékei is, anélkül, hogy az alaphang változna. De fordítva is igaz: ha változtatjuk a hangszalagok rezgésének a szaporaságát, változik a zönge magassága, de nem változik az üregbeállítódás. Másként fogalmazva: a beszédben a hangforrás és a rezonátor, vagyis a glottális és a szupraglottális tevékenység lényegében független egymástól. Ez a függetlenség lehetővé teszi a beszéd akusztikai leírását úgy, hogy külön meghatározzuk a forrásfunkciót, tehát a hangszalagok tevékenységét, másfelől a szűrofunkciót, vagyis a rezonátorüregek tevékenységét. Az eljárás a beszédkutatásban azért is indokolt, mert a kétféle tevékenység a hangeszközök két csoportját, nevezetesen a beszédhangokat (szegmentumok, lásd a „A magyar beszédhangok állománya”. pontot) és a „zenei” (szupraszegmentális) elemeket (lásd a „Szupraszegmentális hangjelenségek: a beszéd „zenei” elemei”. pontot) hozza létre. A zönge paramétereit (frekvenciáját, erejét, időbeli lefutását) bizonyos határok között akaratlagosan befolyásolhatjuk (növelhetjük vagy csökkenthetjük), ezáltal ezek képesek nyelvi funkciók ellátására (lásd a „A hangsúly”. és a „A hanglejtés”. pontot). Ezzel szemben a beszédhangok minőségét adó frekvencia- és relatív intenzitásadatok a beszélő akaratától függetlenek. Ez úgy értendő, hogy ha a beszélő eldöntötte, mit fog mondani, a mondanivalója kifejezéséhez szükséges beszédhangokra jellemző artikulációs üregbeállítódást automatikusan létre kell hoznia. Ha nem így lenne, lehetetlenné válna a kölcsönös megértés.

A toldalékcső hatása a zöngére (Olaszy 1989:18 alapján)

Szabálytalan rezgés: zörej

Ha a viszony az összetevő rezgések frekvenciája között a fenti értelemben nem harmonikus, az eredő rezgés aperiodikus, szabálytalan, tehát nem lehet alaphangot meghatározni. Ennek megfelelően a keletkező hangjelenség fizikai értelemben nem zenei hang, hanem zörej, amelyet úgy írhatunk le, mint határozatlan számú, nem harmonikus összetevőkből álló, periódusos tulajdonság nélküli (vagy nehezen felismerhető periódusos tulajdonsággal rendelkező) hangot. A zörej a hangforrás szabálytalan mozgásának az eredményeként keletkezik. A beszédtevékenységben zörejes hangok akkor jönnek létre, amikor a képzési levegő a hangrésen átáramolva egyenesen a toldalékcsőbe jut, ott beleütközik a beszédszervek által állított akadályba (zörejes hangforrás) és az akadály jellegétől (szűkület, zár), helyétől és méretétől függően különböző típusú zörejek keletkeznek. Természetesen a zörejes hangszerkezetben is meg lehet határozni a részhangoknak egy vagy több olyan nyalábját, amelyek a többihez képest intenzívebbek (zörejgóc), de nem lehet fellelni azt a szabályos felhangszerkezetet, amely a zenei természetű zöngét jellemzi.

A beszédben lehetőség van arra is, amire a többi hangjelenség esetében nincs: a zenei természetű zönge ütközik bele a zörejkeltő akadályba, a keletkező hangjelenség pedig kevert típusú, egyszerre zenei és zörejes. Ennek megfelelően a zöngés mássalhangzók akusztikai szerkezetét a zöngés komponens formánsai és a zöngére rátelepedő zörej frekvenciaadatai együttesen határozzák meg. Minél erősebb a zöngés komponens a zörejkomponens rovására, annál nyilvánvalóbb a formánsszerkezet, azaz a magánhangzós jelleg és másodlagos a zörejes, azaz mássalhangzós jelleg. Ez a magyarázata annak, hogy a zöngés mássalhangzók olykor kategóriát válthatnak, és a nyelvi szerep tekintetében egyenrangúvá válnak a magánhangzókkal, pl. a szótagmag pozíciójában.

A zörejsávok mellett a mássalhangzók akusztikai szerkezetének fontos eleme az ún. lokusz, amely rezonanciahelyet jelent, és nem más, mint a mássalhangzó képzési helyének akusztikai vetülete. Ennek megállapítása azonban nem egyszerű, hiszen közvetlenül nem mérhető, csupán a szomszédos magánhangzó második (és kisebb mértékben a harmadik) formánsának a mássalhangzó rezonanciahelye felé való hajlásából lehet kikövetkeztetni. Másként kifejezve, a mássalhangzó azonosításának fontos kelléke a szomszédos magánhangzó, s ez egyben a beszédképzés dinamizmusára is rámutat. Saját színképük (lásd a „A beszédhangok színképe”. pontot) alapján a mássalhangzóknak – a réshangok kivételével – csupán a képzésmódját tudjuk meghatározni, képzésük helyéről a szomszédos magánhangzók tájékoztatnak, ha vannak ilyenek. Ha csupán mássalhangzók fordulnak elő a környezetben, a lokusz megállapítására nincs mód, következésképpen még bizonytalanabb a képzés helyének akusztikai kritériumok alapján történő azonosítása. Ez a magyarázata annak, hogy a hallgató a legtöbb hibát a mássalhangzók képzéshelyének az azonosításában követi el, és ez a magyarázata annak is, hogy az alapvető mássalhangzóosztályokat a tudomány – ráérezve a képzés helyének gyengébb azonosíthatóságára – a képzés módja alapján állította fel (lásd a „A mássalhangzók”. pontban).

A beszédhangok színképe

A beszéd fizikai szerkezetét láthatóvá lehet tenni az ún. hangszínkép (spektrum) segítségével, amely megadja, hogy az összetett hangot alkotó rezgések frekvenciaértékeihez milyen hangerőértékek tartoznak, azaz milyen az energiaeloszlás, ami valójában a hang minőségének közvetlen mutatója.

A magánhangzók jellemző formánsai a 300–3000 Hz-es frekvenciasávban helyezkednek el 74–94 dB-es átlagos intenzitással, a zöngés mássalhangzók jellemző részhangjai a 700–3500 Hz-es tartományban találhatók 68–88 dB átlagos hangerővel, végül a zöngétlen mássalhangzók jellemző magassági sávja 2000–10000 Hz, átlagos erőssége pedig 34–68 dB. És bár a beszédhangok minőségét a jellemző részhangok rezgésszáma és ereje együttesen határozza meg, e két paramétert egymástól függetlenül is lehet kezelni, hiszen a beszédhangok belső, inherens intenzitása az alapja a hangzósságuknak, idegen szóval szonoritásuknak, a frekvenciaértékek pedig az inherens magasságot jelzik. Az [i] pl. az energia szétszóródása miatt kevésbé intenzív, mint az [a:], ugyanakkor magasfrekvenciás összetevői miatt az [i]-t magasabbnak halljuk, mint az [a:]-t.[5]

A beszédhangok képzése során a tüdőből kiáramló levegő energiájának jelentős része súrlódási, áramlási és elnyelési veszteség formájában elvész. Minél összetettebb az akadály, annál nagyobb az energiaveszteség. A beszéd energiája 100–600 Hz között a legnagyobb, ebbe a sávba nagyjából az alaphang és a magánhangzók F1-e tartozik bele. A beszéd átlagos intenzitása 60 dB, ez adja a legjobb érthetőséget, a dinamikája pedig a suttogástól a kiabálásig terjedően 55–60 dB, azaz a halk suttogás és a hangos kiabálás közötti hangerőkülönbség 55–60 dB-nek felel meg.

Az akusztikus bázis nem más, mint a beszéd átlagos színképe, amelyhez pl. egy koktélparti hanganyagának az akusztikai elemzésével juthatunk. Egy ilyen beszédmintában ugyanis a hangzók keveredése a nyelvi eloszlás viszonyait tükrözi, emellett a keveredési kép pillanatról pillanatra változik, és néhány másodperc alatt tökéletesen jó átlagot eredményez.

A beszéd észlelése

A beszélőtől létrehozott és a hírtovábbító csatornán átjutó üzenet címzettje a hallgató, akinek egyfelől fel kell fognia a levegőrezgések által továbbított beszédjeleket, másfelől meg kell értenie az ezekben foglalt jelentést. A felfogtam-denem-értem állapot következik be, amikor a felfogott hangingereket nem tudjuk értelmezni.

A közreműködő mechanizmusok jórészt fekete doboz jellegűek, mert ma még nem tudjuk pontosan, mi történik az agyban, és jelentős vonatkozásokban azt sem, ami a fül és az agy között történik. Sokszor csak a hallgatónak a reakcióiból következtetve jutunk információhoz, de pl. a nyelvbotlások elemzéséből ugyancsak tudunk következtetni a zajló folyamatokra. Ezek kísérletes vizsgálatára a beszéd gépi úton történő előállításával nyílt lehetőség. Az eljárás lényege az, hogy a beszédszintézisben tetszés szerint változtathatók a beszédjelenségeket alkotó összetevők értékei, ennek megfelelően meglehetősen jól követhető, hogy a hallgató reakciójának a változása milyen fizikai változásnak az eredményeként következett be. (A beszédszintézisről lásd még a „A Történeti Korpusz”. pontot is.)

A fizikai hanginger nem azonos az általa keltett (élettani) hangérzéklettel és (lélektani) hangészlelettel. A fizikai hangjelenséget jellemző objektív tulajdonságok és a neki megfelelő hangészleletet jellemző szubjektív tulajdonságok között a leglényegesebb különbség az, hogy az előbbiek egymástól független mennyiségek, míg az utóbbiak kapcsolata – jórészt a hallási rendszer sajátos működéséből adódóan – olyan szoros, hogy megítélésük egymás nélkül nem képzelhető el. Alapvetően az érzékelésünk logaritmikus jellegét meghatározó Weber–Fechnerféle pszichofizikai törvény érvényesüléséről van itt szó, amelynek értelmében az érzet valamely tulajdonságának legkisebb észlelhető megváltozása arányos az érzetváltozást okozó ingerváltozás és az eredeti inger megfelelő fizikai mértékének a hányadosával. Az érzékelésben és észlelésben a rezgés frekvenciájának a hangmagasság felel meg, az intenzitásnak a hangosság, a rezgés felépülésétől a lecsengéséig eltelő időnek a szubjektív tartam, végül a részhangok egymás közti frekvencia- és amplitúdóviszonyának, tehát az energiaeloszlásnak a hangszín a szubjektív megfelelője.

Néhány további észleléslélektani tényezőt is figyelembe kell venni. Az egyik az elfedés (masking), amely akkor következik be, ha két, megközelítőleg azonos frekvenciájú részhang közül az erősebb elfedi a gyengébbet. Szerepük van továbbá az ún. hallószerviszubjektívharmonikuséskombinációshangoknak is. Ezek a fül aszimmetrikus működésének az eredményeként alakulnak ki a hallószervben; a fizikai hangingerben nem mutathatók ki, de nagyrészt ennek erejétől és frekvenciájától függenek. (A legújabb kutatások szerint az emberi fül nemcsak felfog, hanem ki is bocsát hangokat, ez az őtoakusztikus emisszió, amely azonban az észlelést nem befolyásolja.) Figyelmet érdemel az agy hangemlékező és -előrejelző képessége is, amely gátolhatja vagy segítheti az aktuálisan felismerendő hangjelenség észlelését.

Az észlelési–megértési folyamat paradoxonja az, hogy a folytonosan változó képzési beállítódások nyomán keletkező, folytonosan változó mennyiségekkel jellemezhető akusztikai jelsorozatot az észlelés folyamatában egymástól éles határral elkülönülő, ún. diszkrét nyelvi egységekre kell bontani. A többlépcsős folyamat kezdete a levegőben terjedő hangrezgések hallási elemzése, a percepció tehát a hallás élettani bázisán alapul. Avégpont, a jelentés megfejtése már a nyelvi rendszer által meghatározott idegi működés. Vagyis az, hogy ki hogyan észlel egy adott hangsort, amely meghatározott fizikai jellemzőkkel rendelkezik, jórészt attól függ, hogy mely nyelvközösséghez tartozik. Anyelvi rendszer, amelyet anyanyelvként megtanulunk, alapvetően meghatározza észlelési mechanizmusunkat. Ez úgy értendő, hogy ugyanaz az apparátus, amelyik nem beszéd jellegű hangjelenségeket igen finoman képes differenciálni, a beszédhangok sokféleségével szemben eltompul, s éppen ez a „funkcionális nagyothallás” az alapfeltétele annak, hogy pillanatról pillanatra változó fizikai paraméterekkel jellemezhető beszédjelenségeket egyazon nyelvi elemként értékeljünk. Ez a beszédre irányuló megkülönböztetett mechanizmus (beszédhallás) biztosítja a nyelv elemeinek, ezen keresztül pedig magának a nyelvnek viszonylagos állandóságát, ugyanakkor rendkívül zavaróan hat az idegen nyelv tanulásának folyamatában, mert megakadályoz bennünket abban, hogy az idegen nyelvnek az anyanyelvtől eltérő hangzási sajátosságait meghalljuk.

Ahallás

Az észlelés a fizikai hanginger hallási elemzésével veszi kezdetét. És bár a hallószerv a beszéd feldolgozásában a perifériát képezi, a működés maga a dobhártyától kezdve központi vezérlés alatt áll.

A hallószerv részei (5. ábra) a külső fül (közege levegő), a középsőfül (közege levegő) és a belső fül (közege folyadék).

A fül vázlatos rajza (Garman 1990: 53 nyomán)

A külső fül a fülkagylóval kezdődik és a (35 mm hosszú és 8 mm átmérőjű) csőszerű hallójáratban folytatódik, amelyet a dobhártya zár le. A dobhártyavékony szövetekből álló rugalmas membránlemez, amelynek a közepe befelé, a középső fül felé csúcsosodik. A középső fülben helyezkednek el a hallócsontocskák: a kalapács, amelynek a nyele közvetlenül rátapad a dobhártyára, valamint az üllő és a kengyel. Ezek össze vannak egymással kötve, egyik a másikhoz ízesül. A kengyel talpa a belső fül felső bejáratát képező ovális ablak rugalmas hártyájához támaszkodik. Az alsó bejárat a kerek ablak. A középső fülben található még az orrgaratba torkolló Eustach-kürt. Szerepe a külső és a középső fül közötti nyomáskülönbség kiegyenlítése, amely alapfeltétele a dobhártya zavartalan rezgésének. A belső fül csontos hüvellyel burkolt spirális tér, a kb. két és ¾ tekervényt mutató csiga (cochlea), amelyet az ún. alaphártya (membrana basilaris) két részre oszt oly módon, hogy ha kiegyenesítenénk, a középvonalában találnánk meg az alaphártyát.[6] Az alaphártyán helyezkedik el a Corti-szerv, amelyet külső és belső érzékelő sejtek, az ún. szőrsejtek alkotnak, ezekbe ágyazódnak be a hallóidegnek a végződéseit alkotó idegrostok. A Corti-szerv a VIII. agyidegnek, a hallóidegnek a végkészüléke.

A fül mint hangfelfogó eszköz a hozzá érkező összetett rezgéseket szinuszos összetevőikre bontja, s a fizikai paraméterekkel jellemezhető hangszínképet (spektrogramot) tér-időbeli eloszlással rendelkező idegimpulzus-sorozattá, azaz idegi hangszínképpé (neurális spektrogram) alakítja át a következő mechanizmus révén.

Amikor a hangjelenség eléri a külső fület, és a fülkagylón keresztül a hallójáratba jut, megrezegteti a hallójáratot lezáró dobhártyát, amely sajátrezgésszáma szerint rezeg, 2500–4500 Hz között. Az eredmény az, hogy a dobhártya az említett sávban 2–4-szeresére erősíti fel a bemeneti rezgést. Vagyis rezonátor természetéből következően a dobhártya megszűri a hozzá érkező hangingert, valamelyest hasonlóan ahhoz, ahogyan a képzésben a szájüregbeli konfiguráció megszűri a rezgésösszetevőket: egyes összetevőket felerősít, másokat eltompít. De már a dobhártyára is megszűrve érkezik a hanginger, hiszen a hallójárat maga is a rezonátor szerepét tölti be, és a saját sávszélessége (2000–3000 Hz) szerint módosítja a fizikai rezgést. A dobhártyáról a mechanikai rezgések átadódnak a kalapács nyelének, amely továbbadja ezeket a kalapács fejének, emez az üllőnek, ez pedig a kengyelnek. Eközben a dobhártya és az ovális ablak rezgő felületének a méretkülönbsége, valamint a hallócsontocskák által kifejtett, a fizikából ismert emelőhatás következtében mintegy 20-szorosára nő a hang nyomása. Ezt a megnövelt energiájú mechanikai rezgést a kengyel talpától az ovális ablak hártyáján keresztül átveszi a csiga folyadéka, amelynek a lökéshullámai hidrodinamikai törvények szerint áttevődnek az alaphártyára, és hullámmozgást váltanak ki. A Békésy György fizikus nevéhez fűződő hullámelmélet szerint a különböző frekvenciák az alaphártya különböző pontjait térítik ki. Mégpedig, mivel az alaphártya a csiga csúcsa felé fokozatosan vastagszik és veszít a feszességéből, a magas rezgésszámú összetevők az ovális ablakhoz, az alacsony rezgésszámúak a csúcshoz közel keltenek hullámmozgást. Az alaphártya mozgásától a Corti-szervet alkotó külső és belső szőrsejtek ingerelt állapotba kerülnek, és megtörténik bennük az elektromos kisülés, amelynek révén a mechanikai rezgések idegingerületekké alakulnak. Ezek az idegjelenségek azok, amelyeket a szőrsejtekhez tapadó hallóidegrostok sajátfrekvenciájuk és amplitúdófrekvencia karakterisztikájuk szerint módosítva továbbítanak a hallóideghez. A csiga tehát szintén áteresztő szűrőként viselkedik, hiszen minden egyes idegrost adott rezgésszámra reagál a legérzékenyebben. A hallóideg pályájára áttevődő impulzussorozat a központi hallási rendszerben még további átalakító, előrendező és alakzatképző folyamaton megy keresztül, mire elér a nagyagy halántéklebenyéhez, ahol a hallásért felelős kérgi mező lokalizálható. Itt értelmeződik a hanginger, tehát történik meg a beszédjel azonosítása, és ezzel kezdetét veszi a folyamat második része, a megértés, azaz a fogalmi és a kommunikatív jelentés hozzárendelése a felfogott hangjelenséghez. A megértési folyamat kulcskérdése a szófelismerés, azaz a mentális lexikonhoz való hozzáférés. Ez akkor következik be, amikor az elemző mechanizmus egy kivételével az összes szójelöltet kiiktatja. A gyakorlatban persze az elemzési eljárások és szintek időben szétválaszthatatlanul valósulnak meg, és a hallgató a feldolgozás közben, azzal egyidejűleg építi a beszéd nagyobb egységének fogalmi értelmezését. (Mind az azonosítás, mind a megértés kérdéseit részletesebben tárgyalja a „A megértés folyamata”„A szófelismerés és a mentális szótár szerepe a megértésben”. pont.)

Bár az emberi hallástartomány közel 10 oktáv (16 és 20 000 Hz között) és kb. 120 dB terjedelmű, a fül jelfeldolgozó képessége az 1000–3000 Hz közötti frekvenciasávban a legjobb, következésképpen itt alakul ki a legteljesebb észlelet. Azok a beszédjelenségek vannak tehát előnyös helyzetben az észlelhetőség szempontjából, amelyeknek az alkotóelemei ebbe a kitüntetett tartományba esnek.

A hallástartomány az életkor előrehaladásával fokozatosan szűkül. Az időskori hallásveszteség főleg a magas frekvenciákat és az alacsony hangerőt érinti, ezáltal veszélybe kerül a magasfrekvenciás összetevőket tartalmazó réshangok felismerése, valamint csökkennek a halk beszéd azonosítási esélyei. Ez a magyarázata annak, hogy 70–80 éves idős személyek beszédértési teljesítménye csupán 51%-a a 25 évesek által nyújtott 90–100%-os teljesítménynek. De folyamatos és erős behatásra a fiataloknál is csökken a hallásélesség (Walkman-szindróma).

Az azonosítás

Az észlelési folyamatban a beérkező akusztikai jeleket elemezzük, összetevőikre bontjuk, értékeljük a hasonlóságokat és különbségeket, az abszolút értékek alapján viszonyokat állapítunk meg és döntéseket hozunk, hogy eljussunk a hangjelenség azonosításához. Az akusztikai jel fizikai paramétereit elsődleges felismerési kulcsoknak tekintjük, és – a szemléletesség kedvéért félretéve azt a tényt, hogy ezek a paraméterek a hallásmechanizmusban bonyolult interakcióba lépnek egymással – a jel intenzitása alapján ítélünk a hangjelenség erejéről, azaz hangosságáról, a frekvenciaadatok alapján a magasságról döntünk, az időadat alapján az ejtés idői jellemzőiről hozunk döntést, az ezek együtteséből kialakuló spektrum alapján pedig megítéljük a hangjelenség minőségét. Eközben egyes lehetőségeket kizárunk, másokat elfogadunk a szóba jöhető választások közül. A stratégia lényegében a barkochba játékhoz hasonlítható, amelyben kérdésekkel, ellentétpárokkal közelítünk a feladat megoldásához, minden egyes újabb kérdésnél felhasználva a már rendelkezésre álló információt, és olykor visszalépve egy korábbi stádiumba, más irányt adva a játék folytatásának. Van persze olyan eset, amikor már a játék kezdetén annyi a rendelkezésre álló információ, hogy egy lépésben rákérdezünk az eredményre (heurisztikus elv). Van azonban olyan helyzet is, amikor a legutolsó kérdést is föl kell tenni ahhoz, hogy eljussunk a megoldáshoz. Sőt az is előfordul, hogy hiába tesszük fel az összes lehetséges kérdést, a feladat megoldása ezen az úton nem következik be, mert valahol, valamilyen – metaforával szólva – zaj van a csatornában. A folyamatban a rövid távú, ún. műveleti emlékezet lehetővé teszi, hogy 6–8 szótagig vissza tudjunk emlékezni arra, ami elhangzott, és adott esetben korrigálni tudjuk a döntésünket, illetőleg az elemek hosszabb sorozatában érvényesülő beszédjelenségekről, mint amilyenek a prozódiai tényezők (hanglejtés, hangsúly, beszédtempó, szünet, lásd a „Szupraszegmentális hangjelenségek: a beszéd „zenei” elemei”. pontot) egyáltalán dönteni tudjunk. A hosszú távú memória (az agyban tárolt tudás) a feldolgozás alatt lévő jelenség azonosítását teszi lehetővé. Lényegét tekintve az észlelés–megértés a bejövő információ és az elraktározott információ közötti interakció eredménye. A folyamatot sematikusan a 6. ábra szemlélteti, melyben a felfelé mutató dupla nyíl arra utal, hogy a működés ebben az irányban erősebb:

Az észlelési-megértési folyamat hierarchikus modellje

Az észlelést segítő tényezők

Az észlelési folyamatban a prozódiai elemek mintegy irányítják a hallgató figyelmét az információ aktuális tagolása és hierarchizálása felé. Nagyban segíti a feldolgozást a hangos közlés redundanciája is, ami azt jelenti, hogy minden információ többszörösen van kódolva, azaz többféleképpen is hozzáférhető. Így ha zavar támad az aktuálisan felhasznált felismerési kulcs feldolgozásában, át tudunk állni ugyanennek az információnak a többi hordozójára mint felismerési kulcsra. Ha pl. a zöngét nem halljuk tisztán, a zöngésséget mint hangjellemzőt a zöngés beszédhangnak a zöngétlenénél rövidebb időtartama mint másodlagos felismerési kulcs alapján azonosítjuk.

A hallgató azonban nemcsak a hangingerekre támaszkodik. Kitüntetett jelentősége van a látható beszédmozgásoknak, tehát az ajkak és a nyelv elülső része által közvetített információnak, valamint a beszédet kísérő taglejtéseknek és mimikának, összefoglalóan testnyelvnek. Ezek fontosságát meggyőzően bizonyítja pl. az utószinkronizálás közben a hang és a szájmozgás között kialakuló aszinkron, amelynek következtében jelentősen lelassul az észlelés folyamata.

Felhasználja a hallgató a beszédhelyzetben foglalt ismereteket is. Nem áll fenn például a [me:stø:l] hangsor kétértelműsége (ti. méztől vagy mésztől), ha a hangos közléssel egyidejűleg látjuk, hogy beszélgetőpartnerünk kezét fehér réteg vonja be.

A legfontosabb segítséget természetesen a nyelvtudás nyújtja, ezen belül is a nyelvi elemek következési valószínuségeire és az előfordulási gyakorisági értékekre vonatkozó intuitív tudás. Ennek alapján ugyanis a hallgató elébe megy a hangjelenségeknek, megpróbálja megjósolni az akusztikai jelsorozat elejéből, hogy mi lesz a folytatás, és a továbbiakban csak azt kell ellenőriznie, hogy a beérkező jel hasonlít-e az elvárthoz vagy nem. Így a hallgató sokszor már akkor azonosítja a nyelvi elemet, amikor még csak az első hang vagy szótag hangzott el belőle. Egy példa: amint a hallgató azonosította a [skl] szekvenciát, azonnal leszűkül a szóba jöhető szavak köre 1-re, azaz megtörténik a szófelismerés, mivel [skl] mássalhangzó-kapcsolattal csupán a szklerózis szó kezdődik. Ez a predikciós eljárás teszi lehetővé, hogy a kommunikációs csatornában fellépő vagy állandóan jelen lévő konkrét vagy átvitt értelmű zaj ellenére is megértsük a hiányosan továbbított közleményt, hiszen az agyban reprezentálódott nyelvtudás (nyelvi kompetencia) alapján rekonstruálni tudjuk a jelsorozatot. Az eljárás eredményessége közvetlen összefüggést mutat a beszédjelenségek előfordulási gyakoriságával: minél gyakrabban fordul elő valamely beszédjelenség, annál mélyebben vésődik be a hosszú távú emlékezetbe, és minél mélyebben vésődik be, annál könnyebben tudjuk segítségül hívni az észlelés folyamatában.

A közlemény megértéséhez szükség van az ún. kognitív bázisra is, tehát arra az ismeretrendszerre, világismeretre, amelyet az életünk során felhalmozunk. Mert hiába hibátlan az észlelési mechanizmusunk, hiába vannak a magyar nyelv szerkezetéről és gyakorisági mutatóiról pontos ismereteink, ha nem tudjuk, mi a hermeneutika, bár azonosítjuk, ki tudjuk mondani, le tudjuk írni, nem tudjuk értelmezni a szót. Vagy amikor viccet mesélnek, a csattanó nem csattan, ha nem ismerjük az értelmezéshez szükséges vonatkozási pontokat.

Az akusztikai jelsorozat és az észlelést segítő egyéb tényezők között olyan viszony áll fenn, hogy utóbbiakból minél kevesebb áll rendelkezésre, annál nagyobb mértékben támaszkodik a hallgató az akusztikai jelsorozatra. Ez történik pl. az ún. logatomok (jelentés nélküli hangsorok, pl. güled, vatyorgó, páhás) feldolgozásakor, valamint idegen nyelvi szituációban.

A jelentős egyszerűsítéssel ismertetett mechanizmus adja a nyelvspecifikus percepciós bázist. Ezt úgy lehetne meghatározni, mint azt a sajátos hallószervi és idegrendszeri mechanizmust, amelynek révén a levegőrezgések formájában továbbított beszédjeleket felfogjuk, és kibőntjuk a bennük foglalt nyelvi tartalmat. A nyelvi rendszertől meghatározott percepciós bázis az anyanyelv tanulásának folyamatában alakul ki abból az egyetemes neurofiziológiai képességből, amely a beszéd feldolgozására adva van, és része a biológiailag programozott alaptudásnak, amellyel az egyed megszületik. Ennek tudható be, hogy már az újszülött is rá tudja vetíteni magzati állapotban elraktározott észlelési tapasztalatait környezete hangjelenségeire, és különbséget tud tenni beszéd és nem beszéd, férfi és női hang, anyai és nem anyai hang között.

Beszéd és hallás kapcsolata

Beszéd és hallás szorosan összefonódó képességek. A veleszületett vagy korán szerzett hallásfogyatékosság nyomán ennek fokától függően kialakuló némaság vagy különböző mértékben akadályozott beszéd meggyőzően bizonyítja, hogy a beszéd kiépülése a percepció révén, auditív úton történik. Normális körülmények között ugyanis a hallásközpont és a beszédszerveket mozgató motoros központ között az agyban közvetlen kapcsolat áll fenn, amely lehetővé teszi, hogy a hangképző szerveink mozgatása nyomán keletkező hangjelenségeket akusztikus visszacsatolással magunk is meghalljuk, és kiejtésünket hozzáigazítsuk környezetünk kiejtéséhez. Ha a visszacsatolás hiányzik, elmarad az artikulált hangprodukció, ha pedig nem megfelelő a működése, hibás beszédképzés lesz az eredmény. A gyógypedagógiai módszerekkel (szurdopedagógia) hangos beszédre tanított siketeknek ezért tér el jelentősen mind az alaphangja, mind az artikulációja a megszokottól. Ami a fordított irányú kapcsolatot illeti, a képzésbeli rendellenességeknek nincs ilyen döntő hatása az észlelésre, de tény, hogy az artikulációs rendellenességek – a saját ejtés és a norma szerinti ejtés közötti kóros eltérés miatt – nehezítik a beszédjelenségek agyi reprezentációjának a kiépülését, ez pedig kihat az észlelési folyamat zavartalan mőködésére.