Ugrás a tartalomhoz

3D megjelenítési technikák

Dr. Fekete Róbert Tamás, Dr. Tamás Péter, Dr. Antal Ákos, Décsei-Paróczi Annamária (2014)

BME-MOGI

A háromdimenziós mélységészlelés

A háromdimenziós mélységészlelés

A mélységészlelés tárgyalása előtt nélkülözhetetlen néhány pszichológia alapfogalmat tisztáznunk. Az ember az őt körülvevő tárgyakat valamilyen formán észleli. Ennek a folyamatnak ez első lépése a tárgyak háttértől való elkülönítése, a perceptuális szegregációja. Ezeket a folyamatokat a V1 agyterület alapozza meg. Ez a terület felelős a körvonalak detektálásáért és a tárgyak háttértől való elkülönítéséért is. A tárgyak háttértől való kelkülönítésében nagy segítséget jelent a feldolgozórendszer számára, hogy a tárgy általában a háttér előtt helyezkedik el, a háttér a tárgy mögött is folytatódik, míg a körvonal általában a tárgyhoz tartozik és nem a háttérhez, valamint a tárgy jobban hasonlít egy már látott tárgyra, mint a háttér. Tehát a látott képen lévő tárgyak mérete, szimmetriája, orientációja és ismertsége nagyban hozzájárul ahhoz, hogy el tudjuk különíteni egymástól a hátteret és a tárgyat.

A mélységészlelés – távolságészlelés – tehát azon képességünk, amellyel a körülöttünk lévő világot három dimenzióban láthatjuk. Képesen vagyunk nagy pontossággal felmérni a tárgyak távolságát, megfogni dolgokat, illetve mozogni a térben. A mélységészlelés képességét már a háromhónapos csecsemőknél ki lehet mutatni, ami azt jelenti, hogy ez biológiailag is igen fontos képességünk.

Jelen fejezetben szó lesz a Gestalt-elméletről, a monokuláris és binokuláris jelzőmozzanatokról valamint a binokuláris diszparitásról.

A Gestalt-elmélet

A Gestalt-elmélet szerint egy tárgy több, mint a részeinek összessége. A tárgyak felismerésében nagy szerepe van az alábbi, úgynevezett Gestalt-szabályoknak. Az adott mintázatot úgy látjuk, ahogy az a lehető legegyszerűbb. Az egymáshoz hasonlatos mintarészeket egymással csoportosítva látjuk. Az egy ívre illeszkedő részeket egy folytonos alakként értékeljük. Az egymáshoz közelebbi tárgyakat egyként kezeljük. Az együtt mozgó tárgyakat egyként kezeljük. Ha az előzőekben ismertük a tárgyak, akkor könnyebb a későbbi felismerés és a részek csoportosítása, az egész előállítása érdekében.

1.20. ábra - Egy példa a Gestalt-szabályok alkalmazására (valójában a kép nem tartalmaz kockát)


A jelzőmozzanatokról

A háromdimenziós mélységészlelésünk egy rendkívül összetett pszichológiai folyamat, mégis oly könnyedén használjuk a mindennapokban. Működtetése nem igényel tudatos erőfeszítést, teljesen automatikus, és mentálisan nem növeli a megterhelést. A tér és mélységészlelés azon folyamatok egyike, amely talán a leginkább rávilágít arra, hogy látásunkban csupán kis részt vállal maga a látószerv és hatalmas részt az agy. A térérzékelésben két fő jelzőmozzanat-típust különböztethetünk meg. Az egy szemmel is működő monokuláris és a két szemmel használható binokuláris jelzőmozzanatokat. Mint már utaltunk rá, az állatvilágban a növényevőknek általában a fejük két oldalán helyezkedik el a szemük, hiszen létfenntartásukhoz sokkalta fontosabb a nagy látótér, mint a mélységérzékelés. A ragadozóknak azonban fontosabb, hogy meg tudják becsülni prédájuk távolságát, így érthető, hogy az evolúció folytán a fejük elülső részére kerültek a szemek egymással egy síkban, hogy így a lehető legnagyobb binokuláris teret hozzák létre. Persze látnunk kell azt is, hogy a binokuláris látásunk csupán korlátozott távolságon belül használható hatékonyan, ezen kívül nem jobb, mint az egyszemes látás.

Az álltavilágban sok módját találhatjuk annak, hogy bizonyos fajok milyen módon érzékelik környezetüket. Gondolhatunk itt például a denevérekre, vagy a teljesen vak barlangi rákokra. De kibővíthetjük látókörünket azzal is, hogy az ember miként képes az őt körülvevő tér érzékelésére szemek nélkül - a karjait, a hangját, a kopogtatást és egyéb eszközöket igénybe véve. Számunkra azonban jelen téma kapcsán csupán a látás a fontos. Meg kell ismernünk mindazokat a folyamatokat, amelyek hozzásegítenek bennünket a térérzékeléshez.

Monokuláris jelzőmozzanatok

Az alábbiakban áttekintjük a monokuláris jelzőmozzanatokat, megnézzük, hogy miből tudunk következtetni a tárgyak távolságára, ha csak egy szemmel nézzük azokat. Ilyenek a tárgyak retinális nagysága és relatív retinakép mérete, a horizonthatás, a takarási hatás, a perspektíva, a textúra, az elkékülési hatás, a légtávlat, a fény-árnyék játék, az akkomodáció és a mozgási parallaxis.

A retinális nagyság: Elsődleges jelzőmozzanat, hogy a térben elhelyezkedő tárgy mekkora területet foglal el a retinán. Ebből a feldolgozórendszerünk meg tudja becsülni az észlelt tárgy távolságát, amennyiben rendelkezik priori (előzetes) információval annak tulajdonságait illetően. Ha például egy kisautót látunk magunk előtt az asztalon, akkor felismerjük, hogy kisautó és nem gondoljuk azt, hogy egy valódi gépkocsi a távolban.

1.21. ábra - A retinális nagyság (a két autó azonos képmérettel bír, mégis el tudjuk dönteni, hogy melyik van távolabb, ha rendelkezünk megfelelő priori információkkal a tárgyat illetően)

A retinális nagyság (a két autó azonos képmérettel bír, mégis el tudjuk dönteni, hogy melyik van távolabb, ha rendelkezünk megfelelő priori információkkal a tárgyat illetően)


A horizont hatás: A tárgyak távolságának becslésében az is segítség, hogy a látómezőnk horizontja fölött vagy alatt helyezkedik el. Minél feljebb van ugyanis, annál távolabbinak látjuk a tárgyat, és minél lejjebb van, annál közelebbinek.


A takarásihatás: Ha egy tárgy eltakarja egy másik tárgy bizonyos részeit, akkor arra következtetünk, hogy közelebb van hozzánk. Ez a takarás jelensége.


Perspektíva: Szintén tanult és mélyen rögzült jelenség, hogy a párhuzamosnak gondolt élek a távolban összetartanak. Ez a lineáris perspektíva, amellyel becslést tudunk adni a tárgyak egymáshoz képesti elhelyezkedésére.


Textúra: A textúrát személve észrevehetjük, hogy a közelebbi textúrákat jóval részletgazdagabbaknak találjuk, mint a távolabbi textúrákat. A részletgazdagsággal együtt természetesen a textúra elemeinek mérete is a távolsággal fordítottan arányos. Ha például egy macskaköves utat szemlélünk, láthatjuk, hogy a távolabbi kövek kisebbek és kevésbé részletgazdagok.


Az elkékülésihatás: A Nap összetett fénye a Föld légkörén áthaladva szóródik. A szóródás a kék tartományokban magasabb, így a nappali légkört kéknek látjuk. Ha egy távoli tárgy és közöttünk nagy légtömeg van, a tárgy képe elkékül. Ennek a kékülésnek a mértéke arányos a tárgy távolságával. Ezt az úgynevezett elkékülési hatást használhatjuk a távoli tárgyak, például hegyek távolságának becslésére.

Légtávlat: A távoli tárgyak nem csupán kékülnek a közbenső légtömeg miatt, hanem a kontrasztjuk is romlik, éleik elmosódnak, és színeik tompulnak. Az elkékülési hatással együtt ezt a jelenséget légtávlatnak nevezzük.

1.26. ábra - Az elkékülési hatás és légtávlat


A fény-árnyék játék: További segítség lehet egy tárgy térbeli elhelyezkedésének valamint kiterjedésének becslésére, a tárgyon feltűnő árnyék és fény viszonya, határvonala, illetve annak tranziense.


A relatív retinakép mérete: Ha látunk két tárgyak, amelyről nincsenek priori információink, illetve azonos méretűnek gondolnánk azokat, akkor a két tárgy közül azt látjuk nagyobbnak, amelyik mérete a retinánkon nagyobb.

Akkomodáció: Egy kevésbé kognitív jelzőmozzanat lehet a szemlencse akkomodációja. Ez a folyamat akkor következik be, amikor szemünkkel élesre szeretnék állni egy tárgyra valahol a térben. Ebben az esetben a szemlencse feszítőizmai úgy ernyednek el és feszülnek meg, hogy az egyik legtökéletesebb szabályozókört alkalmazva úgy állítják be a szemlencse görbületi sugarát, hogy a tárgy képe pontosan a retinára képeződjön le. Ez hasznos információ lehet a feldolgozórendszerünk számára a közelebbi – körülbelül 2 méterig bezárólag – tárgyak távolságának becslésére.

1.28. ábra - Akkomodáció

Akkomodáció


A mozgási parallaxis: Az azonos sebességgel mozgó tárgyak közül azt érzékeljük közelebbinek, amely gyorsabban halad át a látómezőnkön – a másikhoz képest. Ekkor a retinánkon egyfajta szögsebességet mérhetnénk, hiszen a retina gömbfelülethez hasonló alakú. Gondolhatunk például arra, hogy utazás közben a vonatból kitekintve a közeli fák nagyobb szögsebességgel haladnak át a retinán, mint a távoli házak. Ezt a jelenséget mozgási parallaxisnak nevezzük.


Binokuláris jelzőmozzanatok

Az egyik legegyszerűbb binokuláris jelzőmozzanat a konvergencia. Amikor a két szemünkkel egy 6-10 méter távolságon belüli tárgyra nézünk, látórendszerünk a két szem tengelyét igyekszik összetartóan a tárgyra fordítani. Ennek a konvergenciának a foka fontos jelzőmozzanat a tárgy távolságának becslésére. Amennyiben a két szemtengely által bezárt szög kisebb, a tárgy távolabb van, amennyiben a szög nagyobb, a tárgy közelebb van.

A másik jelzőmozzanat a binokuláris parallaxis. A parallaxis eredendően a testek egymáshoz viszonyított helyzetének változása eltérő irányokból nézve. Tegyük fel, hogy a két szemünkkel egy tárgyra nézünk a térben! Emellett megjelenik egy másik tárgy is, amely az előzőhöz viszonyítva más-más helyen bukkan fel, attól függően, hogy melyik szemünkkel nézzük. Ha a két tárgy azonos távolságban van, akkor a két szemünkkel ugyanazt az elhelyezkedést látjuk. Ha a két tárgy különböző távolságban található, akkor az egyikre nézve, és a két szemet egyenként kinyitva azt tapasztaljuk, hogy a tárgyak távolsága változik a szemeink által látott képen. Ennek a vízszintes távolságváltozásnak, az úgynevezett parallaxisnak annál nagyobb a mértéke, minél nagyobb volt a két tárgy közötti különbség. Valós helyzetben persze minden esetben valamelyik tárgyra akkomodál a szemünk, ezért a másik tárgyat nem láthatjuk tisztán. Minél nagyobb volt a távolság, annál homályosabban látjuk azt. A háromdimenziós mozifilmeken ezt nem tapasztaljuk, hiszen szemlencsénk ilyenkor minden esetben a mozivászonra akkomodál.

Binokuláris jelzőmozzanat továbbá a tárgyak nézete is. Amikor két szemünkkel nézzük a közeli tárgyakat, akkor szemeink különböző nézetekből látják azokat, és ezért a retinánkra érkező kép nem csupán parallaxist tartalmaz, hanem a tárgyak más-más oldalának képét is. Egyik szemünkkel láthatunk olyan részletet a tárgyról, amit a másik szemünkkel nem, és fordítva. Ez a két kép közötti apró különbség is hozzájárulhat a tárgyak távolságának észleléséhez.

1.30. ábra - A binokuláris parallaxis és diszparitás

A binokuláris parallaxis és diszparitás


A binokuláris diszparitás

A diszparitás jelentése eltérés. Eltérés a két szem retinális képe között, pontosabban a két képen lévő tárgyak távolsága között. Úgy gondolhatnánk, hogy a teret teljes egészében térben látjuk, valójában azonban a teljes tér csak egy csekély szeletét látjuk valós sztereolátással. Azt a jelenséget, hogy két szemünk retináján két kissé különböző kép keletkezik, binokuláris diszparitásnak nevezzük. Horopternek hívjuk azt a térbeli felületet, amelynek minden pontját azonos szögből látjuk a két szemünkkel. Ha rögzítünk egy pontot a térben láthatjuk, hogy a tárgytól nagyobb vagy kisebb mélységben lévő egyéb tárgyakból kettőt látunk. A fixált tárgy körül van egy mező, amelyen belül működhet a valódi sztereolátásunk, azon kívül a képek szétesnek, és kettős látás jön létre. Ezt a mezőt sztereomélységnek hívjuk. Panum 1858-ban igazolta, hogy idegrendszerünkben létezik egy, az előbbivel összefüggésbe hozható mező. Ez azért lehetséges, mert az idegrendszerünkben létrejövő szerveződés retinotopikus, azaz a retina szomszédos receptorainak ingerületei az agy szomszédos neuroncsoportjaihoz kapcsolódnak. A sztereolátásért felelős agyi terület mikroszkóp alatt is láthatóan csíkozott, a két szem által alkotott képek ugyanis az egyik és a másik szem által küldött képrészleteket felváltva tartalmazzák.

1.31. ábra - A horopter és a sztereo látótér


Julesz Béla 1960-ban felfedezte, hogy a sztereolátást nem előzi meg az tárgyak azonosítása, mint ahogy azt addig hitték. A térbeli mélységet a retinális képeken lévő tárgyak felismerése nélkül is képesek vagyunk érzékelni. Julesz ezt a felfedezést a róla elnevezett random-dot (véletlen pont) sztereopárokkal bizonyította be. A Julesz-féle sztereopár két képet tartalmaz a két szem számára, amelyet szeparáltan kell bemutatni. Az egyik képen véletlen pontokat látunk, a másik képen pedig az előző kép kicsit módosított változatát. A módosítás lényege, hogy a kívánt alakzat pontjait a diszparitás mértékével eltoljuk balra vagy jobbra, és az üresen maradt képpontokat véletlenszerűen feltöltjük. Ekkor a személőnek azonnal előbukkan a kívánt alakzat, az előzetes felismerés nélkül. A kép nagyon stabil, pásztázó szemmozgásoknál is fennmarad.

1.32. ábra - Egy Julesz Béla féle random-dot sztereogramm