Ugrás a tartalomhoz

A gépi látás és képfeldolgozás párhuzamos modelljei és algoritmusai

Dr. Rövid András, Dr. Vámossy Zoltán, Dr. Sergyán Szabolcs (2014)

Typotex Kiadó

Miért bonyolult a számítógépes látás?

Miért bonyolult a számítógépes látás?

  • A nagyszámú felület különböző anyagokból, textúrázottsággal, geometriai jellemzőkkel és sokszor inhomogén, vagy eltérő megvilágítási körülmények között rendkívül eltérő képekhez vezet

  • A 3D világ 2D kép transzformáció rengeteg információt elveszít – az ún. inverz térképezésnek nincs egyértelmű megoldása

  • Számítástechnikailag “intenzív” (összetett, számításigényes megoldások)

  • A felismerés menetét még nem értjük pontosan

  • A valós esetekben a vizsgált célobjektumok mellett rengeteg irreleváns, vagy zavaró objektum, illetve zaj nehezíti az értelmezést. Információvesztést okozhatnaknak azáltal, hogy kitakarják a célobjektumot, vagy annak egy részét

Felismerés nehézségei

Jelenetek megértése, még komplex és rendezetlen kép esetében is egyszerű az ember számára

  • Hogyan tudjuk megérteni, kivenni a valóságot, vagy a valóság képét?

  • Mi a nyitja a képek megértésének?

  • Milyen ismeretet használunk a képek megértéséhez?

A szín szerepe

  • Mi az objektum?

  • A színeknek van-e szerepe a felismerésben?

  • Egyszerűbb-e felismerni a színeket különböző nézetekből?

A textúra szerepe

Karakterisztikus képtextúrák segíthetnek az objektumok felismerésében

Az alak szerepe

Számos esetben a forma ad segítséget a jelenet megismeréséhez

A csoportosítás szerepe

Praktikus megfontolások

Vegyük figyelembe a jelenet körülményeit

  • Gyűjtsünk minél több adatot (képet)

  • Vegyük figyelembe a környező világ jellemzőit

  • Számíthatóság és robosztusság

A számítógépes látórendszereknél, általában az iparban:

  • A megvilágítási feltételeket mi szabályozzuk

  • Az objektumot mi pozícionáljuk

  • Az objektum jellemzőiben rejlő lehetőségeket használjuk ki

Gépi látás eléri-e, megelőzi-e az emberi látást?

Igen és nem (de általában nem!)

  • emberek “összetett” dolgokban jobbak

  • számítógép „egyszerű” dolgokban jobb

Emberi érzékelés korlátai

A számítógépes program nem látna különbséget (lásd az internetes hivatkozáson található cikket)

Sinha and Poggio, Nature, 1996

Illúzió: mozgónak látjuk a képrészeket