Ugrás a tartalomhoz

Egészségügyi informatika

Ködmön József (2011)

Debreceni Egyetem

4. Fogalmak számítógépes reprezentációja

4. Fogalmak számítógépes reprezentációja

Attribútumtípusok

Fogalom teljes leírása: Egy fogalom N|A1,…,An típusú leírása teljes, ha a nominális valamennyi attribútumát felsoroltuk.

Megjegyzés: A nominális teljes lírása általában lehetetlen, illetve fölösleges is.

Attribútumok fajtái:

  1. Az olyan attribútumokat, amelyek önmagukban elegendőek a nominális azonosításhoz szufficiens (elégséges) attribútumoknak nevezzük.

  2. Az olyan attribútumokat, amelyek önmagukban nem elégségesek a nominális azonosításához, de hiányuk kizárja a nominális azonosítást necesszárius (szükséges) attribútumoknak nevezzük.

  3. Az olyan attribútumot, amely önmagában nem azonosítja a nominálist és hiánya nem zárja ki a nominális azonosítását kontingens (esetleges) attribútumnak nevezzük.

Megjegyzések:

  • Minél bonyolultabb struktúrákról van szó, annál nehezebb az attribútumok megítélése:

    absztrakt fogalom - konkrét jelentés konfliktusa (három lábú kutya);

  • A betegség emberi absztrakció terméke (önmagában nem jelenik meg semmilyen betegség):

    beteg szervezet  –> gyakori, jellemző tünetek megjelenése (mintázata) –>az attribútumok fajtáinak ismerete a betegségek osztályozásában segít

Fogalmak számítógépes reprezentációja

Számítógépes fogalomreprezentáció folyamata:

1.    A kezelni kívánt fogalomkör kijelölése.

2.    A fogalmak rendezése, csoportosítása.

3.    Jelsorozatok hozzárendelése a fogalmakhoz a rendezés sorrendjében.

Ad 1: Az orvostudomány teljes fogalomkészlete behatárolhatatlan  jól körülhatárolt részt kezelhetünk. Lehetséges megoldás: a fogalmak szakszerű, célirányos csoportosítása attribútumai segítségével.

Ad 2 Csoportosítás alapja: fogalmak attribútumainak azonossága.

  • Rendezési elv megválasztása: mely attribútumokat veszünk figyelembe. A kiválasztott rendezési elv meghatározza a fogalomreprezentáció rendszer lehetőségeit (pl. adatok visszakeresése gyorsan: csoportosítási szempontok alapján)!

  • Két alapvető stratégia: klasszifikáció és nómenklatúra. Mindkét esetben: a természetes nyelvű kifejezéseket meg kell feleltetni a fogalomreprezentációs rendszer célkifejezésével (indexelés)

Ad 3. A célkifejezés helyettesítése valamilyen nem nyelvi szimbólummal (kódolás).

Klasszifikáció

Klasszifikáció: osztályokba sorolás, rendezés.

Klasszifikációs rendszer: objektumok bizonyos attribútumok azonossága, illetve hasonlósága alapján csoportokba sorolása.

Megjegyzések:

  • Csoportosítás alapja = rendszerezés szempontja: bizonyos attribútumok azonossága, hasonlósága.

  • Az attribútumok kiválasztása <–> a rendszertől elvárt szolgáltatások.

Klasszifikációs rendszer célja: az adatok statisztikai jellegű feldolgozása.

Klasszifikációs rendszer jellemzője: viszonylag kevés kategória.

Megjegyzések:

  • Túl sok kategória –> egy kategóriában kicsi az elemszám: a statisztikai feldolgozás irreális.

  • Viszonylag kevés kategória: egy kategóriában viszonylag sok adat: egyszerűsítés („összemossa” a dolgokat).

  • A klasszifikáció szándékosan egyszerűsít!

  • Nem alkalmas egyedi jelenségek feldolgozására.

Nómenklatúra

Nómenklatúra: elfogadott, egyértelműen szabályokra alapított elnevezési rendszer. (Névmutató, szójegyzék.)

Klasszifikációs rendszer finomítása az „összemosódott” egyedek egyre inkább megkülönböztethetővé válnak szükséges, hogy minden objektumnak neve legyen.

Nómenklatúra: azonos tárgykörbe tartozó fogalmak elnevezésének rendszere.

Szisztematikus nómenklatúra: olyan nómenklatúra, amelyben az egyes elnevezések úgy vannak megválasztva, hogy utaljanak a fogalmak rendszerbeli helyére.

Megjegyzések: A továbbiakban: szisztematikus nómenklatúra = nómenklatúra.

Nómenklatúra is tekinthető csoportosításnak:

  • Csoportosítás alapja = rendszerezés szempontja: bizonyos attribútumok azonossága, hasonlósága.

  • Az attribútumok kiválasztása <–> a rendszertől elvárt szolgáltatások.

  • Ebben a megközelítésben: nómenklatúra » nagyon finom klasszifikáció.

  • DE: a klasszifikáció szándékosan egyszerűsít, a nómenklatúra kényszerűségből egyszerűsít.

Nómenklatúra célja: a jelenségek minél finomabb megkülönböztetése, azaz egyedi esetek feldolgozása.

Indexelés

Indexelés: az az eljárás, amikor egy nyelvi kifejezést a jelentés viszonylagos megőrzésével egy fogalomreprezentációs rendszer célnyelvére fordítjuk.

Célkifejezés lehet:

  • klasszifikációs rendszerben: csoport;

  • nómenklatúra esetén: a fogalom rendszerbeli, standardizált neve.     

Indexelés során az információ jelentése kisebb nagyobb mértékben  megváltozik!

Az indexelés információvesztéssel (jelentésváltozással) jár az indexelés irreverzibilis (irányában vissza nem fordítható művelet):  célkifejezésből nem állítható helyre a természetes nyelvi információ.

Kódolás

Kódolás (szűkebb értelemben): az az eljárás, amikor valamely jelrendszer jelsorozatát egy másik jelrendszer jelsorozatára fordítjuk.

A kódolás során az információ jelentése  nem változik (csak a jelrendszer változik)!

Kódolás nem jár információvesztéssel a kódolás reverzibilis (megfordítható, visszaállítható): a kódolásból visszaállítható a célkifejezés.

Kódolás (tágabb értelemben): indexelés és kódolás.

Kódrendszer: indexelési technika + célnyelvi kifejezés + célnyelvi kifejezésekhez rendelt kódok.

Kódkonverzió I.

Egyetlen kódrendszer nem képes minden igény kielégítésre.

Különböző kódrendszerek különböző célra készülnek:

  • orvosi fogalmak más-más körét fogják át;

  • a fogalmak osztályozási szempontjai eltérőek.        

Különböző kódrendszerek è kódkonverzió.

Kódkonverzió: Adott kódrendszer kódolt adatainak megfeleltetése más kódrendszer kódjainak.

Kódkonverzió eszköze: keresztreferencia-táblázat.

Keresztreferencia-táblázat: két vagy több kódrendszer egymásnak megfelelő kódjait tartalmazó táblázat (két vagy többnyelvű szótár).

Keresztreferencia-táblázat alkalmazásnak korlátjai:

  • gyakorlati: adott esetben kezelhetetlenül nagy;

  • elvi: indexelés során információvesztés => kódolt adat nem tartalmaz elegendő információt ahhoz, hogy az egyik kódrendszerben kódolt fogalom egy másik kódrendszerben pontosan elhelyezhető legyen.

Kódkonverzió II.

4.1. ábra - A kódkonverzió alkalmazásának elvi korlátja

A kódkonverzió alkalmazásának elvi korlátja

Kódrendszerek közötti megfeleltetés:

  • általában finomabb felbontású kódrendszerből az adatok egy része konvertálható a durvább felbontású kódrendszerbe (fordítva nem);

  • aláosztás: a finomabb felbontású kódrendszer minden eleme a durvább felbontású kódrendszer egy és csak egy elemébe esik (mindkét kódrendszerben a rendezési elv azonos);

  • „abszolút” aláosztás: rendkívül finom osztályozás: minden objektum önálló osztályba tartozik => ez a kódrendszer bármely más kódrendszer aláosztásának tekinthető;

  • „abszolút” aláosztás hátránya: a keresztreferencia-táblák mérete nagyméretű.     

Végső következtetés:

kódkonverziók automatizálása a gyakorlatban általában nem megvalósítható

Multidimenzionális kódrendszerek

Alapötlet: a fogalmakat több, egyenrangú (egymástól független) szempont figyelembevételével kódoljuk.

Egydimenziós kódrendszer: a fogalmi rendszert egyetlen kódrendszerrel kódoljuk, függetlenül attól, hogy egy vagy több szempontú volt az osztályozás (legfeljebb a többszempontú osztályozás nem tükröződik a kódokban).

Multi/többdimenziós kódrendszer: a fogalmakat több, egymástól független kódok segítségével kódoljuk.

Multidimenziós kódrendszer jellemzői:

  • a fogalmat alkotóelemeire bontja => a multidimenziós kódrendszer fogalmi tudást tartalmaz a kódolt fogalomkörre vonatkozóan;

  • indexelés időigényes, mivel többszempont szerint is indexelni kell;

  • a dimenziók növelésével a fogalmak jobban szétválaszthatók;

  • több dimenzió révén többféle szempont szerint kereshetjük vissza az adatokat.