Ugrás a tartalomhoz

Bevezetés a tudományfilozófiába

Gulyás László, Kampis György, Kutrovátz Gábor, Ropolyi László, Soós Sándor, Szegedi Péter (2013)

Eötvös Loránd Tudományegyetem

4.2 A tudományfilozófia kvantitatív szociológiai módszerei

4.2 A tudományfilozófia kvantitatív szociológiai módszerei

(Soós Sándor, Kampis György, Gulyás László)

4.2.1 A tudományszociológiától a bibliometriáig

A huszadik század második felében a tudományfilozófia szociológiai fordulata egy leíró megközelítést helyezett az előíró, a „sohasemvolt” idealizált tudományt előtérbe állító logikai-tudományelméleti módszertan helyébe. Az új megközelítés – annak részeként, hogy a megvalósult tudomány érdekelte – elsősorban tudásszociológiai kérdésekkel foglalkozott, vagyis a tudományos tudás társadalmi beágyazottságával, feltételeivel, történeti hagyományaival. Ez továbbra is egy metaelméleti, ezért a konkrét tudomány művelői által sokszor gyanakvással szemlélt terület. Mindezekkel párhuzamosan azonban megnőtt az érdeklődés a szó társadalomtudományi értelmében vett szociológia, közte a tudományszociológia alkalmazása iránt is. A tudományszociológia sokféle célja között kvantitatív, mennyiségtani leírások megalkotására, a tudományos tevékenység egészének – és ennek részeként a tevékenység társadalmi, intézményi vonatkozásainak – dokumentálására jelentkezett igény.

Részben e motivációból nőtt ki a tudománymetria, ami a tudományos tevékenység „mérését” és elemzését jelenti. Első képviselői Derek de Solla Price (1979) és Eugene Garfield voltak – utóbbi a lent közelebbről is bemutatott ISI adatbázis megalkotásával a tudomány- és bibliometriának máig tartó lendületet adott. Mégis de Solla Price az, akinek felvetései és munkái önmagukban érdekesebbek.

A hatvanas években elsőként fogalmazza meg azt a tézist, hogy a tudományos szerzők 25%-s felelős a megjelent cikkek 75%-áért, majd néhány évvel később felismeri azt is, hogy ez a citációkra (idézésekre) is igaz, továbbá, hogy a közlemények idézési hálózatának mind a bemenő (idézés oldali) mind pedig a kimenő (idézet oldali) fokszámeloszlása hatványfüggvény-jellegű. Sőt, ezen túlmenően modellt alkot az eloszlás keletkezésére is – mely azon a feltevésen alapul, hogy a nagy még nagyobb lesz, azaz hogy a publikációk a korábbi sikerességük arányában, hólabdaszerűen „vonzzák magukhoz” a további idézéseket. (Az „akinek van, annak adatik” bibliai idézet forrása, a Máté evangélium miatt ezt sokszor „Máté-effektus” néven is emlegetik.)

De Solla Price mindemellett jeles tudománytörténész is volt, aki az Antikythera mechanizmusnak, egy nevezetes ókori rejtvénynek a vizsgálatával és a fennmaradt töredék alapján történő rekonstrukciójával foglalkozott, ő volt az egyik, aki elsőként megállapította róla, hogy valószínűleg asztronómiai pozíciók kiszámítására alkalmas analóg komputer.

Egy eloszlás akkor hatványfüggvény-jellegű, ha az elemei egy hatványsort adnak, például ha a második elem az elsőnek a fele, a harmadik a harmada, és így tovább, vagy ha a második az elsőnek fele, a harmadik pedig a negyede etc. – látható, hogy ilyenkor az 1/x illetve 1/x2 eloszlásokról van szó. A tudományos publikációk egy hosszú lajstromba illeszkednek, ahol mindenütt a hatványfüggvény eloszlás a jellemző: a jövedelmek eloszlásánál (Pareto-eloszlás, és hozzá kapcsolódóan a „80-20 szabály”: a jövedelmek 80%-at a népesség 20%-a birtokolja), a nyelv szavainak gyakoriság-eloszlásánál (Zipf-eloszlás), vagy akár – egy frissebb példát mondva – az Amazon.com által eladott könyvek számát tekintve. Az ilyen eloszlás azt is jelenti, és erre a tényre valamennyi érintett területen érdemes felhívni a figyelmet, hogy egy „hosszú farok” jelenik meg, az eloszlás lapos, messze elnyúló vége, ahol – ha rangsorrend eloszlást készítünk – azok a könyvek vannak, amiket egyetlen példányban adtak el, azok a szavak, amik csak egyszer szerepelnek egy korpuszban, azok az emberek, akiknek minimális a jövedelme, vagy azok a szerzők, akiknek csupán egyetlen publikációja van (amire viszont jellemzően nulla citáció érkezik). Az eloszlás jellegéből következik, hogy az ehhez hasonló elemek vannak többségben. Ennek köszönhető az ilyen eloszlások egyik, a gyakorlat szempontjából igen fontos tulajdonsága: az átlag nem jellemzi jól a sokaságot. A számtani közép távolról sem a leggyakoribb értékre mutat és az átlaggal megegyező értékeknek semmilyen kiemelkedő jelentősége nincsen.

De Solla Price abban is úttörő volt, hogy a tudomány intézményes oldalának (a „Big Science”-nek) a vizsgálatát összekötötte tudománymetriai és szociológiai értelemben vizsgálható egyéb tényezőkkel, dokumentálta a társadalmi befolyásolás köreit. Az erős kezdetek után azonban a tudománymetria évtizedeken keresztül mégis csupán a könyvtártudomány „megtűrt” al-területeként tengődött, noha – önigazolási céllal –a különféle akadémiák és más intézmények ezalatt is előszeretettel készíttettek magukról mindenféle előnyös „statisztikát”.

Paradox helyzet, de a tudománymetria – nyugodtan mondhatjuk – újrafelfedezése a fizikából indult, és az eredetét tekintve egy nem éppen tudományfilozófiai vagy szociológiai területnek, a komplex hálózatok elmélete előretörésének köszönhetően (Barabási és Albert 1999, Albert és Barabási 2002). Ez az időközben kialakult és megerősödött magyar tudománymetriai iskolát (Braun, Schubert, Glänzel) is magával sodorta és a szűkebb szakmán túl is bekapcsolta a masszív idézésekkel és kiemelt láthatósággal, általános ismertséggel járó nemzetközi publikációs környezetbe (Barabási et al. 2002 – a cikk közel 1500 idézéssel rendelkezik). A publikációs hálózatok (közte kulcsszavak, szerzők, idézések, együttes előfordulások hálózatai) immár nem egy-egy kiragadott személy vagy intézményi vonás, hanem egész területek, intézményhálózatok, struktúrák elemzésére alkalmasak, valódi masszív, „átvilágító” jellegű elemzést tesznek lehetővé. Párhuzamosan fejlődött ezzel a vizualizáció is (ld. Börner 2010), ami lehetővé tette a korábban elképzelhetetlen komplexitású adathalmazok együttes megjelenítését, intuitív, közvetlen megragadását. Mindezek hatására a tudománymetria egy csapásra vonzó területté vált, vezető publikációi ma a legnagyobb tudományos folyóiratok és magazinok (Nature, PNAS) oldalaira kerülnek, elfoglalják a helyüket a komplex hálózatok kutatásának egyéb területei – a biológia, a társas hálózatok, a mobiltelefon hívások elemzései között, a „planetary nervous system”, a bolygó idegrendszerének elismert, fontos részeként. Fontos ezért, hogy megismerkedjünk a témával.

4.2.2 Tudománymetria, bibliometria – a tudomány szociológiai valósága és értékelése

Ha a kutatói társadalomban végzett közvélemény kutatás keretében most arra kérnénk a megkérdezetteket, hogy definiálják a tudománymetria fogalmát, a sor elején valószínűleg olyan válaszok állnának, amelyek szerint az a kutatói teljesítményértékelés (főként adminisztratív) eszköze, célja a tudomány szereplőinek minőségellenőrzése, megrendelője (haszonélvezője) pedig a tudomány szakpolitikusa. Ha ugyanakkor elővesszük a Scientometrics nevű, sok évtizedre visszatekintő nemzetközi – egyébként a terület magyar szaktekintélyei által indított és szerkesztett – szaklapot, annak borítóján a következő meghatározással szembesülhetünk: „a tudományos [scholarly] kommunikáció kvantitatív vizsgálata”. A két, ránézésre igen eltérő megközelítés szembenállásának természetes magyarázata volna, hogy a szakfolyóirat a kutatási területet, az „elméletet” képviseli, míg az érintett közvélemény annak alkalmazását, a gyakorlatot illeti az elnevezéssel. Az ugyanakkor, hogy miként lesz/lehet a kommunikáció vizsgálatából minőségellenőrzés, és hogy a tudománymetria elmélete és gyakorlata valóban ezzel jellemezhető-e, korántsem nyilvánvaló. Az alábbiak ehhez is szempontokat kívánnak adni.

4.2.2.1 Indikátorok, mutatók, listák és rangsorok: értékelő bibliometria

Amennyiben a tudománymetria alapfeladata a tudomány szerveződésének, működésének kvantitatív vizsgálata, akkor a tudományos tevékenység mérhető, számszerűsíthető indikátoraira van szükség. Lévén a kutatás eredményei – és meglepően sok további jellemzője – legáltalánosabb esetben a szakmai közleményekben, publikációkban, vagyis a tudomány formális kommunikációjában érhetők tetten, a kívánt indikátorok elsősorban ezekre alapozhatók. A tudománymetria ezért klasszikusan és mindenekelőtt bibliometria, ennek kulcsai a publikációs és idézési adatok.

A tudományon belül zajló formális kommunikációt lényegében világméretű léptékben láthatóvá, így elemezhetővé és mérhetővé azok az adatbázisok tették, amelyek a nemzetközi tudomány kibocsátásának, metaadatainak rendszerezésére jöttek létre. (A metaadat olyan adatelem, általában a tárgyadatnak egy része, amely a tárgyadat egyértelmű azonosítására, vonásainak megállapítására szolgál. A publikációk tipikus metaadatai a szerzői adatok, a cím, a megjelenés helyes és ideje, a kulcsszavak, hivatkozások, esetleg a közlemény kivonata, kombinálva mindez az olyan utólagos metaadatokkal, amelyeket az adatbázis kezelője fűzhet hozzá: például a közlemény által érintett tudományterületek és tárgykategóriák felsorolása.) Az ilyen metaadatok meglepően gazdag forrásanyagot szolgáltatnak a tudomány szerkezeti jellemzőinek, trendjeinek és dinamikájának vizsgálatára, amennyiben is kódolják a tudományos közlemények közötti – hivatkozási, szerzőségi, tematikus stb. – kapcsolatokat is. Ezért az ilyen nagyléptékű, multidiszciplináris adatbázisok, valamint a belőlük származó ún. citációs indexek szolgáltatnak nyersanyagot a tudománytérképezés számára.

A terület alkalmazása iránti, évtizedek óta fokozódó igényt jól jellemzi, hogy mára igen népessé és aktívvá vált a tudomány metaadatainak nemzetközi piaca, meghatározó szolgáltatókkal: a ’50-es években Philadelphiában létrejött ISI (Institute for Scientific Information) leszármazottjaként közismert Web of Science-adatbázisok (Reuters Thomson) vagy a szintén egy nagy kiadóvállalat (Elsevier) működtette Scopus nemzetközi, sok tízezer szakfolyóiratot indexelő ún. citációs adatbázisai a mai tudománymetria sztenderd adatforrásai. Ezek a nagyléptékű források a nemzetközi tudományt igyekeznek reprezentálni (historikusan is, a hetvenes évek óta), ezért nemcsak adatot, hanem egyfajta referenciahalmazt is szolgáltatnak a tudomány szereplőinek, az országok, intézmények, szakfolyóiratok és – bizonyos feltételek mellett – az egyéni kutatók összehasonlító vizsgálatához, legalábbis ami a nemzetközileg látható tudományos tevékenységet illeti.

A szakterületek egy releváns része ugyanakkor, természeténél fogva, kevésbé nemzetközi (jellemzően a humán és társadalomtudományok bizonyos szegmenseit szokás ide sorolni): többek között ezért is folyamatos törekvés a megbízható, országos gyűjtőkörű adatbázisok fejlesztése is, ilyen Magyarországon a Magyar Tudományos Művek Tára (MTMT). Ezekben a nemzeti nyelvű (és a nagy nemzetközi adatbázisokban csak szelektíven reprezentált) folyóiratok és a humán tudományokban igen jelentős könyv, ill. könyvfejezet alapú publikációk is helyet kapnak. Ezeknek a publikációknak a felkutatása, menedzselése, hivatkozásaik követése ma külön, önálló terület.

A publikációs tevékenység egyik nyilvánvaló kvantitatív vizsgálati módja a méretbeli kérdésekre vonatkozik. A klasszikus tudománymetria egyik alapkérdése a tudományos szakirodalom méretbeli alakulásának szabályszerűségeit veszi célba (pl. időbeli növekedésének matematikai modellezése, eloszlásának vizsgálata, következményei). A szakterületet elsősorban ezen a ponton állítja szolgálatába a tudománypolitika és kutatásértékelés: a tudomány teljesítményértékelésének jól értelmezhető, egyszerű és az adatforrásokból – elvileg – biztonságosan előállítható mutatója a kibocsátás, a szakmai közlemények száma. (Az „elvileg” közbevetés fontos figyelmeztetés: a nagy nemzetközi adatbázisok alapján történő adatgyűjtés és azok szakszerű feldolgozása önmagában is számos buktatóval terhelt és szakértelmet igényel, a „házilag készített gyorsstatisztikák” meglepően félrevezetőek lehetnek.)

A kibocsátás a legkülönfélébb aggregációkban vizsgálható (egyének, intézmények, országok, folyóiratok, stb.) A mennyiség mellett az értékelés számára alapvető másik szempont a minőség kérdése. A tudománymetria erre vonatkozóan több specifikus indikátort szolgáltat, amely a tudomány működésmódjából adódik: a publikációk minőségét elsősorban a tudományra gyakorolt hatásukból vezeti le. A hatás mérésére pedig az idézést (citációt) mint mérhető, számszerűsíthető kapcsolatot alkalmazza, s ebből alkot további mérőszámokat.

A bibliometriának a kutatásértékelés hátterében álló részterülete (az ún. értékelő, evaluatív tudománymetria) ennek megfelelően a produktivitás [performance] és hatás [impact] dimenziójában vizsgálódik. A tudományos közvélemény legtöbbször ennek adminisztratív vetületével találkozik, amely a publikációs és idézési listák alapján való megítélés, rangsorolás, stb. terhét hordozza. A tudománymetriai kutatás és (ideális esetben) az alkalmazás azonban nem e leíró statisztikákban végződik, hanem ott kezdődik. Ahhoz ugyanis, hogy valós képet kapjunk egy-egy szereplő (pl. intézmény) teljesítményéről, hatásáról és hatékonyságáról, figyelembe kell venni mind az indikátorok viselkedését, amely a tudomány erre irányuló modellezésével ismerhető meg leghatékonyabban, mind pedig a vizsgált szereplők kontextusát.

Ma már köztudomású például, hogy az egyes tudomány-, sőt szakterületek mérete, kibocsátási és idézési rátája egészen különböző. Például a biológia és az orvostudomány területén a közösség szokásrendszere szerint „egy kísérlet – egy cikk”, és részben ennek megfelelően, cikkenként sok hivatkozás elvárt a megelőző eredményekre. Ezzel szemben például az ökológia már jóval kevésbé hivatkozás intenzív, a távolabbi matematika területén pedig igen keveset szokás hivatkozni. A különböző területekről származó szereplők nyers statisztikáinak egymással való közvetlen összehasonlítása már csak ezért sem kielégítő méréstechnika.

További példaként hozható egy másik alapmegfigyelés is az indikátorok természetére vonatkozóan: az idézések – mint hatásmutatók – sajátos, időbeli viselkedést mutatnak. Értelemszerűen a citációk mindig a publikáció megjelenését követik és időben halmozódnak. A fiatalabb közleményeknek ezért jellemzően kevesebb az idézése, ez viszont eleinte nem azok minőségével, hanem az idézésre rendelkezésre álló idővel van összefüggésben. Ezért kulcsfontosságú lehet a publikációs és idézési ablakok – egymással összefüggő – megválasztása. A citációk számlálásakor, ha összehasonlítás a cél, az azonos korú, praktikusan (1) azonos évben közzétett publikációkat vagy (2) a különböző évben született közlemények esetében az azonos időtávot (ún. rögzített idézési ablakot) célszerű alapul venni. Az elv mindkét esetben ugyanaz: mivel az idézetszám nyilvánvalóan függvénye a publikáció kibocsátása óta eltelt időnek (mert hosszabb idő alatt több citáció begyűjtésére van lehetőség és fordítva), ezért a minőség mérésében ezt a tényezőt is kontrollálni szükséges. Ezért a közleményeket azonos idő alatt kifejtett hatásuk szerint kell összemérni.

Az egyszerű összesítés ugyanakkor elfedi a publikációk és idézések időbeli eloszlását, azaz nem tükrözi például azt, hogy az adott citációszám mekkora része jut az időszak elején közölt, ill. a frissebb közleményekre. Emiatt azonos összesített impakt-mutató (pl. átlagos idézetszám) mellett is előfordulhat (legalábbis hipotetikusan), hogy akár azonos összes publikáció- és idézettömeg mellett is, két kibocsátónak a megegyező korú, szakterületileg is hasonló publikációi mégis eltérő idézettségűek (hatásúak) legyenek. Ez a jelenség ismét aláhúzza azt, hogy az összesített hatásmutatókat tartalmazó vizsgálatok csak a szerkezeti elemzéssel együtt értelmezhetők biztonsággal.

Az összesítések egy további torzító tényezője még rögzített citációs ablak mellett is kifejti hatását, ami pedig ismét a szakterületek eltéréseire vezethető vissza. Az egyes szakterületek változatos kommunikációs viselkedése ugyanis abban is megnyilvánul, hogy különböző, sokszor belsőleg jellemző ütemben halmozzák fel az idézeteket, érik el maximális idézettségüket. Ideális esetben ezért szakterületenként különböző, az adott területre jellemző hivatkozási ablak volna javasolható, bár sajnos az ilyen vizsgálatokhoz többnyire nem állnak rendelkezésre a megfelelő adatok. A szempont gyakorlati jelentősége mégis abban áll, hogy rámutat a profil-alapú összehasonlítások jelentőségére: a hasonló szakterületi szerkezetben, profilban publikáló kibocsátók (személyek vagy intézmények) összemérése során kevésbé áll fenn annak a veszélye, hogy egyikük amiatt mutatkozik idézettebbnek, mert a „gyorsabb” tudományok szerepelnek repertoárjában, és ezért azonos idő alatt több citációt halmozott fel.

A fenti két, viszonylag egyszerű példából is látható, hogy megfelelő produktivitás- és hatásmutatók előállításához, ill. a mindenkori kérdéshez illeszkedő használatukhoz számos tudományszociológiai és statisztikai tényezőt kell kezelni, a torzításokat korrigálni kell. Az evaluatív tudománymetria lényegében ezek információtudományi modellezésével és az indikátorok kialakításával foglalkozik.

4.2.2.1.1 A legismertebb indikátorok

Népszerűségük okán érdemes két ilyen indikátort, a folyóiratok minőségét mérő Impakt Faktort, illetve az (eredetileg) egyéni kutatói eredményességet jellemző ún. Hirsch-indexet megemlíteni.

Az Impakt Faktor egy alapvető korrekciós technika, a normalizálás eredménye, és (legismertebb változatában) egy-egy folyóirat átlagos idézettségét tükrözi évenként, vagyis az egy (megelőző két évben megjelent) cikkre jutó citációk mennyiségét. A mutató jelentésének, viselkedésének vizsgálata, elemzése, kritikái mára vastag könyveket töltenek meg (lásd. Braun 2007), minthogy alakulását számos statisztikai–módszertani (pl. a „ferde eloszlások átlagainak problematikája és mítoszai” – vö. Glänzel 2009 –, vagy a hivatkozási időablak megválasztása, a folyóiratok mérete stb.), technikai (előállítása a megfelelő citációs indexekből) és tudományszociológiai tényező befolyásolja. Az utóbbiak alapján szokás az impakt faktort némi malíciával a népszerűség mutatószámának is nevezni, minthogy nem tesz különbséget az idézések között azok forrása, pl. szakterülete szerint („anything goes”). Mára ezért számos finomítása és alternatívája van forgalomban, amelyek pl. algoritmikusan differenciálnak a különböző helyről érkező hivatkozások között, így a puszta népszerűség helyett a szűkebb szakmai presztízs kimutatására is alkalmasak lehetnek (pl. Scimago Journal Rank, SJR vagy az Eigenfactor nevű index), vagy éppen „automatikusan” figyelembe veszik a szakterületi eltéréseket (pl. Source Normalized Impact, SNIP).

A másik, nagy népszerűségnek örvendő mutató – az ötletgazdájáról elnevezett – Hirsch-index. A javaslat eredetileg az egyén jellemzésére irányult, de bármilyen, idézett publikációkkal rendelkező szereplőre vonatkoztatható (intézmény, ország, szakterület stb.). Szellemessége főként abban áll, hogy kiegyensúlyozottan igyekszik figyelembe venni mindkét oldalt, a produkciót és hatást is: ha egy kutatónak 30 a Hirsch-indexe, az annyit tesz, hogy harminc olyan közleménye van összesen, amelyek egyenként legalább harmincszor voltak idézve; a többi közleménye, akármennyi is van belőlük, ennél kevesebbszer. Ha tehát valaki csak egyetlen, de nagyon sikeres cikket ír, sok száz idézéssel, akkor a H-indexe 1 marad (így a „one-hit wonder” típusú extrém esetek nem kapnak magasabb helyezést). Hogy ez mennyire méltányos, arról persze szintén megoszlanak a vélemények: a H-index pl. nem veszi figyelembe, hogy az a bizonyos 30 cikk hány ezen felüli citációt kapott (extrém példa: két kutató H-indexe harminc, de az egyikük több száz további, a másik ténylegesen harminc hivatkozást kapott ezen cikkek többségére). Ennek ellensúlyozására való az E-index (ami éppen ezt a különbséget méri), illetve számos további változat és finomítás, amely a torzítások korrekciójára törekszik. Például az eredeti definíciót követve a H-index egy kutató élete során csak növekedhet, így részben az életkort méri – ennek ellensúlyozására szolgálnak az 5 vagy 10 éves időablakkal működő variánsok, és így tovább.

Kicsit pontosabban kifejezve, egy entitás (személy, csoport vagy intézmény) H indexe h, ha h darab olyan publikációja van, hogy mindegyikre külön-külön legalább h alkalommal hivatkoztak. Ez a h érték szemléletes geometriai értelmezésben egyébként a publikációk idézési rangeloszlásának és egy 45 fokos egyenesnek a metszéspontja. Ahogy említettük, ugyanakkor a H index nem veszi figyelembe azt, ha a szóban forgó h publikáció – az ún. „h mag” – egy-egy elemére h-nál több hivatkozás érkezik (más szóval, ha a h-magra több, mint h2). Ezért a H index mellett gyakran egy másik mennyiséget, a G indexet is szokás tekinteni: Egy entitás (személy, csoport vagy intézmény) G indexe g, ha g darab olyan publikációja van, hogy rájuk együttesen g2 alkalommal hivatkoztak. A G index értéke általában nagyobb a H indexnél – ez ugyancsak a geometriai értelmezésben válik azonnal világossá. Ugyanakkor, mivel másféle információt hordoz, egy önálló, független indexnek tekinthető. Az E index egy további megoldást nyújt a H indexben figyelembe nem vett „többlet hivatkozások” kezelésére: e2 értéke a h-magban szereplő publikációk h érték fölötti hivatkozásainak összege.

A kép a H,G, E indexeket egy rangsor-eloszlásra illesztve mutatja.

A H, G és E indexek geometriai értelmezésben

Konkrét esetekben a fentiek miatt célszerű a különböző indexek, (az itt említett és nem említett, a szakterület által elismert) mutatók kombinált, együttes alkalmazása. Ezzel el is érkeztünk az értékelő bibliometria ma talán legfontosabb, korszerű elvéhez: a sokdimenziósság kritériumához.

Sok évtizedes általános tapasztalat, hogy „varázsmérték” mítosz, és nem létezik egyetlen „tökéletes” mutató sem, nincs „univerzális megoldás”. Az értékelő modellt, a mutatók kiválasztását ezért minden esetben a kérdésfeltevéshez kell igazítani. A sokdimenziós megközelítés különösen hangsúlyos az egyre divatosabb tudománymetriai rangsorok (pl. tudománymetriai szempontú intézményi rangsorok) szempontjából. A rangsorolásra használt mutatók viselkedése még külön-külön, egyenként is vizsgálat tárgyát képezi, például annak a megítélésekor, hogy két helyezés közti mennyiségi különbség valóban mérvadó (azaz szignifikáns)-e? Az pedig, hogy miként lehet egy sokváltozós mutató-készlet alapján, végső soron mégis egydimenziós sorrendet képezni, az információtudomány eszköztárának széleskörű mozgósítását igényli.

4.2.3. Hálózatok, mintázatok és dinamika: strukturális tudománymetria

Amint az eddigiekből kiviláglik, az értékelő tudománymetria nem nélkülözheti a tudomány tényleges szerveződésének, működésének vizsgálatát. Ahhoz például, hogy figyelembe vehessük a szakterületek hatását az értékelésben, szükség van a szakterületek kvázi-objektív, adatalapú azonosíthatóságára és elhatárolására vagy éppen összefüggéseik meghatározására: meg kell tudni mondani, mi az a szakcikk-halmaz (referenciahalmaz), amelynek jellemzőihez képest egy cikket, szerzőt vagy intézményi portfóliót értékelhetünk. A tudomány empirikus vizsgálata természetesen nem csak az értékeléshez szolgáltat alapot: a tudományos trendek elemzése (tudománydinamika), a kutatási frontvonalak (azaz a kialakulóban lévő, élen járó irányok) meghatározása, a kutatási együttműködések hatásának feltérképezése, hogy csak néhányat említsünk, mind alapvető bemenetei az informált tudománypolitikának és stratégiának. Ezek az – értékelést is részben megalapozó és azzal szoros összefüggésben lévő – szakterületi irányok együttesen a strukturális tudománymetria összefoglaló néven tárgyalhatók.

A strukturális tudománymetria mind célkitűzéseit, mind pedig módszertani eszközeit illetően igen változatos terület. Példaként két intenzíven fejlődő részterületét említjük meg: az informált kutatásértékelést támogató ún. tudománytérképezést, valamint a tudománypolitikában alapvető tudományos együttműködések, hálózatok elemzését. A tudománytérképezés egyik fő célkitűzése a dinamikusan változó nemzetközi tudomány mindenkori szak- és tudományterület-rendszerének felmérése, azonosítása. Erről részletesebben is lesz szó.

A hálózatelemzés több vonatkozásban is meghatározó elméleti kerete a korszerű tudománymetriának. (Láttuk, hogy a tudománymetria újjászületésében is szerepet játszott.) A modern tudománymetria elsődleges érdeklődése valójában éppen a publikációk kapcsolatrendszerének elemzése, az abból levonható következtetések feltárása lett, ezt pedig a hálózatok ragadják meg a legjobban. A legújabb hatásmérő indikátorok, például az Impakt Faktor fent említett vetélytársai (vagy sokkal inkább: kiegészítői) a folyóiratok teljes hivatkozási hálózatának szerkezetét elemzik a hatás kvantifikálásához, annak érdekében, hogy képesek legyenek súlyozni az idézőket a hálózat többi részéhez való (közvetett és közvetlen) kapcsolódásuk szerint.

A tudománymetriai hálózatelemzés legtermészetesebb módon a kutatási együttműködések vizsgálatában jelenik meg. Ezen a ponton a társadalmi kapcsolathálók tudománya [social network analysis, SNA] fed át a bibliometriával. A szakcikkek és egyéb publikációk a legtöbb tudományterületen és legtöbb esetben sokszerzős művek, vagyis együttműködésben készülnek. A publikációs adatbázisok alapján a kutatóközösségben szerveződő együttműködési hálók (társszerzői hálózatok) könnyen rekonstruálhatók, és elemezhetővé válnak olyan kérdések, mint hogy mekkora kiterjedésű, milyen szerkezetű együttműködések jellemzik a területet, kik annak meghatározó, „központi”, vagy éppen mediátor szerepű résztvevői. Ehhez jól használhatóak a hálózatelmélet klasszikus „centralitás” fogalmai és ennek továbbfejlesztései. Ezek segítségével könnyen és hatékonyan vehetőek figyelembe olyan természetes szempontok, mint például az idéző művek és/vagy szerzők rangja (pl. saját idézettségük mértéke).

A tudománypolitika számára releváns kérdésfeltevés például, hogy a hálózati szerepek hogyan befolyásolják a produktivitást – ezen a ponton közgazdaságtudományi (ökonometriai) modelleknek adva teret, amelyek pl. a hálózati szerepek és a kibocsátás mérete között igyekeznek statisztikai összefüggést teremteni.

4.2.3.1 Tudománytérképezés

A tudománytérképezés (science mapping) a tudomány modellezésének talán legrohamosabban fejlődő területe, amely az információtudomány eszköztárát használja fel. A tudománytérképezésnek számos megközelítése és alkalmazott módszere jött létre a 60-as, 70-es évektől kezdődően, amelynek az adathozzáférés és -feldolgozás nagyságrendi változásai adtak igazi lendületet az utóbbi két évtizedben (egy látványos összefoglaló Börner 2010). Mára – a hálózati módszerekkel kombinálva – rendkívül népszerűvé, a laikus ábrázolásokban is megjelenővé vált.

Az alábbiakban röviden áttekintjük e megközelítések taxonómiáját a következő szempontok szerint:

A modellalkotás célja: Globális tudástérkép vagy egy szegmens modellezése (emergens területek, kutatói közösségek).

Idődimenzió: Az idő dimenziójának kezelésmódját illetően e háromféle megközelítést célszerű megkülönböztetni:

  1. A keresztmetszeti elemzés egyetlen időablakban vizsgálja a tárgyát, ami jellemzően elég szűk ahhoz, hogy egyfajta pillanatképet adjon a tudomány szerveződéséről;

  2. A longitudinális elemzés hosszabb időtávot képviselő bibliográfiai adathalmazt vizsgál, ugyanakkor a keresztmetszeti változathoz hasonlóan egyetlen összefüggő, bár jóval szélesebb időablakot rögzít;

  3. A dinamikus elemzés több, egymást követő időablakra bontja fel a vizsgált időszakot, és külön vizsgálja az egyes időszeleteket annak érdekében, hogy az időbeli változást az egyes időmetszetek között nyomon követhetővé tegye.

A fenti jellemzésből látható, hogy a keresztmetszeti és a longitudinális elemzés jelenlegi felfogása között mindössze fokozati különbség van, ami inkább gyakorlati, mint elvi megkülönböztetésként fogható fel. A minőségi distinkciót itt az újabb, dinamikus elemzés fogalma jelenti.

Indikátorok, megfigyelt változók. A tudománytérképezési gyakorlatok alapvető kézjegye, hogy mely indikátor(ok) felhasználásával modellezik a tudományszerveződést. “Indikátor” alatt ebben az esetben a már megbeszélt bibliometriai metaadatok valamely típusát értjük tág értelemben, vagyis a szerzők, cím, lelőhely, stb. adatbázis-változókon túl (amelyek a közlemények sztenderd bibliográfiai jellemzői) ide soroljuk például a szerzői vagy hozzárendelt (“indexer-based”) kulcsszavak körét, ill. az egyéb témaleíró–témajelölő változókat, valamint a közlemények besorolásait, különböző, főként szakterületi kategóriarendszerek mentén. (Megjegyzendő, hogy a tudománymetriában – így a korábbi oldalakon is – az indikátor kifejezés elsősorban mérőszámokra, nem pedig, mint ezen a helyen, a megfigyelési változókra vonatkozik.)

Módszerek. A tudománytérképezés gyakorlatában jól azonosítható az alapmódszerek egy csoportja, amelyek az elemzési cél függvényében változatos módon, illetve egymással kombinálva épülnek be az egyes megközelítésekbe. Az alapmódszerek megkülönböztető ismérve az, hogy a dokumentumok közötti kapcsolatok melyik dimenzióját tekintik meghatározónak a tudományszerveződés feltárásakor. Ennek alapján beszélhetünk (1) hivatkozási– valamint idézési, (2) szerzőségi, illetve (3) fogalmi kapcsolatokra épülő alapmódszer-családról. Noha a szerzőségi, illetve a fogalmi kapcsolatok vizsgálata a megfelelő indikátorok (metaadat-típusok) felhasználásával zajlik – az előző esetben a közlemény szerzői, az utóbbinál pedig a közlemény témájára vonatkozó deskriptorok, pl. kulcsszavak révén –, mégsem célszerű a módszereket az alkalmazott indikátorok mentén megkülönböztetni. A szerzőket véve példaként könnyen belátható ugyanis, hogy a közlemények (forrásközlemények) egy halmaza, illetve azok hivatkozásai egyaránt elemezhetők a szerzőik szerint, míg azonban az első megközelítés a forrásközlemények szerzőalapú kapcsolatrendszerét tárja fel, a másik a hivatkozási kapcsolataikat célozza (vö. a további szakaszokkal).

4.2.3.1.1. Tudománytérképezési alapmodellek

A tudomány szerkezetére, lokális vagy globális szerveződésére, a tudományterületek kapcsolatrendszerére vonatkozó empirikus vizsgálatok leginkább elterjedt módszertana a közlemények hivatkozásaiból indul ki. Központi szerepe miatt az alapmodelleket részletező alfejezetben az idézési–hivatkozási struktúrákat hasznosító módszereket tárgyaljuk részletesen. A módszertan központi előfeltevése, hogy a hivatkozások együttesen a közlemény intellektuális előzményeit, hátterét, “tudásbázisát” képviselik. Ilyen módon egy olyan közleménycsoport (korpusz) aggregált hivatkozásainak elemzését kapjuk, amely egy szakterületet testesít meg, és alkalmas a terület kognitív szerkezetének, belső és külső (más területekkel létrejött) kapcsolatrendszerének feltárására. A vizsgálat egysége lehet

  • az idézett közlemény (D),

  • az idézett szerző(k) (A), illetve

  • az idézett források, jellemzően a közlő folyóirat (S),

ezek mindegyike más-más aspektusát ragadja meg a tudományszerveződésnek. A D–S indikátorokat hasznosító módszerek két nagy kategóriában oszlanak meg:

A “kapcsolódó közlemények módszere” (bibliometric coupling, BC). A módszer a közlemények kognitív–tematikus hasonlóságának, ill. távolságának megállapítását célozza, amelynek alapvető mértékét a közös hivatkozások számában jelöli meg. A vizsgálati egység egyaránt lehet teljes közlemény, szerző (a közösen hivatkozott szerzők száma) vagy a lelőhely (pl. a közösen hivatkozott folyóiratok száma). A gyakorlatban először választunk egy, a közös referenciák számára épülő hasonlósági mérőszámot. Ezt követően ennek alapján (egy alkalmas klaszterezési eljárással) meghatározzuk a forrásdokumentumok összetartozó csoportjait (klasztereit). Ezáltal feltérképezzük a dokumentumok referencia-alapú szerveződését.

Az együttidézés módszere (co-citation analysis, CC). Az előző módszer komplementere. A forrásdokumentumok közti kapcsolat erősségének mércéje itt az együttes idézés gyakorisága. Ez a módszer tehát a forrásközlemények hivatkozáslistája helyett annak a korpusznak a hivatkozáslistájából indul ki, amely a forrásközleményeket idézi (“citing side”). Az idéző közlemények referenciái közti együttes előfordulás – mint indikátor – ezúttal is számos hasonlósági mérőszámnak szolgáltat alapot, az elemzés menete a BC-hez hasonlóan egy hasonlósági/távolsági mátrix kalkulációját, valamint egy erre alapuló klaszterezést foglal magában.

A fenti két alaptechnika egymás ellentétének tekinthető: a BC a vizsgált közleményeket hivatkozásaik szerint, a CC pedig idézéseik szerint csoportosítja. Az alábbiakban a tudományszerveződés vizsgálatának jellegzetes példáit tekintjük át, amely ezt a módszercsaládot hasznosítja.

A kutatási területek kognitív–intellektuális szerkezete. A hivatkozási struktúrákat hasznosító módszerek klasszikus változata a szerzők együttidézésének vizsgálata (author co-citation analysis, ACA). Az ACA olyan exploratív, ill. vizualizációs technika, amelynek célja a kutatási területek kognitív szerkezetének feltárása. A fent bevezetett taxonómia szerint a módszer indikátora, ill. vizsgálati egysége a szerző (A), eljárása pedig a (CC): az adott területen aktív szerzőket klaszterezi az együttidézés mértéke alapján. Tehát a gráf csúcsait a tudományterületen aktív szerzők alkotják. A közöttük lévő élek léte, illetve erőssége attól függ, hogy az adott szerzőket hányszor idézték (mások) egyazon cikkben. A módszer eredményeképp előálló szerzői klaszterek úgy értelmezhetők, mint olyan kutatóközösségek, amelyek egy adott kutatási témát reprezentálnak – a klaszterszerkezet ilyen módon a terület tematikus szerkezetét tükrözi.

ACA: http://www.implementationscience.com/content/figures/1748-5908-3-49-2.jpg

A kép tudáselemek hálózatának klasztereit ábrázolja.

A kutatási területek kognitív–intellektuális szerkezete.

A tudomány diszciplináris szerveződése. A közlemények forrását (lelőhelyét) hasznosító együttidézési vizsgálatok különböző változataival találkozhatunk azokban a megközelítésekben, amelyek a tudomány nagyléptékű szerveződését igyekeznek feltérképezni, ún. globális tudománytérképek szerkesztése révén. Taxonómiánkban – az indikátort és a módszert tekintve – ez a csoport tehát lelőhely-alapú együttidézési elemzésként jellemezhető (source co-citation analysis, SCA). Ez az utóbbi években felélénkült modellezési irány, a globális tudománytérképezés, a módszer változatos variánsait sorakoztatja fel: Moya-Anegon és tsai. (2004) vizsgálatai a Web of Science adatbázisaiban alkalmazott tárgykategóriákat (Subject Category, SC) veszik alapul. A tárgykategóriák (pl. orvosi tudományok, fizika, stb.) az adatbázisban indexelt folyóiratok csoportjai (azok szakterületi kategorizációjára használatosak), ezért lelőhely-indikátorokként foghatók fel. Az említett szerzők az adatbázis-közlemények idézéseit tárgykategóriánként aggregálták, majd a tárgykategóriák együttes idézésének mértékét (a Web of Science egészét véve mintaként) kalkulálva megállapították azok kapcsolatának erősségét, kognitív távolságát. Az együttidézés vizsgálata ugyancsak a tárgykategóriák (mint vizsgálati egységek) szintjén zajlott. A gyakorlat végeredménye egy ún. hasonlósági hálózat, amelynek csúcspontjai a tárgykategóriák, (súlyozott) élei pedig a köztük fennálló kapcsolatokat (és azok erősségét) kódolják. A hálózat – lévén a legkiterjedtebb multidiszciplináris, nemzetközi citációs index egészét tükrözi – a tudomány mindenkori globális szerveződésének modelljeként értelmezhető.

A fenti módszer tehát a jelen taxonómia szerint az (S) és a (CC) kombinációja. Valamelyest eltérő módszert alkalmaz Leydesdorff és Rafols (2009), ahol ugyanezen tárgykategóriák (SC-k) kapcsolata nem idézéseik, hanem – aggregált – hivatkozásaik alapján került mérlegre. Közelebbről, a kapcsolat mértékét két tárgykategória között ezúttal annak a mértéke jelzi, hogy mennyire hasonlít egymáshoz a többi kategóriára vonatkozó hivatkozásaik struktúrája, vagyis mennyiben hivatkozzák közösen a többi SC-t. Ebből következőleg, míg a Moya-Anegon és tsai. eljárása az együttidézési vizsgálatok osztályába utalható (CC), addig a Leydesdorff–Rafols-féle eljárás a hasonló közlemények módszerét (BC) példázza, vagyis az (S) és a (BC) kombinációja.

A kép egy tárgykategória-hálót ábrázol, az azonos nagyobb területeket azonos színek jelölik.

Együttidézési SC-térkép (www. Scimago.com)

A kép a tudományok „csontvázát“ ábrázolja Leydesdorff nyomán.

BC-alapú SC-térkép, (http://www.leydesdorff.net/overlaytoolkit/overlaytoolkit.htm)

A szakterületi paradigmák globális térképe. A tudomány finomszerkezetének, részletes, nagyfelbontású struktúrájának ez idáig talán legsikeresebb feltárási kísérlete az ún. “paradigmatérképezési módszerben” jelölhető meg (Boyack et al. 2005, Boyack 2009). A paradigma ebben a kontextusban a legszűkebb koherens kutatási iránynak vagy témának feleltethető meg – így viszonylag laza rokonságot mutat a Kuhn-i paradigmafogalommal (vagy annak valamely változatával). Az eljárás célja, hogy a tudomány egészét ezen a leírási szinten ábrázolja. A legfőbb érv a felbontás növelése mellett, hogy a tudományszerveződés valódi mintázatait, a tudásterületek folyamatos interakciójából kibontakozó emergens területeket a – folyóiratokat és nem pl. közleményeket besoroló – szakterületi kategóriák rendszerei jellemzően elfedik, legyenek bármilyen részletesek is. Ennek elkerülése céljából a paradigmát a szerzők úgy fordítják le a bibliometria számára, mint gyakorta együttidézett közlemények jól körülhatárolható csoportjait, amely csoportok egy-egy kutatási témát vagy specifikus irányt képviselnek. Az ún. globális paradigmatérkép ennek alapján az egyik nagyléptékű citációs adatbázis, a Scopus közleményszintű feldolgozásával készült (Boyack et al. 2005). A térkép bázisa az egyes közlemények aggregált hivatkozáslistájának együttidézési elemzése (egy ésszerű bekerülési határérték felett, amely a hivatkozások előfordulásának számára vonatkozott). A térkép az elemzésből származó klaszterekből épül fel, amelyeket tehát az egymással szoros tematikus kapcsolatban álló hivatkozott közlemények (referenciák) építenek fel. A térkép ennek megfelelően úgy fogható fel, mint a szakterületi paradigmák globális rendszere (adott időmetszetben), amely különösen nagy felbontású tudományrendszert eredményez. Mivel a módszer teljes közleményekkel (a hivatkozott dokumentumokkal) dolgozik, taxonómiánkba úgy sorolható be, mint a közleményalapú együttidézési modell egy alkalmazása (document co-citataion analysis, DCA), tehát ami a (D) és a (CC) elemeket kombinálja. Fontos megjegyezni, hogy a vizsgálat léptéke, a minta méretei miatt az ilyen eljárások csak a napjainkban rendelkezésre álló számítási kapacitások mellett váltak kivitelezhetővé.

A kép adott intézmény esetén egy körben ábrázolja a tudományokat, a foltok nagysága a mérettel arányos, a középponthoz mért közelség a sikerességgel

Globális szakterületi paradimatérkép (Börner nyomán)

4.2.4. Esettanulmány: magyar intézmények kutatási értékelése

Érdemes megismerkedni a felvázolt módszerek és eszközök hazai alkalmazásával. A www.hungarianscience.org honlap – több korábbi projekt eredményeit felhasználva – intézményi bontásban mutatja be a magyar tudomány jellegét és teljesítményeit, az ISI (Reuters Thomson) adatbázis adatai alapján. Ennek két kulcsa a magyarországi intézmények listája (mely jelenleg 40 intézményt tartalmaz), valamint az ISI által meghatározott tárgykategóriák (jelenleg 244). A vizsgált intézmények köre magában foglalja a legnagyobb hazai kibocsátókat, köztük az MTA-t, az összes állami egyetemet és főiskolát, valamint az állami feladatokat ellátó egyházi (Pázmány Péter Katolikus Egyetem, Károli Gáspár Református Főiskola), illetve kiemelt jelentőségű magán felsőoktatási intézményeket (Central European University, Kodolányi János Főiskola).

Az intézményi szint, és a vizsgált időszakra vetített aggregált adatok használata egy olyan makrokontextust hoz létre, amely megmutatja egy adott intézmény összesített publikációs és idézési volumenét a vizsgált időszak alatt. Ennek felhasználásával először is hagyományos összefoglaló statisztikák készültek, amelyek a kibocsátáserősséget (produkciót) és hatást közvetlen formában jellemzik.

A kétdimenziós kép pontjai intézmények, helyzetük a publikációk és idézések száma.

Országos összesítő adatok a 2007-2011 időszakra

A kép ikeroszlopai az intézmények rangsorrendjei a publikációk és idézések területén.

Országos kibocsátási adatok rangsorrendje a 2007-2011 időszakra

Érdekes lehet szemügyre venni az intézmények összesített H,G,E index adatait is egy rangsorrend megjelenítésben. Hasonló ábrákat az idézett honlap tudományterületenként is közöl.

A kép oszlopai az intézmények H,G,E indexei.

A magyar intézmények H,G,E indexbeli rangsorrendje a 2007-2011 időszakra, H szerinti sorban

Az országos, intézményi vagy kutatói teljesítmény vizsgálatának leginkább kézenfekvő kérdése azonban – mint már említettük – a szakterületi besorolások felhasználásával a tudományos profil jellemzése, már csak azért is, mert a fent említett indexek mindegyike érzékeny a művelt szakterületek rendszerére, így önmagában nem elegendő az intézményi összehasonlításokhoz. A kibocsátási „portfólió” felvázolása révén láthatóvá válik, hogy a tudomány szóban forgó szereplője mely területeken aktív, mely más szereplőkkel hasonlítható össze, illetve hogy a tudományos piac perspektívájából szemlélve milyenek a kapacitásai, mik az erősségei. Az ilyen típusú vizsgálat klasszikus metódusa az egyes publikációs tételek szakterületi besorolásából, esetünkben az ISI-ben nyilvántartott tudományterületi kategorizációjából indul ki (a kategóriák a http://ip-science.thomsonreuters.com/mjl/scope/scope_scie/#ZE weboldalon megtekinthetők).

A további cél az volt, hogy meghatározzuk és jellemezzük egy publikációs lista tételeinek gyakorisági megoszlását a szakterületi kategóriák között, ezáltal láthatóvá váljék az intézmények kutatási területekre bontott aktivitása.

Az intézmények kutatási portfóliójának pontos leképezéséhez, a fentebb említett tudománytérképezés (science mapping) területéhez tartozó módszert használtuk, melynek alapjait Porter, Rafols, Leydesdorff és Meyer dolgozták ki. (Leydesdorff–Rafols 2009; Rafols–Meyer 2010). A módszer részletesebb és informatívabb képet nyújt a kutatási portfólió szerkezetéről, mint a tudományterületi kategóriák feletti eloszlások, noha nyersanyagát nagyrészt ugyanaz a kategóriarendszer alkotja. A módszer előnye, hogy segítségével az intézményi kutatási portfólió egy átfogó tudománytérkép („global science map”) segítségével reprezentálható.

A tudománytérkép csomópontjai a tudományban azonosítható szakterületek, élei pedig az ezek között lévő szakmai vagy diszciplináris kapcsolatok. Amennyiben létezik ilyen él két szakterület között, úgy azok valamilyen mértékben rokon vagy egymást befolyásoló területek; az él erőssége („súlya”) pedig a köztük lévő „közelséget”, vagyis a kapcsolat erősségét jellemzi. A tudománytérképek felhasználásával a kutatási profil az egyes tématerületek (tárgykategórák) gyakorisági eloszlásának a tudománytérkép csomópontjaira illesztésével jeleníthető meg. Az aktív területek hálózatban elfoglalt helye és relatív pozíciója arról is tájékoztat, hogy a kutatási profil mennyire diverzifikált, hiszen egészen más potenciál jellemzi a tudományos piacon azokat a szereplőket, amelyeknek a kibocsátása közeli, egymással rokon szakterületeken jelentős, illetve azokat, amelyek számos egymástól távoli területen egyaránt aktívak (ld. Soós–Kampis, 2011).

Elemzésünkben a vizsgált hazai intézmények (illetve publikációs teljesítményük) olyan szerkezeti diagnózisát adjuk meg, amely a fenti tudománytérképészeti módszerre épül. E szerkezeti diagramok egy előre adott globális tudománytérképen rajzolódnak ki, amelyhez egy nyilvánosan elérhető alaptérképet alkalmazunk. A kapott diagramok az egyes intézmények (egy évtizedet lefedő) publikációs teljesítményének szakterületi viszonyait ábrázolják. Az egyes szakterületeken így mért aktivitás számos mutatóval fejezhető ki. A normalizálásra – amely az összehasonlíthatóság és értékelhetőség szempontjából alapvető – két eltérő módszert alkalmaztunk. A térképek egyik formájában a szakterületek mérete ezek intézményen belüli százalékos megoszlását jelzi: a százalékalap az intézményi publikációk összmennyisége, a térkép elemei a szakterület intézményi súlyát ragadják meg. Egy második formában az intézmény által egy-egy adott szakterületen közölt publikációk számát az adott területen megjelent összes hazai publikáció számára vetítettük, ilyen módon az arány az intézmény hazai súlyát jellemzi a szóban forgó szűkebb szakterületen.

A kép egy tudománycsontvázra ültetett intézményi aktivitás profilt mutat)

Aktivitási tudománytérkép (az ELTE példáján bemutatva)

A kép egy tudománycsontvázra ültetett intézményi erőforrás profilt mutat)

Erőforrástérkép (az ELTE példáján bemutatva)

4.2.4.1. A kompetenciatérképezés módszere részletesen

Mivel az alkalmazott módszerek újszerűek, ezért itt részletesen is kifejtjük őket. A kutatási kompetenciák publikációs kibocsátáson alapuló térképezésének közelebbi célja a K+F szereplőinek olyan szerkezeti átvilágítása, amely lehetővé teszi (1) a kutatási profilok egységes és összemérhető strukturális–kvantitatív jellemzését, ezen keresztül pedig (2) az intézmény elhelyezését a tudomány mindenkori (országos, nemzetközi stb.) piacán. A jellemzés egy szakmai (tudománymetriai) módszerekkel előállított referenciarendszeren, ún. „tudománytérképen” vagy alaptérképen alapszik. Az összehasonlítások alapját képező tudománytérkép (global map of science) nemzetközi citációs adatbázisok teljes tartalmának feldolgozásából származik, és a szakterületek mindenkori kapcsolatrendszerét kódolja (a szakterületekké aggregált folyóiratok hivatkozásainak feltérképezése alapján), vagyis a mindenkor nemzetközi tudományrendszert („tudománypiacot”) ábrázolja. Formálisan a tudománytérkép (esetünkben) szakterületeket kódoló tárgykategóriák súlyozott kapcsolati hálózata, ahol két kategória kapcsolatának erőssége a közösen idézett kategóriák számának függvénye. A térkép és a hátterében álló citációs adatbázis segítségével modellezhető a vizsgált intézmények kutatási profilja, amennyiben az intézmény profilját az adatbázisban indexelt publikációi alapján vizsgáljuk. Az intézményi profil elhelyezhető a tudomány térképén, amely által azonosíthatóvá válnak az intézményi kompetenciák, az intézményi profilok szakterületi összetételének hasonlóságai és különbségei, illetőleg a művelt területek strukturális (hálózati) viszonyain keresztül (pl. távolság), a profil jellege (diverzifikáltság/specializáció stb.).

Összegezve: a bibliometriai kompetenciatérképezés a vizsgált egység (kutató, intézmény, régió, esetünkben intézmény) publikációs kibocsátásának, ún. publikációs aktivitásának elemzésén alapul. A módszer a hagyományosnak mondható kvantitatív mérőszámok alkalmazását kombinálja az intézmény profiljának szerkezeti mélyelemzésével. Az elemzés az alábbi lépésekből áll:

(1) Meghatározzuk a kompetenciatérképezés alapjául szolgáló globális tudománytérképet, az ún. alaptérképet (2007-es 221; ill. 2009-es 244 tárgykategóriát tartalmazó térkép; átfogó, ill. táradalomtudományi térkép). Az alaptérkép az elemzés eszközkészletében rekonstruált tudománymetriai (tudománytérképezési) eszköz (forrása a fentiekben említett publikus WoS-alapú adatstruktúra: http://www.leydesdorff.net/overlaytoolkit/ ).

(2) A vizsgált hazai K+F intézmények mindegyikére vonatkozóan az ISI–WoS adathalmazból előállítjuk annak szakterületi összetételét, a publikációk tárgykategóriák közti eloszlását (kutatási profil).

(3) A kutatási profilt integráljuk az alaptérképpel intézményenként, azaz elkészítjük az egyes intézmények kompetenciatérképét.

(4) Az elemzés eredménye a térképek vizualizációja és összehasonlítása.

Az alkalmazás keretében a mintabeli intézmények mindegyikéről két típusú globális (minden szakterülettel számoló) kompetenciatérkép készül, mind időaggregált, mind pedig idősoros (dinamikus) változatban; a globális térképek mellett elkészítjük a társadalomtudományra szűkített időaggregált kompetenciatérképeket is. Részletesen:

(1) A mintabeli intézmények ún. erőforrástérképe. Ebben a kompetenciamodellben szakterületek térképen ábrázolt súlya az intézmény részesedése az adott szakterület országos kibocsátásából. A modellek az intézményi kutatási szerkezet mellett a tudomány hazai piacán elfoglalt relatív pozíciót teszik elemezhetővé.

(2) A mintabeli intézmények ún. aktivitástérképe. Ebben a modellben a szakterületek térképen ábrázolt súlya a szakterület részesedése az intézmény profiljából (összkibocsátásából).

(3) Mind az erőforrás-, mind pedig az aktivitástérképek a 2007–2011 időszakra aggregálva, illetve évenkénti bontásban is elkészíthetőek. Az évenkénti térképek sorozatán az egyes intézmények szerkezeti változása jól nyomon követhető, ill. kvantifikálható.

(4) Az ISI WoS SCI, SSCI és A&HCI, rendre természet-, társadalom és bölcsészettudományi adatbázisát fedő globális tudománytérképek alkalmazása mellett elkészíthető a részletes társadalomtudományi kompetenciák térképe is minden esetben (amely az SSCI és A&HCI részterületeit fedi).

A strukturális trendelemzésnek kiemelten kezelt részcélja, hogy eszközt biztosítson a szerkezeti, kvalitatív trendek számszerűsítéséhez, egy-egy informatív mutatóba való sűrítéséhez A kompetenciatérképek fő előnye a hagyományos szakterületi profil-elemzésekkel szemben (amelyek az egyszerű szakterületi összetételre alapulnak), hogy az aktív szakterületek száma és súlya mellett azoknak az alaptérkép jellemezte relatív pozícióját, „távolságát” is közvetíti. A térképek alapján elvégezhető pl. az ún. diverzitás-indexek kalkulációja, amelyek a publikációs portfolió diverzifikáltságát a művelt területek távolságával is jellemzik.

A mintabeli intézményekre készített profilanalízis további felhasználási lehetősége az összemérhető intézménycsoportok profil-alapú meghatározása. A bibliometriai teljesítménymérésen alapuló összehasonlítások, rangsorok gyakorta tárgyalt kritériuma az összemérhető vizsgálati egységek problematikája. A felsőoktatási intézmények összevetésénél alapvető a szakterületi különbségek okozta torzítások korrekciója, amely a hasonló profilú, tudománymetriailag összemérhető intézményi csoportok meghatározását teszi szükségessé.

A térképek alapján elkészíthető a vizsgált intézmények profil-alapú tipológiája. A tipológia a szakterületi profilok páronkénti hasonlóságára építhető, és abból klaszterezés útján előállítható. Figyelembe véve, hogy a természettudomány relatív mennyiségi túlsúlya a klaszterezés során elnyomja a társadalomtudományi részprofil hasonlóságait, két tipológia javasolható (1) a teljes publikációs portfolió (SCI + SSCI + A&HCI), illetve a társadalomtudományi portfolió alapján (SSCI + A&HCI).

A WOS ISI tárgykategóriái (SC) alkalmasak arra is, hogy segítségükkel az egyes intézmények aktivitását és idézettségét az intézmények belső viszonyaira lebontva is elemezzük (a tudománytérképek csak az erőforrás megoszlást mutatják, de azt országos, nem pedig intézményen belüli összehasonlításban). A hungarianscience.org honlapon közölt kutatás során elkészült a vizsgált intézmények „sugár-diagramja”, ahol az egyes tárgyterületek a tudománytérképek kategóriái szerinti nagyobb tudományterületekbe vannak szervezve, és egy kör kerületén helyezkednek el (3. ábra). A középpontból kiinduló „sugarak” az aktivitást, valamint az idézettséget együttesen mutatják be az intézmény által művelt legfontosabb tárgyterületekre, mégpedig úgy, hogy a sugarak hossza a megfelelő értékekkel arányos. Ezek a diagramok azt állapítják meg, hogy mennyire eredményesek azon területek, amelyeket az adott intézmény a leginkább művel, vagyis amelyekre a kutatási (illetve ennek egy fontos aspektusaként, a publikációs) erőforrásait összpontosítja.

A kép egy sugárdiagramot ábrázol egy intézmény esetén, az egyes sugarak tárgyterületeket jeleznek, hosszuk a produktivitással (szürke) és a hatással (fekete) arányos.

Intézményi sugárdiagram publikációs (szürke) és idézési (fekete) adatokkal (az ELTE példáján).

4.2.5. Hogyan jellemezhető végül is a korszerű tudománymetria?

Összefoglalva az látható és mondható, hogy manapság a tudománymetria a tudomány modellezésének tudománya lett, amely továbbra is széles és egyre kifinomultabb eszköztárat szolgáltat a kutatásértékelés számára. Módszertani szempontból nyitott: a matematikai statisztika, hálózatelmélet, adat- és szövegbányászat, adatbázis-tervezés, az információtudomány számos más területe szerepel arzenáljában, miközben átfed ökonometriával, tudományszociológiával és még számos területtel. Egyik legkritikusabb és leghangsúlyosabb pontja természetesen az alkalmazása: kellő körültekintéssel és szakszerűen alkalmazva valóban nagy haszna vehető a szakpolitikák minden szintjén, és a tudomány szociológiájában.

4.2.6. Hivatkozások

Albert, R., & Barabási, A. L. (2002). Statistical mechanics of complex networks. Reviews of modern physics, 74(1), 47.

Braun Tibor (szerk): The Impact Factor of Scientific and Scholarly Journals: Its Use and Misuse in Research Evaluation. Akadémiai Kiadó, 2007.

Barabási, A. L., & Albert, R. (1999). Emergence of scaling in random networks. Science, 286(5439), 509-512.

Barabási, A. L., Jeong, H., Néda, Z., Ravasz, E., Schubert, A., & Vicsek, T. (2002). Evolution of the social network of scientific collaborations. Physica A: Statistical Mechanics and its Applications, 311(3), 590-614.

Boyack K. W. (2009). Using detailed maps of science to identify potential collaborations. Scientometrics 79, 27-44.

K. W. Boyack, R. Klavans and K. Borner (2005). Mapping the backbone of science. Scientometrics 64, 351-374.

Börner, K. (2010). Atlas of science. MIT Press.

Glänzel, Wolfgang (2009): A tudománymetria hét mítosza - költészet és valóság. Magyar tudomány, 170(8), 954-964.

de Solla Price D, 1979. Kis tudomány – nagy tudomány. Akadémiai Kiadó, Budapest.

Leydesdorff, L. and Rafols, I. (2009). A global map of science based on the ISI subject categories. Journal of the American Society for Information Science and Technology 60, 348-362.

Moya-Anegon, F. , Vargas-Quesada, B., Herrero-Solana, V, Chinchilla-Rodriguez, Z., Corera-Alvarez, E. and Munoz-Fernandez F. J. (2004). A new technique for building maps of large scientific domains based on the cocitation of classes and categories. Scientometrics 61, 129-145.

Rafols, I. and Meyer, M. (2010). Diversity and network coherence as indicators of interdisciplinarity: case studies in bionanoscience. Scientometrics, 82 (2). pp. 263-287.

Soós, S., & Kampis, G. (2011). Towards a typology of research performance diversity: the case of top Hungarian players. Scientometrics, 87(2), 357-371.