Könyvtára révén pötty lett a Magyar Nemzeti Múzeum a híres nyílt kapcsolt adatok felhőjén, az úgynevezett LOD Cloud-on:.
1. ábra: A híres LOD Cloud a legutolsó (2017-08-22-i) állapota szerint.
A LOD Cloud a Datahub adatbázis taralmának grafikus megjelenítése. Az adatbázis a világ szemantikus adathalmazainak és azok kapcsolatainak leíró adatait tartalmazza. A hazai intézmények közül az Országos Széchényi Könyvtár, a Szépművészeti Múzeum és az MTA SZTAKI után Magyar Nemzeti Múzeum is felkerült a felhőbe „data-hnm-hu – Hungarian National Museum datasets” néven. Ezt azzal érdemelte ki, hogy a múzeum Központi Könyvtára a teljes online katalógusát publikálta a szemantikus weben [1] BIBFRAME-formátumban [2].
A publikálás több célt szolgált. A könyvtár már régen elkötelezte magát a nyílt bibliográfiai adatok mozgalma mellett. [3]. Ezzel a mostani lépésével a legmagasabb szinten, nyílt kapcsolt adatok formájában tette közkinccsé bibliográfiai rekordjait. A szinteket Tim Berners-Lee, a web és a szemantikus web létrehozója alkotta meg [4] (2. ábra).
Az egyes szintek az alábbi előnyöket jelentik a felhasználók számára: A felhasználók a bibliográfiai adatokat
★
megtekinthetik,
kinyomtathatják,
helyileg tárolhatják,
betölthetik a saját rendszerükbe,
módosíthatják a saját igényeik szerint,
megoszthatják másokkal,
★★
speciális szoftverekkel feldolgozhatják,
konvertálhatják más formátumba,
★★★
speciális szoftverek nélkül is feldolgozhatják,
★★★★
bárhonnan linkelhetik,
az azonosító linkeket elmenthetik,
részeiben is felhasználhatják,
más adatokkal egyesíthetik,
★★★★★
más adathalmazokból származó adatokkal együtt tekinthetik meg.
Publikálásunkkal szerettünk volna hozzájárulni a szemantikus web építéséhez. A szemantikus webnek adatokra van szüksége. A könyvtárak rendelkeznek ilyen adatokkal, ráadásul a több évtizedes gépesítésnek és szabványosításnak köszönhetően adataik jól szegmentáltak, ami lehetővé teszi, hogy viszonylag könnyen konvertálják azokat a szemantikus webre.
További célunk volt a BIBFRAME-formátum megismertetése a hazai könyvtárakkal hazai bibliográfiai rekordok konverziója révén. A BIBFRAME
a leírást integrálja a hálózatba és a hálózatot bevonja a leírásba – azaz egy szemantikus web alapú formátum -, miközben továbbra is szolgálja a könyvtárak speciális igényeit;
világosan különbséget tesz a fogalmi tartalom és a fizikai/digitális megvalósulás között;
egyértelműen azonosítja az információs entitásokat;
megmutatja és hasznosítja az entitások külső és belső kapcsolatait.
Ez nem kevesebbet jelent, mint hogy a jövőben már nem a könyvtárunk számára, hanem a web számára fogunk katalogizálni. Az egyes könyvtárak a bibliográfia rekordok átvétele helyett egymás leírásaira fognak mutatni, azaz a másolásos katalogizálás helyét a linkelés veszi át. A felhasználók pedig a könyvtárak által készített leírásokat egyetlen egységben fogják látni.
A BIBFRAME-formátumban való publikálásunk specialitása, hogy célunk elérése érdekében, hasonlóan a német nemzeti könyvtárhoz – sőt azon egy kicsit túlmutatva –, összekötöttük a hagyományos - ún. MARC alapú - leírást tartalmazó, online katalógusbeli rekordjainkat a BIBFRAME-leírásokkal. A hagyományos leírástól a BIBFRAME-formátumig a leírás állandó, „Link a rekordhoz” feliratú URL-jéhez illesztett „.rdf” kiterjesztéssel lehet eljutni. Egy példán szemléltetve:
Online katalógus leírásának URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563
A BIBFRAME megfelelőjének az URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563.rdf
És ez fordítva is igaz. A BIBFRAME-leírástól el lehet jutni az online katalógusig a BIBFRAME-leírás URL-jét kiegészítve az „.opac” kiterjesztéssel. Így:
BIBFRAME-leírás URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563
Az online katalógusbeli megfelelőjének URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563.opac
Az online katalógus leírásai és a BIBFRAME-leírások között a kapcsolatot a számítógépek számára is megteremtettük az online katalógus HTML oldalainakrészében elhelyezett „LINK rel” elem segítségével:
A fenti elem jelentése a számítógépek számára: a jelen oldal tartalmát alternatív formában RDF/XML szintaxissal meg lehet találni a href attributumban megadott URL-en.
Célunk eléréséhez több problémát is meg kellett oldani.
Először is kellett egy szerver. A szervert a Nemzeti Információs Infrastruktúra Fejlesztési program bocsájtotta a rendelkezésünkre virtuális szerver formájában. A szerver a http://data.hnm.hu URL címet kapta a szemantikus weben kialakult szokásoknak megfelelően. Ezen a szerveren foglalnak helyet a webes megjelenéshez és a Java programok futtatásához szükséges szoftverek, valamint a BIBFRAME-adatok tárolására és visszakeresésére szolgáló adatbáziskezelő, a Virtuoso (annak is az ingyenes változata). A telepítéseket Idoia Murua Belacortu végezte a szabad idejében spanyolországi otthonából.
A BIBFRAME-adatok a HUNTÉKA adatbázisból exportált MARC rekordok konverziójával álltak elő. A konverziót az olasz @Cult cég végezte: mi kiküldtük a MARC rekordokat, ők pedig visszaküldték a BIBFRAME-formátumú leírásokat, amiket aztán betöltöttünk a Virtuoso adatbázisba. Az @Cult-féle konverzió specialitása, hogy a konverzió során képes megállapítani, milyen műveket tartalmaz a konvertálandó adathalmaz, és az egyes megjelenési formák leírását ezekhez a tényleges művekhez kapcsolja (szemben más konverterekkel, melyek minden megjelenési formához létrehoznak egy álművet). A konverzió további specialitása, hogy a konvertálandó adathalmaz néventitásait összeköti más, külső adathalmazok néventitásaival. A mi neveink az alábbi adathalmazok néventitásaival lettek összekötve:
Bibliothèque nationale de France (BNF) [5]
International Standard Name Identifier (ISNI) [6]
Library of Congress Name Authority File (LC NAF) [7]
Virtual International Authority File (VIAF) [8]
Wikidata [9]
Ezen kapcsolatok révén váltak adataink igazi kapcsolt adatokká, ezáltal váltunk jogosulttá az 5 csillagos minősítésre.
Ahhoz, hogy a BIBFRAME-leírásoktól el lehessen jutni az online olvasói katalógus megfelelő oldalaihoz, újabb problémákat kellett megoldanunk.
A könyvtár online katalógusa a Mongúz kft szerverén fut, és egy adott könyv leírását ezen a címen lehetett elérni.
Ez az URL nagyon hosszú és ezért megjegyezhetetlen. Ráadásul nem is tartozik a hnm.hu tartományba, ami pedig egyéb céljaink megvalósítását akadályozta. Mindkét problémát a Mongúz kft. által fejlesztett linkfeloldó [10] oldotta meg. A linkfeloldó segítségével a Magyar Nemzeti Múzeum bármely online rekordjához, így a könyvtári rekordokhoz is hozzá lehet rendelni a World Wide Web Consortium ajánlásának [11] megfelelő kinézetű URL-t. A fenti leírás új URL-je ez: http://link.hnm.hu/lib/bib/mnmkvt19563
Mint látható, ez az URL már bevonja a leírást a hnm.hu tartományba, rövid, kifejező és könnyen megjegyezhető, szintaxisa révén pedig lehetőséget ad egyéb, nemzeti múzeumi adatbázisok rövid URL-lel való ellátására is.
(Azoknak, akik ki is próbálták a fenti URL-eket, feltűnhet, hogy a linkfeloldó nem a hunteka.asp.hunteka.hu tartományba visz, hanem a catalog.library.hnm.hu tartományba. Ez azért van, mert egyéb terveink megvalósítása szükségessé tette, hogy a katalógusszervert is bevonjuk a hnm.hu tartományba. Ez azonban már a BIBFRAME fejlesztés után történt, a BIBFRAME fejlesztéshez erre a lépésre nem volt szükség.)
Munkánk befejező része a részletes dokumentáció elkészítése volt. A teljes dokumentáció elérhető a http://data.hnm.hu címről kiindulva.
Részletes leírást tettünk közzé a Datahub adatbázisban is. A Datahub-beli bejegyzésnek, valamint annak, hogy mind a dokumentáció, mind a szemantikus adatok közzétételének módja megfelel a legmagasabb követelményeknek, köszönhető, hogy az adathalmazunk végül megjelent a már említett LOD cloudon.
Eredményeinket pedig a Katalisten [12], a NETWORKSHOP konferencián [13], valamint a LINKEDIN-en [14] népszerűsítettük.
Sokat dolgoztunk, de megérte: egyre több magyar könyvtár érdeklődik a BIBFRAME felől, meghívást kaptunk a European BIBFRAME Workshopra [15], és felkerültünk a Library of Congress honlapjára a BIBFRAME korai felhasználói közé [16], többek között olyan hírességek mellé, mint
Stanford University,
Deutsche Nationalbibliothek,
Library of Alexandria,
Music Library Association,
The National Library of Medicine,
Columbia University Libraries,
Princeton University Library,
Cornell University Library és maga a
Library of Congress.
Ezeket az eredményeket a Magyar Nemzeti Múzeum vezetőségének megértő elvi támogatása mellett nemzetközi összefogásban sikerült elérni teljesen ingyenesen a meglévő szoftveres és emberi erőforrások megfelelő összekapcsolása révén.
[1]: https://archiv.magyarmuzeumok.hu/muhely/2337_potty_lesz_a_szepmuveszetibol. A cikk első része a szemantikus web ismertetése.
[2]: http://www.loc.gov/bibframe/
[3]: Horváth Ádám: Open Data a könyvtárban https://archiv.magyarmuzeumok.hu/muhely/3687_open_data_a_konyvtarban
[4]: 5 ★ OPEN DATA (http://5stardata.info/en/)
[5]: http://data.bnf.fr/
[6]: http://isni.org/
[7]: http://id.loc.gov/authorities/names.html
[8]: http://viaf.org/
[9]: http://wikidata.org
[10] A linkfeloldó működésének részletes leírása: http://link.hnm.hu
[11]: Cool URIs for the Semantic Web (https://www.w3.org/TR/cooluris/)
[12]: https://listserv.niif.hu/pipermail/katalist/2017-May/036758.html
[13]: Horváth Ádám – Hubay Miklós: A BIBFRAME új keretei 2017-ben: http://niif.videotorium.hu/hu/recordings/17770
[14]: https://www.linkedin.com/pulse/bibframe-library-hungarian-national-museum-adam-horvath/
[15]: https://wiki.dnb.de/display/EBW/European+BIBFRAME+Workshop+2017
[16]: https://www.loc.gov/bibframe/implementation/register.html