Szamárfülből megabájt
Digitális közgyűjtemények a weben című konferencia a Könyvfesztiválon
A Millenáris Fogadójának padlásán, a sötét drapériákkal körülfüggönyözött Lázár Ervin teremben pénteken, nem sokkal ebéd után gyűlik össze a Digitális közgyűjtemények a weben című szakmai konferencia hallgatósága és előadói gárdája. Ott jártunk.
- 2011. április 16.
A helyszín puritán stúdiószínházra hajaz. A hosszú asztalnál – a színpadon – teljes valójukban sorakoznak a digitális-könyvkorszak előmozdítói, a vázában igazi nárcisz díszeleg. Gutenberg úr koponyáján alighanem sanda mosoly játszik, ugyanis a nézőtéri székeken az webes adatbázisokat ismertető nyomtatott prospektusok várják az érdeklődőt. A röpke, kézfeltartásos-bevallós közvélemény-kutatás szerint, szerény becslésem alapján a jelenlévők jó harmada közgyűjteményből érkezett. Elvétve könyvkiadókat is látni.
Elsőként a külfödi vendég, Simon Morrison, a Google szerzői jogi és kommunikáció menedzsere lép a projektor mellé. Színes slide-jaiból megtudjuk, hogy míg régen kizárólag az elit kiváltsága volt a kulturális örökséghez való hozzáférés, sokat jelentett a közkönyvtárak XIX. századi megjelenése, az internet pedig még tovább demokratizálta a tudás fellelhetőségét. Eddig semmi novum. Aztán Mr. Morrison a tizenkét esztendeje szimpla keresőmotorként induló Google felismert küldetéséről beszél. Nevezetesen, a digitálisan korábban közzé nem tett kulturális értékek interneten való elérhetővé tételéről. A 2004-ben indult Google Books segítségével jelenleg 15 millió könyvhöz juthatunk el a weben. Az amerikai internet-mogul negyvenhárom közkönyvtárral és harmincöt-ezer kiadóval áll kapcsolatban. Stratégiai céljuk egy globális, digitális könyvadatbázis létrehozása, ám – mint Morrison úr is mondja – a siker számos szereplőn múlik.
A következő előadó Biszak Sándor, az Arcanum Adatbázis Kiadó cégvezetője. Kezdődik a számháború. Biszak Morrison felé biccent, és bejelenti nemes bajvívási szándékát. Annyi oldalt digitalizálni tudniillik, ahány könyvet a Google elektronikusan kiad. Szép és hasznos cél. Morrison elismerően bólint. Az Arcanum CD-ROM-ok kiadásával kezdte, húsz évvel ezelőtt, s mára már tízmillió oldalt publikált az interneten. Biszak Sándor a scannelés technológiai hátteréről is szól. Megtudom például, hogy a robot-scannerek kétezer oldalt olvasnak be óránként, az automatikus szövegfelismerők pedig átlagban száz-kétszáz karakterhibát vétenek egy tízezer karakternyi textusban. Én mondom, számháború van. Felszólalása végeztével – jó, digitális katedrálisépítőhöz méltón – Biszak lelkes donációt jelent be. A 2011-es év folyamán 2011, közgyűjteményekben fellelhető könyvet kívánnak térítésmentesen digitalizálni.
Az Arcanum Digitális Tudástárra (ADT) áttérve Biszak azzal folytatja, hogy a szelekció mindig nagy kérdés számukra, hiszen érthető módon csak válogatott merítést tudnak vállalni, noha számos levéltárral és könyvtárral állnak kapcsolatban. Kedves és speciális területét képezi az Arcanum munkájának a térképek digitalizálása. A Tudástárban fellelhetők történelmi folyóiratok, egyházi lapok, nyelvtudományi, néprajzi periodikák és közlönyök. Mindez saját keresőprogrammal került a netre.
A Magyar Levéltári Portálról előadó Dr. Kenyeres István folytatja a bájtok és rekordok gumilövedékével vívott harcot. Az Arcanummal is partnerségben álló, a Magyar Országos Levéltárat, a megyei, fővárosi és városi levéltárak oldalait összesítő, azokat közös keresővel összefésülő portál az utóbbi években fontos lelőhely lett a kutatók számára. A rendszerben eddig 150000 kép, és 90000 teljes dokumentum érhető el. Ez az a pont, amikor a mellettem ülő úriember – tán jó tyúkhúslevestől nehezülten – elbóbinyál. Átalussza a tisztviselőtárak és levéltári kiadványok ismertetését. Amikor újra felnéz, nyugtázza, hogy immár Cséka György beszél az Egyetemi Könyvtár cédulakatalógusának digitalizálási munkálatairól. Érdekesség, hogy az 1876-1989-ig épülő alapkatalógust a mai napig használják az olvasók, ha pedig a cédulákat egymás után rakosgatnánk, 240 kilométer hosszú bibliotéka-sztrádát nyernénk. „Újabb érdekes adat” – jut eszembe a néhai Holló Színház száma, természetesen Galla Miklós hangján. Az Egyetemi Könyvtár projektje a gyors és költséghatékony kép alapú scannelésre példa, vagyis a cédulákat csak fényképezték, de nem gépelték be.
Moldován István, az OSZK Digitális Gyűjteményének osztályvezetője, beszélye élén hálával köszönti azokat, akiknek maradt még energiájuk meghallgatni őt, illetve azokat is, akiknek már arra sem maradt erejük, hogy elmeneküljenek. Hiába, hosszú a szekció. Ha a Google vállalta volna a nézőtér folyamatos monitorozását, akkor szolid, de egyenletes fogyást mutattak volna a szenzorok. Moldován előbb címszavakban áttekinti a szcénát, vagyis a honi digitális könyvtárakat, majd elhelyezi benne a tizenöt éve épülő, bővülő MEK-et. A Magyar Elektronikus Könyvtár szerepének elsősorban a gyűjtést tartja. Azon dokumentumok összeszedését, egyberendezését, amiket publikáltak már elektronikusan, vagy eredendően úgy is jöttek létre. Arra is felhívja a figyelmet, hogy a technológiai váltások során is tűnhetnek el adatok, és a MEK lehetőség szerint ezeket is szeretné megmenteni.
Abban mindnyájan megegyeznek, hogy fontos az útjelzők elhelyezése a netpolgárok számára. Menteni kell a papirost, a szamárfüleket bájos bájtokká formálni. Összességében hasznos, fontos munka ez a digitális adatmentés. Ám amikor hazafelé felcsapom a könyvemet, beleszagolok és belemerülök, akkor úgy érzem, hogy én még ezen a galaxison vagyok itthon…
Elsőként a külfödi vendég, Simon Morrison, a Google szerzői jogi és kommunikáció menedzsere lép a projektor mellé. Színes slide-jaiból megtudjuk, hogy míg régen kizárólag az elit kiváltsága volt a kulturális örökséghez való hozzáférés, sokat jelentett a közkönyvtárak XIX. századi megjelenése, az internet pedig még tovább demokratizálta a tudás fellelhetőségét. Eddig semmi novum. Aztán Mr. Morrison a tizenkét esztendeje szimpla keresőmotorként induló Google felismert küldetéséről beszél. Nevezetesen, a digitálisan korábban közzé nem tett kulturális értékek interneten való elérhetővé tételéről. A 2004-ben indult Google Books segítségével jelenleg 15 millió könyvhöz juthatunk el a weben. Az amerikai internet-mogul negyvenhárom közkönyvtárral és harmincöt-ezer kiadóval áll kapcsolatban. Stratégiai céljuk egy globális, digitális könyvadatbázis létrehozása, ám – mint Morrison úr is mondja – a siker számos szereplőn múlik.
A következő előadó Biszak Sándor, az Arcanum Adatbázis Kiadó cégvezetője. Kezdődik a számháború. Biszak Morrison felé biccent, és bejelenti nemes bajvívási szándékát. Annyi oldalt digitalizálni tudniillik, ahány könyvet a Google elektronikusan kiad. Szép és hasznos cél. Morrison elismerően bólint. Az Arcanum CD-ROM-ok kiadásával kezdte, húsz évvel ezelőtt, s mára már tízmillió oldalt publikált az interneten. Biszak Sándor a scannelés technológiai hátteréről is szól. Megtudom például, hogy a robot-scannerek kétezer oldalt olvasnak be óránként, az automatikus szövegfelismerők pedig átlagban száz-kétszáz karakterhibát vétenek egy tízezer karakternyi textusban. Én mondom, számháború van. Felszólalása végeztével – jó, digitális katedrálisépítőhöz méltón – Biszak lelkes donációt jelent be. A 2011-es év folyamán 2011, közgyűjteményekben fellelhető könyvet kívánnak térítésmentesen digitalizálni.
Az Arcanum Digitális Tudástárra (ADT) áttérve Biszak azzal folytatja, hogy a szelekció mindig nagy kérdés számukra, hiszen érthető módon csak válogatott merítést tudnak vállalni, noha számos levéltárral és könyvtárral állnak kapcsolatban. Kedves és speciális területét képezi az Arcanum munkájának a térképek digitalizálása. A Tudástárban fellelhetők történelmi folyóiratok, egyházi lapok, nyelvtudományi, néprajzi periodikák és közlönyök. Mindez saját keresőprogrammal került a netre.
A Magyar Levéltári Portálról előadó Dr. Kenyeres István folytatja a bájtok és rekordok gumilövedékével vívott harcot. Az Arcanummal is partnerségben álló, a Magyar Országos Levéltárat, a megyei, fővárosi és városi levéltárak oldalait összesítő, azokat közös keresővel összefésülő portál az utóbbi években fontos lelőhely lett a kutatók számára. A rendszerben eddig 150000 kép, és 90000 teljes dokumentum érhető el. Ez az a pont, amikor a mellettem ülő úriember – tán jó tyúkhúslevestől nehezülten – elbóbinyál. Átalussza a tisztviselőtárak és levéltári kiadványok ismertetését. Amikor újra felnéz, nyugtázza, hogy immár Cséka György beszél az Egyetemi Könyvtár cédulakatalógusának digitalizálási munkálatairól. Érdekesség, hogy az 1876-1989-ig épülő alapkatalógust a mai napig használják az olvasók, ha pedig a cédulákat egymás után rakosgatnánk, 240 kilométer hosszú bibliotéka-sztrádát nyernénk. „Újabb érdekes adat” – jut eszembe a néhai Holló Színház száma, természetesen Galla Miklós hangján. Az Egyetemi Könyvtár projektje a gyors és költséghatékony kép alapú scannelésre példa, vagyis a cédulákat csak fényképezték, de nem gépelték be.
Moldován István, az OSZK Digitális Gyűjteményének osztályvezetője, beszélye élén hálával köszönti azokat, akiknek maradt még energiájuk meghallgatni őt, illetve azokat is, akiknek már arra sem maradt erejük, hogy elmeneküljenek. Hiába, hosszú a szekció. Ha a Google vállalta volna a nézőtér folyamatos monitorozását, akkor szolid, de egyenletes fogyást mutattak volna a szenzorok. Moldován előbb címszavakban áttekinti a szcénát, vagyis a honi digitális könyvtárakat, majd elhelyezi benne a tizenöt éve épülő, bővülő MEK-et. A Magyar Elektronikus Könyvtár szerepének elsősorban a gyűjtést tartja. Azon dokumentumok összeszedését, egyberendezését, amiket publikáltak már elektronikusan, vagy eredendően úgy is jöttek létre. Arra is felhívja a figyelmet, hogy a technológiai váltások során is tűnhetnek el adatok, és a MEK lehetőség szerint ezeket is szeretné megmenteni.
Abban mindnyájan megegyeznek, hogy fontos az útjelzők elhelyezése a netpolgárok számára. Menteni kell a papirost, a szamárfüleket bájos bájtokká formálni. Összességében hasznos, fontos munka ez a digitális adatmentés. Ám amikor hazafelé felcsapom a könyvemet, beleszagolok és belemerülök, akkor úgy érzem, hogy én még ezen a galaxison vagyok itthon…

Hozzászólás