Digitalizálás

Ebben a fázisban kerülnek a nyersanyagok digitális formába. A nyersanyag típusának függvényében különböző feladatok adódnak.

Szöveg:

— Amennyiben nagy tömegű, viszonylag jó minőségű, modern nyelven íródott, nem nagyon bonyolult szerkezetű, tördelésű nyomdai anyagból (könyv, folyóirat, stb.) indulunk ki, akkor az OCR (Optical Character Recognition) programok elég jó eredménnyel végzik a digitalizálást. Ilyenkor ezen programok kezelésében jártas kollégáink végzik a feladatot, a tartalomhoz specializált gyors és kíméletes szkennerekkel és Abby FineReader ill. más speciális szövegjavító programokkal. A szövegfelismertetés után elvégezzük a szükséges ellenőrzést, durva formázást, strukturálást, majd igény esetén papírra kinyomtatva a teljes anyagot, tapasztalt nyomdai korrektor végzi a szöveg alapos ellenőrzését. A korrektor által észlelt hibákat az állományon visszajavítjuk.

— Minden más szöveganyag esetén (rossz minőségű, kézzel írott, nem szabványos méretű, régies nyelvezetű, speciális nyelvű, stb.) nagy tapasztalattal rendelkező kézi szedőink (gépíróink) végzik a digitalizálást, a kialakítandó adatstruktúra egyszerűbb elemeinek megjelölésével együtt. Az általuk előállított anyagot — nyers formázás, az esetleges képanyag beillesztése után — papírra nyomtatjuk, majd a korrektor ellenőrzése után visszajavítjuk. A leginkább minőségigényes anyagokat esetleg még egy második, független korrektúrának is alávetjük. A bibliográfiai, vagy katalógus jellegű szövegeket minden esetben erre specializált, komoly tapasztalattal rendelkező szedővel digitalizáltatjuk.

Kép: Az elmúlt esztendőkben több százezernyi képet digitalizáltunk, a legváltozatosabb forrásokból. Volt közöttük újság, könyv, fekete-fehér és színes fotónegatív, üvegnegatív és mindenféle méretű diapozitív, metszet és térkép. Minden képi tartalomtípusra így a régi térképekre, nagyméretű tervrajzokra oklevelekre, kódexekre fotókra, különböző típusú negatívokra, mikrofilmekre speciális, mindig naprakész digitalizáló eszközöket alkalmazunk.

Hang, videó: bármely kommerciális hordozóról tudunk digitalizálni, a CD-ROM-on, DVD-ROM-on, interneten való publikáláshoz megfelelő minőségben (nem broadcast). Igény esetén vágási, szűrési műveleteket, normalizálást, feliratozást is elvégezzük.

Adatkonverzió és archiválás

Az elektronikusan egyszer már előállott anyag a legritkább esetben hasznosítható újra változatlan formában. Hiába, hogy ma már minden papíron megjelenő termék is digitálisan születik, a szoftverek gyors avulása, a nem megfelelően átgondolt eszközválasztás, archiválási gyakorlat(lanság) igen nagy pusztulási veszélynek teszik ki az elektronikus formában lévő anyagokat. Elsőrendű fontosságú, hogy ezeket begyűjtve mielőbb olyan formába konvertáljuk, ami hozzáférhetővé teszi őket, ezáltal hosszú távú fennmaradásukat is biztosítja. Az adatrögzítés és korrektúra helyett ez esetben konvertálásról, strukturálásról beszélünk.

Az összes általánosan használt nyomdai formátumot fogadni tudjuk: QuarkXPress, Word, PageMaker, Ventura, InDesign. Az adatkonverzió legnagyobb nehézsége az eredeti szövegformázás és szövegstruktúra megtartása. Saját fejlesztésű segédprogramjaink lehetővé teszik, hogy minimális manuális beavatkozással igen nagy mennyiségű adatot lehessen eredeti formában hatékonyan a konvertálandó anyagból kinyerni. A tördelt anyagban lévő — tipográfiai attribútumokban kódolt — metainformációt lehetőség szerint felhasználjuk.

Képek, hangok, filmek esetén is az összes elterjedt formátumot, ill. hordozót tudjuk fogadni, és a kívánt típussá alakítani.

A konverzió kimenete szabványos XML állomány, avagy azzá alakítható közbülső formátum. Eme nyílt szabványokon alapuló, egyre több eszköz által támogatott dokumentum-leíró mód használata rohamosan terjed. Ugyan teljesen eszközfüggetlen dokumentum-leírás valószínűleg nem létezik, de az XML erőssége, hogy általa elválaszthatók a dokumentum (tartalmi információt hordozó) belső tulajdonságai a külső, megjelenítéssel kapcsolatos tulajdonságoktól. Ezáltal az XML a dokumentumok konvertálhatóságának, hordozhatóságának ígéretét látszik teljesíteni. A mi adatbázisaink natív formátuma is XML.
Az egyre nagyobb terjedelemben rendelkezésre álló digitális állományok tárolása, hosszú távú megőrzése komoly kihívás elé állítja a tartalomgazdákat. Az archiválás nemcsak tárhely kérdése. Sok egyéb mellett ügyelni kell a formátumokra, az áttekinthetőségre és az egyszerű előhívhatóságra is. Mint Magyarország egyik legnagyobb digitális tartalom előállítója, egyedülálló tapasztalatokkal rendelkezünk a nagyméretű tartalom-archiválásban és komoly világcégekkel alakítottunk ki partneri kapcsolatot a magas szintű szolgáltatás fenntartása érdekében.