Digitalizácia
Na digitalizáciu periodík a kníh používame rôzne skenery v závislosti od kvality a veľkosti zväzkov.
Robotický skener pre cenné a jedinečné tlače
Obzvlášť cenné, unikátne výtlačky sa digitalizujú pomocou tzv. robotického skenera, ktorý umožňuje otvoriť knihu len o 90 stupňov, čím sa zabráni poškodeniu väzby. Robotický skener používa 2 kamery s vysokým rozlíšením na vytváranie veľmi kvalitných obrázkov s rozlíšením až 400 DPI vo formáte TIFF alebo JPG. Upevňovací hranol je veľmi šetrný a vyrovnávanie sa zvyčajne vykonáva v poloautomatickom režime.
Skener kníh pre veľkoformátové tlače
Veľké dokumenty (väčšie ako rozmery A3) sa digitalizujú pomocou tzv. skenera kníh, kde veľkosť strany môže siahať až do rozmeru A2. Skenovacie osvetlenie a skenovanie vytvárajú veľmi kvalitné obrazy; verzia, ktorá nevyžaduje otvorenie zväzkov o 180 stupňov, je čoraz obľúbenejšia.
Skener dokumentov pre rýchle a kvalitné spracovanie
Najefektívnejšia, najrýchlejšia a najkvalitnejšia digitalizácia sa dosahuje pomocou skenerov dokumentov, ak je súbor, ktorý sa má spracovať, v hárkoch alebo sa dá vyrovnať na hárky. Skenery dokážu naskenovať obe strany dokumentov formátu A3+ (do šírky 30,7 cm) vysokou rýchlosťou a zároveň vytvárať vysokokvalitné obrázky. Systém valcov skenera a technika podávania listov sú mimoriadne šetrné, takže aj nekvalitné, roztrhané, natrhnuté alebo dokonca silno zožltnuté listy možno spracovať veľmi bezpečne; skenovanie papiera s tenkou membránou taktiež nepredstavuje žiadny problém. Výstupné formáty sú tiež flexibilné, od čiernobieleho skenovania s rozlíšením 200 DPI až po nekomprimovaný formát TIFF s rozlíšením 600 DPI. Dĺžka dokumentov taktiež nie je obmedzená, môžu dosiahnuť dĺžku až 1 metra.
Často sa nám stáva, že v prílohách dostávame veľmi rozsiahle dokumenty (mapy, grafy, umelecké reprodukcie). Tieto dokumenty si vyžadujú veľkoformátový skener s veľmi jemným valčekovým systémom a šetrným systémom osvetlenia.
Spracúvanie pomocou rozpoznávania textu (OCR)
Ďalším krokom pri spracúvaní tlačených dokumentov je tzv. rozpoznávanie textu (skratka po anglicky: OCR), pri ktorom sa obrázok prevedie na text. Účinnosť a presnosť dnes používaného softvéru je veľmi vysoká, dokonca aj tlače z 19. storočia dokážu rozpoznať text s presnosťou 98-99 % a v prípade kvalitných tlačí to môže byť až 99,5 %. Výsledkom automatického rozpoznávania textu je takzvaný dvojvrstvový súbor PDF, ktorého vrchnú vrstvu tvorí naskenovaný obrázok a spodnú vrstvu text. Takto používateľ vidí autentický obrázok, zatiaľ čo vyhľadávanie sa vykonáva v texte.
Dvojvrstvové súbory PDF pre rýchle a podrobné vyhľadávanie
Dvojvrstvové súbory PDF obsahujú záložky, ktoré môžu obsahovať názov článku, meno autora, dátum vydania, rok alebo dokonca názov kapitoly knihy. Výsledný štandardný dvojvrstvový súbor PDF je vhodný na publikovanie na internete.
Na publikovanie dvojvrstvových súborov PDF používame vlastný softvér, ktorý umožňuje sofistikované, vysokorýchlostné celotextové vyhľadávanie, prechádzanie medzi vyhľadávanými výrazmi, zobrazovanie a zvýrazňovanie výsledkov. Okrem logických operátorov (AND, OR, NOT) môžete počas vyhľadávania použiť aj operátory blízkosti (dve alebo viac slov, ktoré sa nachádzajú vedľa seba) alebo skrátiť hľadané slovo buď sprava, zľava alebo vnútri výrazu. Na zobrazenie stránok PDF používame vlastný program. Tento program dokáže rýchlo a efektívne prezentovať stránky PDF, zvýrazňovať výsledky, škálovať a sťahovať stránky.
Technológia výroby a nástroje, ktoré sme vyvinuli, dokážu digitalizovať dokumenty akéhokoľvek typu, akejkoľvek veľkosti a kvality, rozpoznať text a publikovať výsledné dvojvrstvové súbory PDF na internete pomocou rýchleho a sofistikovaného systému vyhľadávania a zobrazovania.
Vyskúšajte tu
Stovky vedeckých časopisov, úradných časopisov, dennej tlače, týždenníkov a kníh v maďarskom jazyku s približne 4-5 miliónmi nových strán pridaných ročne.
Stovky vedeckých časopisov, úradných časopisov, dennej tlače, týždenníkov a kníh v maďarskom jazyku s približne 4-5 miliónmi nových strán pridaných ročne.