Adatbázis építés, szoftverek


Az Arcanum Adatbázis Kiadó alapfilozófiája, hogy nagytömegű kulturális tartalmakat csak kereshető adatbázisba építve és a digitális világ által nyújtott plusz szolgáltatásokkal felvértezne van igazán értelme digitálisan publikálni. Ennek érdekében folyamatosan fejlesztjük adatbázis kezelő és megjelenítő szoftvereinket.

Folio Views

A program a kifinomult keresés mellett képes egyesíteni a fulltext adatbázisok hierarchikus szerkezetét a bibliográfiai adatbázisok mezőszerkezetével. Ugyanakkor a szokásos funkciókat (nyomtatás, vágólap, formázás, saját kereshető megjegyzések, könyvjelző, csoportképzés) igen jó színvonalon teljesíti. Megjelenésében pedig a mindenki számára ismerős, megszokott, szövegszerkesztőszerű környezetre hasonlít, így a programban még kevéssé járatos felhasználó is könnyen használatba veheti. A program fontosabb jellemzői:

  • nagy tömegű, teljes szövegű, könyvszerkezetű adatok strukturált kezelése
  • egyesíti a teljes szövegű adatbázisok hierarchikus szerkezetét a bibliográfiai adatbázisok mezőszerkezetével (XML szerkezet)
  • kifinomult, nagy sebességű keresés
  • táblázatok, képek, hang és videó kezelése
  • könyvjelző, saját megjegyzések, nyomtatás, szöveg átemelése szövegszerkesztőbe, exportálás
  • a felhasználó módosíthatja, testreszabhatja a megjelenést, sőt, még magát a dokumentumot is módosíthatja
  • helyi hálózatos felhasználás

Arcanum Map

Az elmúlt időszakban gyakorlatilag a teljes magyar történelmi térképállományt digitalizáltuk. A hatékony és színvonalas publikáláshoz egy saját fejlesztésű térinformatikai rendszert (Arcanum Map) használunk, amely kifejezetten a régi térképek által támasztott igényeket elégíti ki. A történelmi térképeket georeferáljuk, ezzel alkalmasakká válnak arra, hogy más térinformatikai rendszerbe illesszük azokat. Így lehetővé válik, hogy térképeinket más történeti térképekkel, vagy akár mai térképekkel vessük össze.

  • ™Igen nagy sebesség, akár több ezer szelvényt tartalmazó mozaikok gyors megjelenítése
  • ™Georeferált történelmi térképek geokódokkal való megjelenítése
  • ™Akár különböző vetületi rendszerű és méretű térképek szinkronizált megjelenítése
  • ™A mozaik mellett az eredeti szelvény megjelenítése duplikálás nélkül, így megjeleníthetjük a térképi tartalmon kívüli a fontos információt hordozó részeket is
  • ™Régi és mai vetületi rendszerek közötti konvertálás
  • ™Pozicionálás tetszőleges (földrajzi, vetületi, régi, mai) kordináta alapján
  • ™Konvertálás más formátumokba (GeoTIFF, JPEG2000), akár más vetületekbe
  • A program online és offline változattal is rendelkezik

Arcanum PDF keresőprogram

A tömeges szövegdigitalizálás egy új technológia az ún. kétrétegű PDF alkalmazásával lehetséges. Ennek segítségével immár szinte korlátlan mennyiségű dokumentumot tudunk publikálni. A világban egyre szélesebb körben terjedő technológia lényege, hogy az eredeti dokumentum (könyv, folyóirat, stb.) képként kerül digitalizálásra, azaz beszkenneljük, majd automatikus karakterfelismerő program (OCR) segítségével a képből szöveget állítunk elő. Az előállított dokumentum felső, látható rétegét a kép alkotja, az alsó, láthatatlan rétegét pedig a szöveg. A szöveg és a kép teljesen fedésben van egymással, a szavak, a betűk képe és alatta a szöveg milliméterre pontosan ugyanazon a helyen találhatók. A szöveg előállításának minősége még a régi (19. századi) dokumentumoknál is eléri a 98-99%-ot, jobb minőségű dokumentumoknál azt meg is haladja. Az így létrehozott állományok egyrészt alkalmasak a dokumentum hiteles megjelenítésére, hiszen az eredeti dokumentumot facsimilében látjuk, másrészt lehetővé teszik a szöveges kezelést, keresést is. Ez utóbbi legfontosabb eleme a teljes szövegű keresőrendszer, amely lehetővé teszi, hogy tetszőleges szóra, kifejezésre kereshessünk. A másik fontos eleme, hogy lehetőségünk van a szöveg kiemelésére, azt szövegszerkesztőnkbe beilleszthetjük, átemelhetjük.

A hatékony keresés érdekében kifejlesztettünk egy saját keresőprogramot, amely az ACROBAT program keresési funkcióinál lényegesen hatékonyabb, gyorsabb és megbízhatóbb keresést biztosít. Nagy előnye, hogy szemben az ACROBAT-tal, nemcsak lokálisan, hanem Interneten is működik, így lehetőségünk van az anyagunkat Interneten publikálni. Offline kiadványainkban a felhasználó választhat a két program között. A program online változata gyakorlatilag korlátlan méretű szöveges adatbázist képes villámgyoran kezelni.

  • ™Tetszőleges méretű (akár több millió oldalt tartalmazó) adatbázis kezelése
  • ™Igen nagy sebességű keresés, akár többszázezer találat egyetlen másodperc alatt
  • ™Csonkolás jobbról, balról, vagy akár a szó közepén
  • Betekintés a kereshető szavak közé, így már a keresés előtt tájékozódhatunk a lehetséges kereső kifejezésekről, azok előfordulási gyakoriságáról, az esetlegesen hibásan felismert szavakról ™
  • Logikai operátorok (AND, OR, NOT) mellett közelségi (pl. legyen két szó 2 szó távolságra) operátorok használata
  • Találatok kivilágítása, mind a találati listában, mind az eredeti dokumentumban
  • A könyvjelzők intelligens használata mind a keresésben, mind a megjelenítésben ™
  • Az adatbázis publikálása egyaránt történhet interneten, vagy offline módon (DVD, Blu-ray).