Digitalisierung

Bei der Digitalisierung von Zeitschriften und Büchern setzen wir je nach Qualität und Umfang der Bände unterschiedliche Scanner ein.

Roboterscanner für wertvolle, einzigartige Kopien

Besonders wertvolle Unikate werden mit einem so genannten Roboterscanner digitalisiert, der es erlaubt, das Buch nur um 90 Grad zu öffnen, um eine Beschädigung des Einbands zu vermeiden. Der Roboterscanner arbeitet mit 2 hochauflösenden Kameras, die sehr hochwertige Bilder mit einer Auflösung von bis zu 400 DPI im TIFF- oder JPG-Format erzeugen. Das Spannprisma ist sehr schonend, das Umblättern der Seiten erfolgt typischerweise im halbautomatischen Modus.

Roboterscanner für wertvolle, einzigartige Kopien

Verwendung eines Buchscanners für großformatige Kopien

Große Dokumente (größer als A3) werden mit einem so genannten Buchscanner digitalisiert, wobei eine Seite bis zu A2 groß sein kann. Durch die scannende Beleuchtung und das Scannen entsteht ein sehr hochwertiges Bild, und die Variante, bei der die Bände nicht um 180 Grad geöffnet werden müssen, setzt sich immer mehr durch.

Verwendung eines Buchscanners für großformatige Kopien

Mit einem Dokumentenscanner für Geschwindigkeit und Qualität

Die effizienteste, schnellste und qualitativ hochwertigste Digitalisierung wird mit Dokumentenscannern erreicht, wenn die zu verarbeitende Datei aus Blättern besteht oder in Blätter auseinander getrennt werden kann. Die Scanner können beide Seiten von Dokumenten im Format A3+ (max. 30,7 cm breit) mit hoher Geschwindigkeit gleichzeitig scannen, um qualitativ hochwertige Bilder zu erzeugen. Das Rollensystem und die Bogenzuführungstechnik der Scanner sind äußerst schonend, sodass selbst minderwertige, fragmentierte, eingerissene oder sogar stark säurehaltige Blätter mit großer Sicherheit verarbeitet werden können und auch das Scannen hauchdünner Durchschlagpapiere kein Problem darstellt. Auch die Ausgabeformate sind flexibel und reichen von 200 DPI beim Schwarzweiß-Scannen bis zu 600 DPI beim unkomprimierten TIFF-Format. Auch der Länge der Dokumente sind keine Grenzen gesetzt, sie können bis zu 1 Meter lang sein.

Mit einem Dokumentenscanner für Geschwindigkeit und Qualität

Es kommt häufig vor, dass wir als Anhänge auf sehr große Dokumente stoßen (Karten, Tabellen, künstlerische Reproduktionen). Diese Dokumente erfordern einen Großformatscanner mit einem sehr schonenden Rollensystem und einem zerstörungsfreien Beleuchtungssystem.

Verarbeitung mit Texterkennung (OCR)

Der nächste Schritt bei der Verarbeitung von gedruckten Dokumenten ist die so genannte Texterkennung (mit englischer Abkürzung OCR), bei der das Bild in Text umgewandelt wird. Die heute eingesetzte Software ist sehr effizient und genau, selbst Drucke aus dem 19. Jahrhundert können Text mit einer Genauigkeit von 98-99 % erkennen, bei hochwertigen Drucken sogar bis zu 99,5 %. Das Ergebnis der automatischen Texterkennung ist das so genannte zweischichtige PDF, mit dem gescannten Bild als obere Schicht und dem Text als untere Schicht. Auf diese Weise sieht der Benutzer das authentische Bild, während die Suche auf dem Text basiert.

Ein Beispiel für Texterkennung (OCR).

Zweischichtige PDFs für eine schnelle und detaillierte Suche

Im zweischichtigen PDF werden Lesezeichen gesetzt, bei denen es sich um den Titel des Artikels, den Autor, das Datum der jeweiligen Ausgabe, das Jahr oder sogar den Titel der Kapitel eines Buches handeln kann. Das daraus resultierende zweischichtige Standard-PDF eignet sich für die Veröffentlichung im Internet.

Für die Veröffentlichung der zweischichtigen PDF-Dateien verwenden wir eine proprietäre Software, die eine ausgefeilte, schnelle Volltextsuche, das Blättern zwischen Suchbegriffen sowie die Anzeige und Hervorhebung von Ergebnissen ermöglicht. Zusätzlich zu den logischen Operatoren (AND, OR, NOT) können wir auch Näherungsoperatoren (zwei oder mehr Wörter nebeneinander) verwenden oder unser Suchwort kürzen, entweder von rechts, von links oder innerhalb des Wortes. Für die Darstellung der PDF-Seiten nutzen wir ein eigens entwickeltes Programm. Es kann PDF-Seiten schnell und effizient präsentieren, Ergebnisse hervorheben, Seiten skalieren, herunterladen.

Das von uns entwickelte Produktionstechnologie- und Werkzeugsystem ist in der Lage, Dokumente jeder Art, Größe und Qualität zu digitalisieren, Text zu erkennen und die so erstellten zweischichtigen PDFs mithilfe eines schnellen und ausgefeilten Such- und Anzeigesystems im Internet zu veröffentlichen.

Sie können es hier testen

Hunderte gedruckte wissenschaftliche Zeitschriften, offizielle Zeitungen, Tageszeitungen, Wochenzeitungen und Bücher in ungarischer, rumänischer, tschechischer und slowakischer Sprache, mit mehr als 10 Millionen neuen Seiten pro Jahr.

Testen
Sie können es hier testen

Hunderte gedruckte wissenschaftliche Zeitschriften, offizielle Zeitungen, Tageszeitungen, Wochenzeitungen und Bücher in ungarischer, rumänischer, tschechischer und slowakischer Sprache, mit mehr als 10 Millionen neuen Seiten pro Jahr.

Testen

Arcanum logo

Arcanum is an online publisher that creates massive structured databases of digitized cultural contents.

Über uns Kontakt Press room

Languages