Page 45

BIT 06-2014

BIT 6–2014 | 45 Damit steigt der Speicherbedarf. Für die Ablage wünscht man dagegen eine möglichst geringe Datenmenge. Software, die beide Ansprüche in Einklang bringen soll, stellt hohe Ansprüche an die Rechenleistung – vor allem dann, wenn ein großes Volumen an gescannten Dokumenten verarbeitet werden soll. Dazu kommt ein weiterer Aspekt: Für die Einbettung von Index-, Klassi - fizierungs- und anderen Metadaten sowie digitalen Signaturen werden oft Informationen von anderen Arbeitsstationen und aus verschiedenen IT-Systemen benötigt. Diese dezentral vorhandenen Daten müssen für die Erstellung des PDF/A-Dokuments zusammengeführt werden. Leistungsintensive Operationen Die Lösung für beide Probleme ist ein zentraler Scan-Server – ein Beispiel ist der „3-Heights Scan to PDF Server“ aus dem Hause PDF Tools AG. Er nimmt die eingescannten Bilddateien entgegen, analysiert die Dokumente und erzeugt ein PDF/A-Dokument mit allen Text- und Bildinformationen in jeweils passender Kompression. Optional markiert er das Dokument mit einem Zeitstempel oder einer digitalen Signatur. Die erfassten Informationen stehen damit sowohl für menschliche Leser als auch zur automatisierten Weiter - verarbeitung mit IT-Anwendungen in standardisierter, qualitativ hochwer - tiger Form zur Verfügung. Ein zentraler Scan-Server vereinfacht zusätzlich die Software-Verteilung und Wartung. Auf den Scan-Stationen muss keine umfassende Scan- Software mit integrierter OCR-Funktionalität einzeln ausgerollt, konfiguriert und gepflegt werden. Eine elementare Operator-Anwendung zur Bildakquisition genügt. Probleme bei den komplexeren Verarbeitungsschritten müssen nicht individuell an den Arbeitsplätzen gelöst werden. Stattdessen wird der Scan-Server-Dienst auf einer Testinfrastruktur implementiert, wo sich zuvice nimmt der Scan-Server Aufträge entgegen, die über eine webbasierte Anwendung erfasst wurden, und schickt die umgewandelten Dokumente an den Auftraggeber zurück. Der Scan-Server kann darüber hinaus weitere nützliche Aufgaben übernehmen, darunter die Validierung der erzeugten PDF/A-Dokumente auf Konformität mit dem ISO-Standard, das Markieren der Dokumente mit einem Wasserzeichen und die Kombination verschiedener Einzeldokumente, die zum gleichen Geschäftsfall gehören, zu einem Gesamtdokument. Ein zentraler Scan-Server bietet sich als effiziente und vielseitige Lösung an, wenn große Volumen an gescannten Dokumenten aus verschiedenen Quellen verarbeitet werden sollen. Er wandelt die gescannten Bilddaten in standardisierte, durchsuchbare PDF/ADokumente mit reichem Informationsgehalt auf, entlastet die Scan-Stationen von leistungsintensiven Verarbeitungsschritten, unterstützt die Einbindung weiterer IT-Systeme und hilft, einen unternehmensweit einheitlichen Dokumentenstandard einzuhalten. nächst alle Probleme analysieren und Fehler beheben lassen. Danach wird der Dienst in den produktiven Betrieb überführt. Damit sich der Scan-Server optimal an die jeweilige Umgebung anpassen und bei Bedarf durch Aufteilung auf verschiedene Rechner skalieren lässt, sind die Aufgaben beim „3-Heights Scan to PDF Server“ auf mehrere Subsysteme verteilt: • Der eigentliche Scan-Server nimmt Aufträge für die Konversion ins PDF/A-Format entgegen, delegiert die Texterkennung an den OCR-Server und kombiniert die OCR-Resultate, das gescannte Bild und die Metadaten zum fertigen PDF/A-Dokument. • Der OCR-Server nimmt vom Scan- Server Aufträge zur Erkennung von Texten und Barcodes entgegen, bereitet die Bildinformationen durch Operationen wie Geraderichten und Entfernen von Störungen für die bestmögliche Texterkennung auf, gliedert das Dokument in Text-, Barcode- und Bildbereiche und führt die Erkennung durch. Für dezentral erzeugte Scans bietet der Server zwei zusätzliche Dienste: Ein Watched-Folder-Service übermittelt alle Dateien, die in bestimmten Verzeichnissen abgelegt wurden, zur automatischen Weiterverarbeitung an den Scan-Server. Mithilfe eines Web-Ser- Der Scan-Server arbeitet als zentrale PDF/A-Aufbereitungsinstanz und verarbeitet Scans aus verschiedenen Quellen.


BIT 06-2014
To see the actual publication please follow the link above