Page 44

BIT 06-2014

Geschäftsprozesse PDF-Formate 44 | BIT 6–2014 PDF Tools: Hohe Bildqualität bei geringer Datenmenge Vom Scan zur Information Mit einem zentralen Scan-Server-Dienst lassen sich große Mengen von Papierdokumenten elegant in elektronische Dokumente umwandeln, für die Weiterverarbeitung auf - be reiten und im Langzeitarchiv ablegen. Ein Scan-Server, wie ihn die PDF Tools AG mit dem „3-Heights Scan to PDF Server“ anbietet, wandelt gescannte Dateien und dazugehörige Indexdateien in das standardisierte Dateiformat PDF/A um. Papier hat im Zeitalter von E-Rechnung, Online-Schalter und E-Commerce keineswegs ausgedient: Dokumente wie Rechnungen, Steuerformulare, Service-Berichte und Verträge werden nach wie vor oft auf Papier ausgefertigt, per Post verschickt und auf dem Postweg entgegengenommen. Spätestens innerhalb der Unternehmens oder Behördengrenzen sind ITSysteme für die Verarbeitung der Informationen zuständig – was auf dem Papier steht, muss eingescannt, in maschinenlesbarer Form aufbereitet, gespeichert und archiviert werden. Gescannt wird typischerweise direkt in den Fachabteilungen mit Multifunktionsgeräten (MFP mit zusätzlicher Druck- und Faxfunktion) oder zentral mit Hochleistungs-Scannern. Scans fallen in den meisten Unternehmen an verschiedenen Stellen an: Am zentralen Eingang im Postbüro, an Scan-Stationen in den Abteilungen sowie auf Mobilgeräten, z. B. beim Kundenbesuch im Außendienst. Auch empfangene Faxmeldungen sind nichts anderes als gescannte Bildinformationen. Vom Bild zum standar - disierten Dokument Beim Scannen entsteht zunächst immer ein Faksimile in Form einer Bilddatei. Dabei kommen Rasterformate wie TIFF und JPEG zum Einsatz. Ein Rasterdokument ist jedoch bloß ein Abbild ohne Zusatzinformationen. Texte sowie in Barcodes enthaltene Informationen müssen nach dem Scannen durch Texterkennung (OCR, Optical Character Recognition) aus dem Bild extrahiert werden. Idealerweise werden Text und Bilddarstellung danach gemeinsam im gleichen Dokument gespeichert. Dies vereinfacht die Ablage und sichert sowohl das Erscheinungsbild als auch den Informations - gehalt des Ursprungsdokuments. Als Format für die standardisierte Ablage und für die Langzeitarchivierung gescannter wie auch elektronisch erzeugter Dokumente hat sich PDF/A etabliert. Der PDF/A-Standard unterstützt die gewünschte Speicherung von Bild- und Textinformationen im gleichen Dokument. Die Dokumente sind damit per Volltextsuche durchsuchbar. Für die Bildinformationen arbeitet PDF/A mit leistungsfähigen Kompressionsverfahren. Dadurch verringert sich die ursprüngliche Dateigröße ohne Informationsverlust massiv. Dies fällt besonders ins Gewicht, wenn neben Schwarzweiß- auch Farbbilder enthalten sind und die Farbinformationen für die weitere Nutzung erhalten werden sollen. Zusätzlich erlaubt PDF/A, Metadaten wie beispielsweise Klassifizierungsinformationen direkt im Dokument zu speichern – hierbei kommt das XMPFormat (Extensible Metadata Platform) zum Zug, das wie PDF/A als eigener ISO-Standard definiert ist. Eine weitere Möglichkeit von PDF/A ist die digitale Signierung, um die Authentizität der Dokumente und die Integrität der Inhalte zu gewährleisten. Insgesamt bietet PDF/A die Sicherheit eines internationalen, funktional umfassenden und auf langfristige Stabilität ausgerichteten Dokumentenstandards. Dezentral scannen, zentral verarbeiten Das eigentliche Scannen stellt keine hohen Leistungsanforderungen an die Hardware und Software. Im Prinzip lassen sich „Scans“ bereits mit einer einfachen Digitalkamera erzeugen. Die darauf folgenden Bearbeitungsschritte verlangen deutlich mehr an Rechenleistung und Intelligenz. Bildkompression, OCR und Konversion zu PDF/A sind relativ aufwändige Vorgänge. Zumal es dabei zwei gegenläufige Bedürfnisse zu berücksichtigen gilt: Die zuverlässige Texterkennung setzt eine möglichst hohe Bildqualität voraus. PDF Tools Die PDF Tools AG ist ein Hersteller von Software-Lösungen und Programmierkomponenten für die PDF- und PDF/A-Erzeugung, Bearbeitung, Wiedergabe und Archivierung. (www.pdf-tools.com) Nadine Schuppisser von der PDF Tools AG: „Ein zentraler Scan-Server bietet sich als effiziente und vielseitige Lösung an, wenn große Volumen an gescannten Dokumenten aus verschiedenen Quellen verarbeitet werden sollen.“


BIT 06-2014
To see the actual publication please follow the link above