PDF/A - Hilfe bei der sicheren Langzeitarchivierung

Von admin

Bisher wurde die Langzeitarchivierung im Wesentlichen durch das Tagged Image File Format (TIFF) bestimmt, viele Unternehmen setzen aber bereits heute auf den de-facto-Standard PDF. Hintergrund ist die Anforderung, auf die in Dokumenten enthaltenen Informationen über viele Jahre hinweg zugreifen zu können – ohne dafür die jeweiligen Applikationen (bspw. eine bestimmte Version von Microsoft Word) und Infrastruktur (bspw. eine bestimmte Betriebssystemvariante) vorhalten zu müssen. TIFF als Bilddatenformat garantiert hier die langfristige Anzeigbarkeit der Informationen – die Verwertung ist allerdings eingeschränkt. Ein direkter Zugriff auf Textelemente um diese weiter zu verarbeiten ist nur über Hilfsmittel (Volltextanalyse) möglich.

PDF geht über diese grafische Kopie der Inhalte hinaus, indem weitere Informationen wie Textextraktion, Sicherung von Inhalten oder Einbinden von Multimedia-Inhalten angeboten werden. Allerdings wurde der Industriestandard PDF von Adobe Systems etabliert, was für viele Unternehmen die Frage einer echten langfristigen Lesbarkeit aufwirft, da der Hersteller Spezifikationen ändern könnte. Auf der anderen Seite sind eine bildgetreue Reproduzierbarkeit des Originals nicht (immer) gegeben und die Sperrung oder das Einbindung von bestimmten zusätzlichen Objekten setzen Fragezeichen hinter den langfristigen Zugriff auf die Inhalte.

Um diesen Kritikpunkte zu begegnen schlossen sich die Association for Information and Image Management (AIIM) (heute: AIIM – The Enterprise Content Management Association), der National Printing Equipment Association (NPES) sowie der Verwaltung der US Gerichte in den USA Hersteller und Anwender zusammen um einen herstellerunabhängigen Standard für die langfristige Archivierung zu entwickeln. In Kooperation mit der Internationalen Organisation für Standardisierung (ISO) ist am 28. September 2005 vom für Anwendungen im Bereich Dokumentenmanagement zuständigen technischen Komitee TC 171 (Document Managment Application) die ISO 19005-1:2005 PDF/A verabschiedet worden, welcher die vollständigen technischen Spezifikationen enthält, beispielsweise Farbpaletten und das zu nutzende Speicherformat für Metadaten. Allgemein wird in der ISO 19005-1 das Ziel formuliert, mit PDF/A "ein Dateiformat basierend auf PDF, genannt PDF/A, welches einen Mechanismus zur Verfügung stellt, um elektronische Dokumente auf eine Weise darzustellen, so dass das visuelle Erscheinungsbild über die Zeit erhalten bleibt, unabhängig von den Werkzeugen und Systemen zur Herstellung, Speicherung und Reproduktion" verfügbar zu machen.

Dies bedeutet aber auch, dass verschiedene im Adobe Acrobat verfügbare Funktionen nicht unterstützt werden dürfen. Um die exakte Abbildung der Originaldokumente zu gewährleisten, werden neben den Inhalten alle Schriften, Farben, eingebettete Bilder sowie die Darstellungsstruktur (Absätze, Zeilenabstand etc.) werden 1:1 abgebildet, ohne dass eine Verbindung zum Original bzw. dem Erstellungssystem notwendig ist.

Was heißt das für Unternehmen?

Vorteile sind, dass

  • eine hohe Verbreitung des Standards anzunehmen ist
  • die Erstellung der Dokumente durch Plug-Ins in viele Applikationen hineinwachsen wird zu geringen Kosten oder vollständig gratis
  • auf Inhalte und eingebettete Metadaten zugegriffen werden kann.

 

Allerdings gilt es zu beachten, dass

  • der käuflich zu erwerbende Standard mehr als 1000 Seiten technischer Beschreibungen und Spezifikationen umfasst
  • auch PDF/A allein keine Langzeitarchivierung garantiert – auch hier müssen organisatorische und technische Maßnahmen zum Schutz der Dokumente vor Manipulation und Verlust notwendig sein
  • bestimmte Funktionen durch den Standard ausgeschlossen sind, insbesondere das Sperren von Funktionen – die Einsatzformen von PDF im Unternehmen müssen also überdacht werden

Auch PDF/A ist „nur“ ein mächtiges Werkzeug – der Erfolg zeigt sich in der gezielten Anwendung.

Tags: Allgemein - Alle Artikel in der Übersicht, Archivierung