PDF/A - Oder: wem gehört mein Dokument?

PDFs stehen im Mittelpunkt vieler Langzeitarchive und dienen zugleich als Arbeitsgrunde für viele unserer heutigen digitalen Prozesse. Sie sind auch der Dreh- und Angelpunkt beim Arbeiten mit Steuerdokumenten im TaxViewer.

Werden die Dokumente von der eigenen Fachanwendung generiert, durch ein angeschlossenes Scan-Center digitalisiert oder bei einer e-Einreiche produziert hat jede Steuerbehörde die Wahl des Formats. Hier bieten sich die PDF/A-Formate in ihren unterschiedlichen Versionen an. Bereits das Urgestein bietet optimale Kompatibilität und erlaubt die uneingeschränkte Weiterverwendung in allen folgenden Prozessen.

Spätere Versionen PDF/A-2 oder -3 führen vor allem Speicherplatz-schonendere Kompressionsverfahren und flexiblere Einbettung von Zusatzinformationen ein. Dies jeweils ohne das ursprüngliche Versprechen der Langzeittauglichkeit zu brechen.

Eingangsdokumente

Aber was ist, wenn die PDFs wie bei einer e-Steuererklärung direkt vom Kunden kommen? Aus Sicht des Archivs ergibt sich ein schwieriger Spagat:

  • Einerseits sollen die Dokumente so archiviert werden, wie sie vom Kunden (das heisst hier: Steuerpflichtigen, Treuhänder etc.) eingereicht wurden.
  • Andererseits können die Formate vielfältig sein. Selbst wenn die Einreiche von Belegen auf PDFs beschränkt bleibt, können diese aus unterschiedlichen Gründen ungeeignet sein:
    • PDFs, die nicht dem PDF/A-Standard genügen, können schädliche Inhalte transportieren, wie in etwa auch von den Microsoft Office-Formaten leidlich bekannt.
    • Insbesondere ungünstig digitalisierte Belege sind oftmals schlecht komprimiert oder aus anderen Gründen riessig. Mit dem heimischen Fotoscanner eingelesene Belege haben oftmals 30 Megabyte pro Seite - ohne wesentlich besser zu lesen zu sein, als 60 Kilobyte-PDFs von einem professionellem Dokumentscanner.
    • Aber was im Alltag besonders häufig vorkommt, sind solche Dokumente, die mit Massnahmen des Digital Rights Management (DRM) versehen sind.

Schädliche Dokumente sind zurückzuweisen, übergrosse Dokumente spätestens für die Weiterverwendung am Arbeitsplatz zu komprimieren (oder ebenfalls zurückzuweisen). Aber was ist mit solchen Dokumente, die künstlich mit DRM-Massnahmen verschlechtert wurden? Das eingereichte Dokument liegt zwar bei der jeweiligen Steuerbehörde im Archiv, gehört ihr aber wie es scheint nicht wirklich.

DRM

Das digitale Rechte-Management ist ein euphemistisch bezeichnetes Konstrukt, welches vor allem das Entziehen von Rechten digital abbildet. Ein Brief auf Papier, welcher dem eigenen Steueramt zugestellt wurde, kann dort von jeher unproblematisch gesichtet, kopiert, archiviert und für alle der Steuererhebung nötigen Prozessschritte genutzt werden.

PDFs, welche dem PDF/A-Format gerecht werden, stellen dies ebenso bei digitalen Belegen sicher. Leider beobachten wir aber im Alltag, dass insbesondere Banken, aber auch andere Institutionen, das Eigentum auch von Kundendokumenten nur nicht abtreten wollen.

Bankbelege sind in der Schweiz und andernorts leider notorisch mit DRM-Funktionen durchsetzt und damit nur schwerlich Archiv-konform aufzubewahren oder weiterzunutzen.

Dateien prüfen

Eingehenden Dokumente und andere die Probleme bereiten, können dabei leicht überprüft werden. Viele PDF-Betrachter und auch der TaxViewer stellen dazu Werkzeuge bereit.

In folgendem Beispiel eines Bankdokuments kommt das Kommandozeilenwerkzeug pdfinfo aus der wichtigen Werkzeugsammlung beziehungsweise Bibliothek Poppler zum Einsatz:

pdfinfo Statement20201230.pdf
Title:          PRO Document
Subject:        
Author:         Pro API
Creator:        PRO HLCAPI
Producer:       CrawfordTech PDF Driver Version 4.5 64 Bit Build ID 5620 on June 01, 2017 at 20:01:15
CreationDate:   Tue Jan  5 23:51:47 2021 CET
ModDate:        Tue Jan  5 23:51:47 2021 CET
Tagged:         no
UserProperties: no
Suspects:       no
Form:           none
JavaScript:     no
Pages:          2
Encrypted:      yes (print:yes copy:yes change:no addNotes:no algorithm:RC4)
Page size:      595.2 x 841.68 pts (A4)
Page rot:       0
File size:      496417 bytes
Optimized:      no
PDF version:    1.4

Die hier entscheidenden Zeile ist diese:

Encrypted:      yes (print:yes copy:yes change:no addNotes:no algorithm:RC4)

Dieses Beispiel ist einerseits traurig, könnte aber noch schlimmer sein:

  • Die Bank, welche dem Kunden dieses Dokument zugestellt hat, ist nicht der Meinung, dass es dem Kunden gehört, es ist verschlüsselt und seine Verwendung wurde eingeschränkt.
  • Immerhin: Das Kopieren von Inhalten ist erlaubt (copy:yes). Solche PDFs „erlauben“ es generös, Inhalte für die Weiterverwendung zu entnehmen und Seiten zu extrahieren. Dies ist leider keinesfalls die Regel.

Ist das Dokument mit einer Kopiersperre im Sinne des PDF-DRMs versehen, sind viele Prozesse zur Weiterverarbeitung erschwert beziehungsweise verunmöglicht. Dazu zählen die Reproduktion von Teildokumente, die Annotation oder das Erstellen von geeigneten Vorschauformaten.

Digitale Signatur vs. Verschlüsselung/DRM

Verschlüsselte PDFs dürfen nicht mit solchen verwechselt werden, welche digital signiert wurden: Digitale Signaturen bestätigen über ein kryptografisches Verfahren, dass ein Dokument unverändert ist und gibt allenfalls Auskunft über den Urheber der Signatur sowie den Signaturzeitpunkt. Das Dokument kann danach immer noch frei verwendet und auch verändert werden, allerdings eben nicht unbemerkt.

DRM hingegen schränkt den Nutzen eines Dokuments ein, ohne aber dessen Echtheit in irgend einer relevanten Weise zu schützen oder gar zu garantieren.

Die Wirksamkeit von DRM

Aber wir können das Dokument sehen, sein Inhalt ist nicht wirklich verschlüsselt.

Richtig. Bankbelege und andere DRM-lastige PDFs sind in der Regel am Bildschirm anzeigbar. Es ist lediglich eine Sache der Vereinbarung des PDF-Standards, dass solche Dokumente dennoch einer Reihe anderer DRM-Einschränkungen unterliegen können. An diese und andere Formvorgaben hält sich PDF-verarbeitende Software in der Regel: Genauso, wie an das Seitenformat, die gewählten Schriftarten etc.

Es kann nicht im Interesse der Anwenderschaft liegen, das Format zu brechen und gleichsam nicht im Interesse der Behörden und Unternehmen mit Archiven liegen, sich um derartige künstliche Einschränkungen überhaupt Gedanken machen zu müssen.

Was tun?

Eigentlich gibt es nur diese drei Varianten mit dem Thema umzugehen:

  • PDFs können nach dem Eingang manipuliert werden, um dem PDF/A-Standard zu entsprechen. Dabei wird das von den Banken oder anderen Akteuren erzeugte DRM bewusst umgangen und das Archivgut nach dessen Erhalt verändert, was in mehrerlei Hinsicht schwierig ist (technisch, rechtlich).
  • Die Annahme von solchen PDFs könnte verweigert werden.
  • Die Beleg-erzeugenden Stellen könnten auf DRM und ähnliche Schikanen verzichten.

Einen Kompromiss könnte dabei der Einreicheprozess selbst anbieten: Dokumente, die nicht PDF/A-konform sind wären dabei Software-seitig noch vor der Übermittlung für den Nutzer zu konvertieren und das Ergebnis dem Steuerpflichtigen zur Bestätigung vorzulegen:

Ein so erzeugtes Dokument könnte wohl wieder als digitales Original bezeichnet werden, da es von einreichender Seite erst nach der Bestätigung des Inhalts zum eigentlichen Upload gegeben wird.

2 „Gefällt mir“