PDF-Dokumente – lesbar für Alle: Teil 3

Tags: ,

Autor: rh

Welche Schritte erfordert das Umwandeln vorhandener PDF-Dateien?

Bildschirmausdruck Acrobat 6 schnelle ZugriffsprüfungHäufig sollen vorhandene PDF-Dokumente zugänglich gemacht werden. Wenn die Quell-Dokumente nicht zur Verfügung stehen, benötigt man auf jeden Fall ein Acrobat 5 oder 6 zum Prüfen und ändern dieser Dateien.

Beispiel mit Acrobat 6.0 Professional:

Nach dem Öffnen der PDF-Datei kann direkt eine Zugriffsprüfung erfolgen. Dabei bietet Acrobat eine Schnellprüfung und eine ausführliche Analyse inkl. Erstellung eines Berichtes an.

Ein mögliches Ergebnis könnte folgendermaßen lauten:

Bildschirmausdruck Acrobat 6-Dialog mit Ergebnis der schnellen Zugriffsprüfung: Das Dokument ist nicht strukturiert

Ist das Dokument nicht strukturiert, sollte man eine vollständige Prüfung durchlaufen lassen, um den Umfang der erforderlichen »Reparaturmaßnahmen« festzustellen. Zu der vollständigen Prüfung können bestimmte Parameter im Vorfeld gesetzt werden. Die Standardeinstellung sieht folgendermaßen aus:

Bildschirmausdruck Acrobat 6-Dialog zur vollständigen Zugriffsprüfung

Je nach Anforderungsprofil können auch Bedingungen deaktiviert werden. Eine komplette Barrierefreiheit erfordert allerdings auch die Erfüllung aller aufgeführten Bedingungen.

Die Prüfung dauert je nach Umfang des Dokumentes und Rechnerausstattung in der Regel weniger als eine Minute. Die Zusammenfassung des Ergebnisses erscheint danach sofort auf dem Bildschirm:

Bildschirmausdruck Acrobat 6 Ergebnis der vollständigen Zugriffsprüfung

In diesem Fall fehlt die gesamte Strukturinformation, d. h. ein Inhaltsverzeichnis in Form von Lesezeichen, Überschriften, Alternativtexte zu Bildern, die verwendete Sprache etc.

Bildschirmausdruck Acrobat 6-Dokument mit automatisch erzeugtem Tag-StammDas bedeutet, die Erstellung von Lesezeichen für die Navigation, sowie die Erstellung von Tags für die korrekte Lesereihenfolge sind unerlässlich.

Acrobat bietet die automatische Erzeugung eines »Tag-Stammes« an. Dabei werden alle vorhandenen Elemente mit einzelnen Tags versehen und – wenn möglich – eine hierarchische Struktur generiert. Das Ergebnis ist häufig nicht befriedigend (zu starke Differenzierung und zu viele Tags, keine sinnvollen Bezeichnungen etc.).

Die manuelle Erstellung sinnvoller Tags und Lesezeichen ist zu empfehlen. Näheres unter Punkt 10.

Bildschirmausdruck Acrobat 6 manuelles Einfügen von LesezeichenDas manuelle Positionieren und Erzeugen von Lesezeichen erfolgt ganz einfach, indem man an der entsprechenden Stelle im Dokument die Funktion »Bearbeiten« / »Lesezeichen hinzufügen« aufruft. Im geöffneten »Lesezeichen«-Fenster auf der linken Seite kann dann der Eintrag im Inhaltsverzeichnis bearbeitet werden. Selbstverständlich ist hier auch die Erstellung und Änderung hierarchischer Strukturen möglich.

Wie kann man gedruckte Unterlagen in zugängliche PDFs umwandeln?

Gedruckte Unterlagen müssen über einen Scanner digitalisiert werden. Dabei ist zu beachten, dass die Auflösung mindestens 300 dpi haben sollte, d. h. man benötigt für eine DIN A4-Seite in Farbe ca. 25 MB Speicherplatz! Sehr vorteilhaft ist es, gleich mit einer OCR-Schrifterkennungssoftware zu arbeiten, da ansonsten lediglich ein Bild vom Text erzeugt wird, das auch nach der Umwandlung in PDF nicht zugänglich sein kann. Die aktuellen Softwareprodukte für OCR-Schrifterkennung, wie z. B. »FineReader 7.0« von ABBYY, »OmniPage Pro 12« von Global Graphics oder »AdobeAcrobat Capture 3.0« haben eine sehr hohe Trefferquote bei der Schrifterkennung. Die Vorteile liegen auf der Hand:

  • automatische Trennung von Text und Grafik
  • Editier- bzw. Nachbearbeitungsmöglichkeit in einer Textverarbeitung, z. B. MS Word
  • Ergänzen von Strukturen über Formatvorlagen
  • saubere, strukturierte PDF-Erstellung analog eigener Textdokumente
  • deutliche Reduzierung der Dateigröße im PDF-Format

Die Frage der Dateigröße ist gerade im Internet nicht zu unterschätzen. Nimmt man ein DIN A4-Scan in 300 dpi, bekommt man im TIF-Format eine Datei von ca. 25 MB. Diese Datei ist nach Umwandlung in PDF immer noch ca. 2 MB groß! Bei Verwendung einer OCR-Schrifterkennung reduziert sich die Dateigröße im PDF auf ca. 0,1 MB = 5%!

Adobe Acrobat bietet auch eine nachträgliche Schrifterkennung innerhalb einer eingescannten und in PDF umgewandelten Datei an. Dabei ist zu beachten, dass zwar eine technische Lesbarkeit erzeugt wird, die Dateigröße aber nach wie vor für das Internet ungeeignet ist!

Hier ein Beispiel mit dem OCR-Programm »FineReader 7.0«:

Schritt 1

Einscannen über FineReader:

Bildschirmausdruck FineReader 7 mit frisch eingescanntem Dokument und automatischer OCR-Schrifterkennung

Schritt 2

Speichern im Word-Format und Bearbeitung in Word:

Bildschirmausdruck Word 2000 mit importiertem Dokument aus FineReader nach der OCR-Schrifterkennung

Im MS Word können evtl. fehlerhafte Textstellen korrigiert, Überschriften, Textelemente mit Formatvorlagen strukturiert und damit saubere PDFs erzeugt werden.

Schritt 3

Der PDFMaker erzeugt auf diese Weise eine sehr schlanke und strukturierte Datei. Je nach Umfang der Ergänzungen im MS Word sind mehr oder weniger Nachbearbeitungen im Acrobat nötig. Ein Tag-Stamm wird automatisch erzeugt und reicht zumindest von vornherein für eine korrekte Lesereihenfolge.

Bildschirmausdruck Acrobat 6 mit dem in Word überarbeiteten OCR-Dokument

Wie überarbeitet man einen Tag-Stamm mit Acrobat?

Unter Punkt 8 haben wir gesehen, wie die Zugriffsprüfung unter Acrobat funktioniert. Sollte ein Dokument als »unstrukturiert« eingestuft werden, fehlt in der Regel der Tag-Stamm. Dieser bildet die Struktur des Dokumentes mit allen Hierarchien und Elementen ab. Die Elemente können die Bezeichnung aus der Word-Formatvorlage bekommen.

Bildschimrausdruck Acrobat 6 mit Tag-Stamm

Beispiel einer einfachen Textstruktur mit 3 Überschriftenebenen und Artikeln

Bildschirmausdruck Acrobat 6 Tag-Eigenschaften

Durch die intuitiv zu bedienende Baumstruktur ist die Tag-Bearbeitung, sowie Erstellung neuer Tags sehr einfach. Klickt man mit der rechten Maustaste auf ein Tag, kann man unter »Eigenschaften« die Hierarchieebene ändern oder ein anderes Element zuweisen. Außerdem bietet Acrobat hier die Möglichkeit die Sprachkennzeichnung zu ändern oder z. B. bei Bildelementen Alternativtexte zu hinterlegen.

Bildschirmausdruck Acrobat 6 LesezeichenFür die Navigation innerhalb des Dokumentes ist es sinnvoll, Lesezeichen (Bookmarks) anzulegen. Wie bereits unter Punkt 7 erläutert, kann man im Word bereits definieren, welche Elemente (meistens Überschriften) automatisch zu Lesezeichen konvertiert werden sollen. Das Anlegen manueller Lesezeichen ist im Acrobat allerdings auch problemlos möglich. Sie bewegen sich im Dokument an die entsprechende Stelle, zu der Sie einen Link (als Lesezeichen) setzen möchten und wählen oberhalb der Lesezeichen die Funktion »Neues Lesezeichen erstellen«. Das neue Lesezeichen erscheint automatisch an letzter Stelle und kann mit der Maus an die richtige Stelle in der Baumstruktur verschoben werden.

Welche Rolle spielen die Sicherheitseinstellungen von Adobe Acrobat?

Zum Schutz der Autoren hat Adobe entsprechende Schutzmechanismen eingebaut. Viele Dokumente lassen sich ausschließlich betrachten und manchmal nicht einmal ausdrucken. Assistive Technologien sind jedoch darauf angewiesen, dass sie den Inhalt der PDF-Datei herauslesen, d. h. herauskopieren können. Das muss der Autor des Dokumentes zulassen, ansonsten kann man sich alle Bemühungen um barrierefreie Strukturen im Dokument schenken! In den Dokumenteigenschaften sind entsprechende Einstellmöglichkeiten vorhanden. Folgende Einstellung befriedigt sowohl die Schutzbedürfnisse des Urhebers, wie auch die Ansprüche eines Screenreaders:

Bildschirmausdruck Acrobat 6 Dokumenteigenschaften, speziell Sicherheitseinstellungen

Was ist bei der Erstellung zugänglicher Formulare zu beachten?

Wie auch bei den anderen Textdokumenten muss die Erstellung der Formulare in einem möglichst brauchbaren Editor vor der Umwandlung in PDF strukturiert erzeugt werden. Die spezielle Definition der Eingabefelder erfolgt dann im Acrobat-Programm. Je nach Art des Formulars kann es nötig sein, zu bestimmten Eingabefeldern Erläuterungen mitzuliefern. Auch für sehende Nutzer sind kontextbezogene Hilfestellungen einfacher zu handhaben, als womöglich zusätzliche »Merkblätter« zum Ausfüllen der Formulare. Wenn also diese Erläuterungen um die Eingabefelder angeordnet werden, werden sie durch den Screenreader vorgelesen. Besondere Beachtung muss man dann nur noch optischen Hinweisen in Form von farbigen Kodierungen oder Grafiken schenken. Dazu kann man im Acrobat entsprechende Alternativtexte hinterlegen, die dann ausschließlich vom Screenreader »gesehen« und damit vorgelesen werden können.

Haben Sie lediglich gedruckte Formulare vorliegen, können diese natürlich über die bereits beschriebene Prozedur via OCR-Schrifterkennung in PDF umgewandelt werden. Alle erforderlichen Tags für die Lesereihenfolge etc. werden dann im Acrobat ergänzt. Bitte beachten Sie die Rechte an den gedruckten Formularen, da sie häufig bei den entsprechenden Verlagen liegen.

Bildschirmausdruck Acrobat 6 Formular

Im Gegensatz zu HTML-Formularen ist es nicht empfehlenswert, Musterinhalte im Eingabefeld zu positionieren. Beim Ausfüllen der Felder werden nämlich diese Musterinhalte nicht etwa automatisch markiert und überschrieben, sondern bleiben evtl. zusätzlich zum neu erfassten Inhalt stehen.

Grundsätzlich kann man noch nicht davon ausgehen, dass interaktive Formulare – also zum Ausfüllen am Bildschirm – in Verbindung mit Screenreadern sauber funktionieren. Das Ansteuern eines Eingabefeldes z. B. mit der TAB-Taste bei gleichzeitigem Vorlesen der feldrelevanten Informationen erfordert entsprechende Programmfunktionen in der Screenreader-Software, die bisher ausschließlich bei »JAWS for Windows« befriedigend implementiert wurden.