Arbeiten mit PDF-Dokumenten

15. November 2022 Ulf Bartholomäus Lesezeit: 7 Minuten 🗪 20 Kommentare

Täglich benutzt man sehr häufig PDF Dokumente. Diese liest man nicht nur, sondern will sie auch generieren, editieren, umformatieren, kommentieren oder ausfüllen.

Täglich benutzt man sehr häufig PDF Dokumente (Portable Document Format). Diese generiert man nicht nur, sondern will später verteilen, lesen, editieren, umformatieren, kommentieren, signieren oder gar Formulare z.B. von Behörden ausfüllen. Dabei gibt es in den meisten Distributionen je nach Desktop verschieden Programme, die mehr oder weniger die eigentlichen Bedürfnisse erfüllen. Am Beispiel des KDE/Plasma PDF Betrachters Okular, den ich für den aktuell leistungsfähigsten halte, möchte ich ein paar nicht immer bekannte Möglichkeiten aufzeigen.

PDF lesen, Lesezeichen erstellen und kommentieren

PDF lesen ist sicherlich nach dem Lesen von Chats, Social Media und Internetseiten einer der häufigsten Aufgaben, die man auf dem Smartphone und PC macht. Muss man viele Dokumente lesen, möchte man diese in der Regel auch wiederfinden. Hier hilft es, diese auch sinnvoll zu organisieren. Das geht zum einen mit speziellen Programmen oder mit einer sinnvollen Ordnerstruktur und Dateinamen auf dem Laufwerk. Kleiner Tipp: Vermeidet Leer- und Sonderzeichen und ersetzt sie durch Unterstrich "_" oder Bindestrich "-". Auch Datum und Uhrzeit sollten so angelegt werden, dass man gut nach dem Alter sortieren kann, in dem man nur alphabetisch sortiert. Also z.B. 2022-06-10_10-10 für den 10. Juni 2022 um 10:10 Uhr. Alternativ kann man insbesondere für PDF auch die eBook Management Software Calibre verwenden.

Beim Lesen von Dokumenten hat man öfter das Bedürfnis, bestimmte Stellen zu kennzeichnen, um sie wiederzufinden. Dazu bietet Okular die Möglichkeit Lesezeichen zu erstellen wie in einem richtigen Buch. Öffnet man später Okular, werden diese nach Dokument gegliedert angezeigt und man kann einfach dort Hinspringen. Zum Anlegen eines Lesezeichens klickt man z.B. in Okular mit der rechten Maustaste in den Text und wählt Lesezeichen erstellen. Anschliessend sollte man links in der Übersicht den Text so modifizieren, dass man sie auch wiederfinden kann.

Ab und an möchte man auch besonders wichtige Stellen markieren oder gar Kommentieren (also Text oder Notizen einfügen). Hier bietet Okular ebenfalls weitreichende Möglichkeiten, sofern man unter "Extras" - "Anmerkungen" bzw. alternativ "Einstellungen" - "Angezeigte Werkzeugleisten" - "Schnell-Anmerkungs-Werkzeugleiste" einschaltet, um Markierungen und Kommentierungen einzufügen. Wichtig dabei ist, dass man diese Kommentare mit dem PDF speichert, damit man sie später wieder sehen kann.

Tipp: Links im Okular befindet sich die sogenannte "Seitenleiste", die man unter "Einstellungen" ein und ausschalten kann. Ich habe sie wie im Bild oben immer eingeschaltet. Ganz links befindet sich der Reiter mit der grafischen Übersicht, rechts davon die Übersicht der Anmerkungen, der dritte Reiter ist für die Lesezeichen und der vierte Reiter für das Inhaltsverzeichnis reserviert, sofern dieses beim Erzeugen des Dokumentes angelegt wurde. In allen 4 Reitern könnt ihr nach entsprechenden Inhalten suchen (Feld unter dem Reiter Titel).

PDF Import und Export

Okular bietet die Möglichkeit nicht nur Dokumente PostScript (PS) Format zu lesen, sondern kann sie auch importieren und in PDF umwandeln lassen ("Datei" - "PostScript als PDF importieren ..."). Auch Export von Dokumenten in einfachen Text wird unterstützt. Wird ein eBook-Format verwendet, werden teilweise noch weitere Exportmöglichkeiten wie PDF, OpenDocument, Text und HTML unterstützt.

Daneben gibt es noch die Möglichkeit unter "Extras" entweder eine "Bereichsauswahl" (als Bild), "Textauswahl" (als Text) und sogar via "Tabellenauswahl" (als Tabelle) zu markieren und entweder in die Zwischenablage zu kopieren oder direkt abzuspeichern. Zwar benötigt das Speichern von komplexen Tabellen etwas Übung, gelingt dann aber recht gut.

PDF Formulare ausfüllen

Immer wieder heisst es, dass das Ausfüllen von Formularen unter Linux nicht zuverlässig funktionieren würde. Dem kann ich nicht zustimmen, da ich sowohl mit Acrobat Reader unter Windows als auch mit Okular Formulare ausfülle und das schon seit Jahren. Wichtig ist nur beim Öffnen die Nachfrage "Dieses Dokument enthält Formulare. Klicken Sie auf diesen Knopf, um sie zu verwenden, oder rufen Sie den Menüeintrag „Formulare anzeigen“ aus dem Menü „Ansicht“ auf" den Knopf "Formulare anzeigen" zu betätigen (siehe auch Abbildung oben). Erst dann kann man das Formular bearbeiten. Den Dialog kann man dann wieder schliessen.

Alternativ kann man PDFs teilweise auch mit LibreOffice und anderen Programmen laden und bearbeiten. Falls ein Passwort für die Verarbeitung vergeben wurde, wird man danach gefragt. Funktioniert es nicht wie gewünscht, kann man versuchen, die Beachtung des DRM Schutzes zu ignorieren (z.B. im Okular je nach Herkunft, in den Einstellungen verfügbar). Es gibt je nach Programm und Herkunft auch Programme/Programmvarianten, die es komplett ignorieren. Damit kann man dann Text sozusagen "über" das PDF schreiben und es dann wieder als PDF exportieren. Dieses wird dann nach aussen die gleiche Wirkung haben, wie ein ausgefülltes Formular.

Erweiterte Möglichkeiten

Als einer der wenigen PDF-Betrachter, sind die aktuellen Versionen von Okular in der Lage, PDF Dokumente zu signieren, und damit die Herkunft bzw. die Originaltreue eindeutig zu belegen. Dies ist insbesondere bei Dokumenten erforderlich, die später rechtsgültig sein müssen. Also z.B. Zertifikate, Verträge und einiges mehr. Eine Signatur kann man mit einer eindeutigen Unterschrift vergleichen. Dabei wird eine möglichst eindeutige Prüfsumme über das Dokument generiert und mit dem privaten Schlüssel versehen. Nun kann man mit dem idealerweise zentral verfügbaren oder verteilten öffentlichen Schlüssel entschlüsseln und mit der erneut erstellten Prüfsumme vergleichen. Stimmen beide überein, stammt das Dokument tatsächlich vom Eigentümer des privaten Schlüssels.

Tipps für die PDF-Erstellung

Möchte man PDF Dokumente erstellen, führen viele Wege nach Rom. Will heissen, es gibt sehr viele Programme, die PDFs direkt exportieren können. Auch gibt es die Möglichkeit einfach in ein PDF Dokument zu drucken (bei Linux im Druckdialog einfach in Datei speichern - diese wird automatisch im PDF Format gespeichert).

Besonders für Anwender von Officeprogrammen wie LibreOffice, ist es empfehlenswert, Überschriften einzufügen und beim Exportieren darauf zu achten, dass "Gliederung exportieren" aktiviert wird. Damit wird dann im PDF Betrachter ein Inhaltsverzeichnis erstellt, durch das man navigieren kann. Erstellt man am Anfang des Textes ein Inhaltsverzeichnis, werden dort auch die Einträge als anklickbar mit exportiert und erlauben eine schnelle Navigation im Dokument.

Mein persönlicher Tipp, wenn das PDF besonders gut werden soll (z.B. bei Thesis, Diplom- oder Doktorarbeiten) empfiehlt es sich, das Dokument mit TEX zu erstellen. Ich habe noch keine PDF-Dokumente von anderen Programmen gesehen, die diese Qualität nur annähernd erreichen.

PDF Bearbeitung

Muss man PDF Dateien bearbeiten, gibt es ebenfalls viele verschiedene Möglichkeiten. Eine davon ist es, die PDF-Datei in LibreOffice zu importieren und dort zu bearbeiten. Dieses sollte vielen, die schon mit einem Officeprogramm gearbeitet haben, vor kein grösseres Problem stellen. Das ist auch der Trick, wenn man ein PDF-Formular nicht richtig bearbeiten kann. Dann bearbeitet man es in LibreOffice und exportiert es wieder als PDF (bitte das Ergebnis noch mal kontrollieren, bevor man es weiter gibt).

Möchte man z.B. eingescannte Vorlagen umsortieren, Seiten einfügen oder entfernen, kann ich nur das PDF-Toolkit empfehlen. Es wird zwar in der Textkonsole bedient, aber es bearbeitet die Dokumente verlustfrei und ohne dass die Datei dabei unnötig grösser wird. Im Internet finden sich zahlreiche Seiten, die einem die entsprechende Syntax frei Haus liefern (siehe auch Artikel hier).

Möchte man Dokumente einfach in PDF umwandeln, hat sich ImageMagick convert als leistungsstarkes Werkzeug erwiesen. Auch dieses wird über die Textkonsole bedient, aber ist im Standardfall ganz einfach zu bedienen. So kann man eine JPG-Datei einfach in eine PDF-Datei mit diesem Befehl umwandeln: convert MeinBild.jpg MeinBild.pdf

Quellen:

PDF Betrachter Okular: https://okular.kde.org/de/

Office Suite LibreOffice: https://www.libreoffice.org/

PDF-Toolkit: https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/ (siehe auch: https://gnulinux.ch/pdf-bearbeiten)

TeX Textsatzsystem (Details beschreibt die deutsche Wikipedia ganz gut): https://de.wikipedia.org/wiki/TeX

ImageMagick convert: https://imagemagick.org/

Community

Mitreden, Mitschreiben, Spenden

Geschrieben von akf am 15. November 2022 um 12:56

Wenn man eine Manpage in eine PDF-Datei umwandeln will, geht das wie folgt:

man -Tpdf bash >bash.pdf

Antworten

Geschrieben von akf am 16. November 2022 um 13:20

Nachtrag: Damit das funktioniert muss eventuell groff nachinstalliert werden. Von groff wird meist nur eine Minimalversion installiert, die für das Terminal reicht, wo aber die Ausgabe für viele andere Formate fehlt.

Antworten

Geschrieben von akf am 15. November 2022 um 13:13

Zum konvertieren zwischen PostScript und PDF hat Ghostscript die Skripte ps2pdf und pdf2ps.

Der Befehl ps2pdf kann auch verwendet werden, um eine PDF-Datei neu zu erstellen. Dabei wird sie oft kleiner.

Antworten

Geschrieben von UbIx am 16. November 2022 um 21:51

Danke, Geht aber auch mit convert und wenn es richtig gut werden soll old school Ghostscript

Antworten

Geschrieben von akf am 18. November 2022 um 11:30

Die von mir genannten Skripte rufen ja Ghostscript auf. Man kann da auch die entsprechenden Parameter für Ghostscript mitgeben.

Antworten

Geschrieben von megamax2 am 15. November 2022 um 15:08

Hab' mal eine GUI für PDFtk geschrieben. Sie unterstützt nicht alle Features von PDFtk und ich komme leider schon länger nicht mehr dazu sie weiter zu entwickeln. Aber Dokumente zusammenfügen und trennen, Wasserzeichen/Stempel auftragen, sowie Anhänge ins Dokument einbinden kann sie.

New (rewritten) in Python:

https://pypi.org/project/pdfchain/

Old in C++:

https://sourceforge.net/projects/pdfchain/

Vielleicht kann es jemand gebrauchen. MFG.

Antworten

Geschrieben von UbIx am 16. November 2022 um 21:56

Danke. "pip install pdfchain"

hat zwar funktioniert, ließ sich wegen "raise Exception("The path '{}' was not found!".format(path))"

Antworten

Geschrieben von Bernhard E. Reiter am 15. November 2022 um 15:39

Ein gutes Werkzeug zum PDF Analysieren und Bearbeiten auf der Kommandozeile ist https://qpdf.sourceforge.io/ (gibt es direkt in vielen GNU/Linux Distributionen, z.B. https://packages.debian.org/search?keywords=qpdf )

Die Syntax ist etwas gewöhnungsbedürftig, das Handbuch ist allerdings gut.

Antworten

Geschrieben von UbIx am 16. November 2022 um 21:49

Danke für den Hinweis. qpdf kannte ich auch noch nicht. Sieht aber recht vielversprechend aus wenn ich mal mit PDFtk und convert nicht weiter komme :-)

Antworten

Geschrieben von Peter am 15. November 2022 um 16:11

Zur pdf Bearbeitung fallen mir noch zwei weitere, graphische Programme ein:

pdf Arranger (https://github.com/pdfarranger/pdfarranger): zum Sortieren, Seiten entfernen/hinzufügen, Seiten drehen etc., und
Xournal++ (https://xournalpp.github.io/): Wer pdfs gerne per Stift (aber auch ohne) bearbeitet findet hier vielfältige Möglichkeiten.

Antworten

Geschrieben von UbIx am 16. November 2022 um 21:43

Danke für die Info. Es gibt natürlich noch zahlreiche auch grafische Tools.

Ein besonderer Tipp ist mir gerade noch mal eingefallen. Old school ghostscript verwende ich zum komprimieren von PDFs vor z.B. eMail versand:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=KomprimierteDatei.pdf GroßesDatei.pdf

Antworten

Geschrieben von tuxfanmatze am 15. November 2022 um 18:18

Hallo Ulf, benutzt du Libreoffice Draw oder Writer, wenn du die pdf-Datei zum Bearbeiten importierst?

Antworten

Geschrieben von UbIx am 15. November 2022 um 22:24

Hi tuxfanmatze, eigentlich immer Draw. Writer habe ich noch nicht probiert. Meist waren es ja auch immer nur ein oder max. 2-3 Seitige Dokumente. Da 99% der Bearbeitungen mache ich wirklich im Okular. Insbesondere Kommentieren von (Master) Thesis (= Diplomarbeiten) meiner Studenten die ich betreue.

Antworten

Geschrieben von kamome am 15. November 2022 um 19:06

Danke für den Artikel – Okular ist auch meine bevorzugte Wahl.

Vermeidet Leer- und Sonderzeichen und ersetzt sie durch Unterstrich "_" oder Bindestrich "-"

Speziell für KDE (oder allgemein Nicht -GTK?): Keine Unterstriche (weil die leider bis heute keine Worttrenner fürs wortweise Markieren darstellen). Aber ich bin noch strenger: Für systemübergreifende und programmiererisch größte Einfachheit gilt bei mir für Dateinamen die rigorose Regel: [a-z0-9][a-z0-9-.]+[a-z0-9]

Antworten

Geschrieben von UbIx am 16. November 2022 um 21:37

Ja, wobei die meisten aktuellen Systeme schon unicode können. Nur "leerzeichen" haben ihn allen Systemen auch die Trennfunktion, womit es weder auf Web-Seiten noch auf der CLI und ab und zu auch mit einigen Apps ärger gibt. Mehr ist immer besser (also pur asci 127)

Antworten

Geschrieben von megamax2 am 15. November 2022 um 22:35

Meinen Kommentar wurde nicht frei gegeben? Mhhh, warum nicht? Schade :(

Antworten

Geschrieben von Micha am 16. November 2022 um 20:48

PDF shuffler ist auch gut.

Antworten

Geschrieben von Florian am 17. November 2022 um 10:04

Den PDF Shuffler verwende ich auch um Seiten innerhalb von PDF Dateien zu sortieren und zusammen zufügen.

Antworten

Geschrieben von ls am 30. Januar 2023 um 11:21

Eine mit pdflatex erzeugte rotierte Zeichenfolge wird beim Suchen in okular nicht gefunden. Evince zeigt sie dagegen an. Auch pdfgrep findet die rotierte Zeichenfolge. Woran kann das liegen?

Antworten

Geschrieben von Oliver am 28. März 2024 um 09:50

Guten Morgen, leider muss ich dir da widersprechen. Ich gerade einige Formulare von der Bank zum Ausfüllen erhalten die als interaktives Formular erstellt worden sind und bisher ist es mir lediglich gelungen diese unter Windows mit dem aktuellen Adobe Reader überhaupt zu öffnen. Alle anderen Konstellationen führt zu dem Hinweis, das der PDF Reader nicht aktuell sei. Ich gehe davon aus, dass die Formulare eben mit Adobe erstellt worden sind und so "safe" gemacht worden sind, dass sie nur mit Adobe ausgefüllt werden können. Selbst der Foxit Reader (linux Version) verweigert sich. Einzig der Master PDF Editor funktioniert. Okular gibt zumindest den Fehler aus, dass es sich um ein XFA Dokument handelt, was zur Zeit noch nicht unterstützt wird.

Antworten