LibreOffice 25 - durchdachte Schwärzungsfunktion mit Extras

  Herbert Hertramph   Lesezeit: 4 Minuten Auf Mastodon ansehen

Um sensible Daten in Dokumenten zu schützen, greift man oft zu den bekannten "schwarzen Balken". Aber, wie in diesen Tagen die Epstein-Files zeigen, kann der Text trotzdem lesbar bleiben. LibreOffice ab Version 25 liefert für derartige Zwecke eine durchdachte Funktion.

libreoffice 25 - durchdachte schwärzungsfunktion mit extras

Die meisten Leser:innen werden es über die Medien verfolgt haben: Die großflächige Schwärzung der Epstein-Akten war zumindest in Teilen - technisch - fehlerhaft und konnte mit einfachen Kopiervorgängen aufgehoben werden [1]. Es wird vermutet, dass in Justiz-Abteilungen nur die eingeschränkte kostenlose Adobe-Acrobat-Version verwendet wurde, die lediglich das Überdecken von Textteilen mit schwarzen Linien erlaubt [2]. Die "echte" Schwärzung ist hingegen Bestandteil der kostenpflichtigen Lizenzversion.

Schwärzung als kostenpflichte Funktion in Adobe Acrobat

Wenn man nur eine Grafik über Textstellen legt, dann bleibt in der digitalen Version der verdeckte Inhalt im Textlayer erhalten. Das kann zur Not noch für einen Papierausdruck genügen - nicht aber, wenn man ein Dokument z. B. per Mail weitergibt. Eigentlich ist es - jenseits vom genannten aktuellen Fall - eine der wichtigen Funktionen, um sensible Daten zu schützen: Journalismus, Kinder- und Jugendarbeit, Bewerbungsvergleiche, Angebotseinreichungen usw. usw. - in vielen Bereichen ist es wichtig, dass überdeckte Teile auf keinen Fall rekonstruiert werden können.

Nun, zum Glück ist in den aktuellen Versionen von LibreOffice die vollständige Schwärzung eingebaut. Völlig kostenlos und ohne jede Einschränkung. Mehr noch: Schwärzungen können sogar automatisiert vorgenommen werden. Und vor allem: Die Funktion ist "narrensicher" implementiert.

1. Einfache Variante

Im Menüpunkt "Extras" von LibreOffice Writer findet man die beiden Begriffe "Redigieren" und "Automatische Redigierung".

Die Schwärzungsfunktion ist unter "Extras" zu finden.

Schauen wir uns zunächst die einfache Variante (Redigieren) an. Sobald man den Punkt ausgewählt hat, öffnet sich die gleiche Datei sofort in einem zweiten Fenster, das aber diesmal zu LibreOffice Draw gehört:

Doppelung in Draw

Und Draw ist auch genau das richtige Programm. Denn nun wird in einem Zeichenprogramm gearbeitet, das später in die fertige PDF nur ein "Textbild" einbetten wird - und eben gerade nicht den zusätzlichen Textlayer, der die Rekonstruktion erlauben würde. Damit dieser Vorgang möglichst einfach klappt, wird eine spezielle Menüleiste eingeblendet:

Menüleiste für Markierungen und Export

Die ersten zwei Buttons sind für die Markierung der gewünschten Flächen zuständig: Rechteck (1), Freiform (2). Dann folgen drei Export-Icons. Mit dem ersten (3) werden die Markierungen in der finalen Version weiß dargestellt. Das zweite (4) sorgt für die übliche Schwarze-Balken-Darstellung. Mit dem dritten (5) erhält man eine Vorschau.

Funktionen der Menüleiste

Wenn man also zum Beispiel Export (4) nimmt, so erhält man eine PDF, die aus einem Bild besteht. Die schwarzen Balken sind gewissermaßen Grafiken in einer Grafik. Auf diese Weise kann der ursprüngliche Text mit keinem Verfahren ausgelesen werden.

PDF-Export in Grafikform

Ein PDF-Dokument im Grafikformat wird zwar in der Regel mehr Speicherplatz als eine "normale" PDF beanspruchen, doch die Größe lässt sich später auf Wunsch durch weitere Tools eindampfen (beispielsweise kann man bei Nemo die PDF-Komprimierung im Kontext-Menü implementieren).

2. Automatisierte Variante

Hat man in einem umfangreichen Dokument viele Schwärzungen vorzunehmen, so würde die erste Variante einiges an Zeit kosten. Mit der automatischen Schwärzung können z. B. Bilder oder bestimmte Namen in einem Rutsch ersetzt werden. Noch flexibler ist es aber, wenn man eigene Textmarker definiert - damit legt man nur Anfang und Ende einer Schwärzung für beliebige Textabschnitte fest. Dafür gibt es die Möglichkeit, dass LibreOffice sich an Zeichen orientiert, die man direkt im eigentlichen Text setzt. Die Schwärzung geschieht anschließend automatisch. Welche Art der Zeichenmarkierung man einsetzt, kann man selbst definieren. Für dieses Beispiel nehmen wir doppelte eckige Klammern: "Dies ist ein [[Beispiel]]." Hier würde also das Wort "Beispiel" geschwärzt werden. Unser Ausgangstext könnte also so aussehen:

Markierungen im Ausgangstext

Nun müssen wir LibreOffice noch sagen, dass die doppelten Zeichen vor und hinter einem Textteil die Erkennungsmarker für Schwärzungen sind. Sobald wir im Menü "Extras" den Punkt "Automatische Redigierung" aufrufen, wird ein Auswahlfenster für diese Vorgaben eingeblendet:

Zielvorgaben definieren

In der Maske für die Zielvorgaben wählt man nun "Regulärer Ausdruck" aus:

regulärer Ausdruck für Textmarkierungen

Im Feld "Inhalt" wird die Zeichenfolge "\[\[.*?\]\]" eingetragen: doppelte Klammern am Anfang und Ende, ".?" steht für "alles zwischen den doppelten Klammern".

Diese Definition muss man nur 1 x vornehmen. Für weitere Texte bleibt die Definition erhalten. Klickt man auf "Okay" so erhält man diesmal sofort eine Draw-Anzeige mit allen Markierungen und muss nur noch den PDF-Export ausführen. Die automatische Markierung kann zusätzlich durch weitere Markierungen von Hand ergänzt werden, sollte man bei der Definition der Zielvorgabe etwas übersehen haben.

alles markiert

Ich habe Euch das fertige Dokument einmal bei meiner Nextcloud hochgeladen. So könnt Ihr ausprobieren, ob Ihr etwas rekonstruieren könnt :-)
https://cloud.hertramph.de/s/yxdzKJ6BM7PqDpE

Bonus-Tipp: Sollte es wichtig sein, dass auch das geschwärzte Dokument durchsuchbar ist, so kann man die eben erzeugte Datei in einem zweiten Durchgang durch ein OCR-Tool laufen lassen.

Bildquelle:
Titelbild vom Artikelautor

[1] https://www.spiegel.de/ausland/jeffrey-epstein-user-entfernen-schwaerzungen-in-dokumenten-ueber-sexualstraftaeter-a-2c9a5ce2-6169-452c-980c-2f1a351ed06a

[2] https://www.ibtimes.co.uk/epstein-files-redactions-failed-after-funding-cuts-forced-doj-use-basic-adobe-tools-1766051

Tags

LibreOffice, Crypto, Textverarbeitung, PDF, FOSS, Datenschutz

Es wurden noch keine Kommentare verfasst, sei der erste!