Ode an den Rohtext: Im Sumpf der Office-Suites
Di, 7. Juni 2022, Lian Begett
Seit der Emanzipation der Computer von einfachen Rechenmaschinen zu absoluten Allroundern ist einer ihrer Anwendungszwecke nicht mehr wegzudenken: die Textbearbeitung. Die Office-Suite ist dabei eine der attraktivsten Varianten. Ob es eine Tabelle ist, eine Präsentation, ein Diagramm, ein Roman, ein Aufsatz oder ein Tagebuch, alles lässt sich mit Programmen wie LibreOffice, oder sogar direkt im Browser cloudbasiert bearbeiten, formatieren, aufhübschen und exportieren. Schriftarten, Einrückungen, Druckvorlagen, Formeln, automatische Berechnungen; diese Programme können viel und gehören zu den komplexesten Anwendungen, die trotzdem im täglichen Gebrauch von Milliarden Menschen sind.
Aber nicht nur Großprojekte wie Datenvisualisierungen, Romane, Briefe und Buchhaltungstabellen werden mit Office-Programmen bearbeitet; mittlerweile fallen für einige Menschen auch einfachste Datengattungen wie Notizen, Schulaufgaben, Abgaben für Hausaufgaben und einfachste Textdokumente, sogar Bilder in das Beuteschema dieser Programme. Alles, was Text ist, öffnet sich automatisch darin. Eine zehn-Zeilen-Notiz, die schnell mal an die Vorgesetzte verschickt werden muss, wird in einem proprietären Format gespeichert und als PDF exportiert. Office-Suites werden immer größer -- LibreOffice (mit Abhängigkeiten) allein misst weit über einen Gigabyte -- und irgendwann fragt man sich, ob das wirklich noch sein muss.
Wie schwer kann Text denn sein?
Ich studiere Computerlinguistik und Linguistik an einer großen deutschen Universität. Fundamentaler Teil meines universitären Alltags ist die Textbearbeitung: zu meinen Aufgaben gehören sowohl Abgaben auf einfachste Fragebögen als auch wissenschaftliche Arbeiten im Umfang ein, zwei Dutzend Seiten.
Dass die Arbeiten in einer Office-Suite verfasst werden, ist wohl keine Frage; schließlich sind Funktionen wie ein sich selbst aktualisierendes Inhalts- und Literaturverzeichnis und automatisch durchnummerierte Fußnoten sehr praktisch. Für diese Großprojekte benutze ich auch gerne meinen Computer mit grafischer Oberfläche, Maus und allerlei benutzerfreundlichem Tamtam.
Am liebsten aber arbeite ich im Alltag in textbasierten Umgebungen. Meine Laptops laufen mit tilingbasierten Fenstermanagern, die mit der Tastatur gesteuert werden, und meine Arbeit verrichte ich ausschließlich in der Konsole: Blogartikel, kreatives Schreiben, Programmierprojekte. Ich fühle mich damit produktiver und wohler als in einer vollumfänglichen Desktopumgebung wie GNOME oder KDE. Und eigentlich, so sollte man meinen, sollte das kein Problem sein! Schließlich ist es 2022, und Text zu lesen und zu schreiben ist wohl die einfachste Anwendung eines Heimcomputers, die es gibt.
Sollte man meinen!
Die Aufgaben, die ich im Rahmen meines Studiums bearbeiten muss, gibt es nur im PDF-Format, heruntergeladen von einer Webseite, die ohne HTML5 und Javascript in einem modernen Browser nicht mehr funktioniert (auf Wiedersehen Nyxt, Qutebrowser und erst recht Lynx und Elinks); manchmal auch im mittlerweile Jahrzehnte alten proprietären .doc-Format von Microsoft Word. Das heißt Falkon öffnen, fluchen, Datei herunterladen, und das Ergebnis erst einmal in lesbaren Text konvertieren, oder direkt der Bequemlichkeit halber grafisch öffnen. Was mein Laptop nicht kann, weil er mittlerweile zwanzig Jahre alt und für die heute gängigen Office-Suites wohl zu antik ist. Also, ran an den PC.
Aber warum ist das so? Bei allen diesen Dateien handelt es sich inhaltlich lediglich um eine kurze unformatierte Liste weniger Aufgaben beziehungsweise meine ebenfalls simplen Antworten auf diese. Wieso muss das sein? Wir sollten eigentlich mittlerweile an einem Punkt sein, an dem das Lesen und Schreiben eines kurzen, unformatierten Texts keine Frage der Rechenleistung ist, oder?
Ausgezeichnet!
Wenn es nach mir ginge, würden Textdaten, die grundsätzlich nicht auf die Funktionen einer Office-Suite angewiesen sind, einfach als Rohtext gespeichert und verbreitet werden. Und selbst wenn es sich um mehr als nur ein paar einfache Zeilen handelt, gibt es Abhilfe. Auszeichnungssprachen wie Markdown sind eine ausgezeichnete Art und Weise, auch recht komplexe (das heißt mit Über- und Unterschriften, Zitaten, Fußnoten, in-line-Formatierungen und so weiter ausgestattete) Texte zu bauen. So ein Blogartikel wie dieser hier etwa lässt sich hervorragend in Markdown verfassen; an dieser Stelle Grüße aus GNU Emacs von einem Laptop mit einem Pentium III-Prozessor und 386MB an Arbeitsspeicher.
Text als einfach ausgezeichnete Rohdaten zu speichern hat einige Vorteile:
- Speicherplatz: ein Rohtext ist wohl die platzsparendste Variante zur Speicherung von Textdaten, die es gibt.
- Interkompatibilität: einen ordentlich formatierten Rohtext kann wohl jedes Programm und jede Maschine öffnen; das diskriminiert kein Setup, kein Betriebssystem, keine Preisklasse an Hardware.
- Maschinenlesbarkeit: Auch Maschinen können ohne Probleme mit dem Text umgehen; etwa für systemweite Textsuchen oder texttechnologische Untersuchungen, wie ich sie in der Korpuslinguistik gerne anwende.
- Barrierefreiheit: Bildschirmleser und andere Hilfsprogramme zur Unterstützung von Menschen mit Behinderung und anderen, die darauf angewiesen sind, kommen mit Rohtext besser klar als mit stark obfuszierten Formaten, die vielleicht ein Dokument für betroffene Personen unbrauchbar machen.
- Anpassbarkeit: ein Rohtext ohne großartige Formatierung ist durch Benutzer darstellbar, wie auch immer es ihnen passt: Schriftart, Schriftgröße, Farbschemata. Und mit semantischen Auszeichnungssprachen wie Markdown lässt sich so ein Text auch grafisch hübsch darstellen. Je nachdem, wie man es gerne hätte. Und man ist nicht auf den (vielleicht fragwürdigen) ästhetischen Geschmack der Autorin oder des Autors angewiesen.
Wieso das aber nicht so ist, lässt sich erahnen: proprietäre Formate schaffen Monopolstellungen, und wenn eine .doc-Datei nur in Microsoft Word richtig dargestellt wird, veranlasst das mehr Nutzer, nicht zu GNU/Linux oder anderen Betriebssystemen zu wechseln. Es stellt quasi einen Zwang durch Vendor-Lock-In her. Und wie das funktioniert, ist in der Wirtschaft ersichtlich: eine Initiative, die Rechner einer größeren Firma auf GNU/Linux zu migrieren, scheitert oft an Microsoft Windows-exklusiven Programmen und Formaten, die einfach im Workflow eingebunden sind. Die Angewohnheit, jede Art Daten in überdimensionierten Office-Suites zu bearbeiten, ist also der Softwarefreiheit grundsätzlich entgegengestellt. Die freie Wahl der eigenen Programme wird unnötig dadurch eingeschränkt.
Ausblicke
Das Problem findet sich aber nicht nur im Office-Bereich. Auch das Internet selbst wird immer mehr zu einem zweiten Betriebssystem und hat den ursprünglichen Zweck, Hypertext-Dokumente zu verbreiten, zum Großteil verloren. Wer wie ich auf alte Hardware aus Kosten- und Hobbygründen angewiesen ist, und auch gerne hauptsächlich das Terminal verwendet, wird von den meisten Webseiten und auch vielen Textdokumenten einfach ausgeschlossen. Ohne proprietäres Javascript geht kaum noch etwas, ohne Icons, Frames, eingebettete Module, Webrendering und alles Mögliche sind die meisten Webseiten kaum verwendbar. Am Anfang des Internets hatten Web-Browser auch noch die Funktionalität, die Darstellung aller Webseiten uniform an die eigenen Bedürfnisse anzupassen, was heute undenkbar wäre.
Es gibt aber einen Funken Hoffnung; genau wie es vor allem unter jungen Leuten Interessen- und Hobbygruppen zur Rückkehr zum puren, spielerischen nur-(X)HTML-Retro-Internet gibt, könnte es ja auch eine kleine Bewegung wieder in Richtung ausgezeichnetem Rohtext zur Textweitergabe geben. Ich glaube, meinen Teil zu tun, auf dass wir irgendwann wieder eine kurze Notiz herunterladen können, die wir einfach in GNU nano, micro, vi(m) oder GNU Emacs öffnen können und die auf Anhieb gut und richtig dargestellt wird.