Ode an den Rohtext: Im Sumpf der Office-Suites

  Lian Begett   Lesezeit: 6 Minuten  🗪 11 Kommentare

Bei der Textbearbeitung kann weniger, mehr sein.

ode an den rohtext: im sumpf der office-suites

Seit der Emanzipation der Computer von einfachen Rechenmaschinen zu absoluten Allroundern ist einer ihrer Anwendungszwecke nicht mehr wegzudenken: die Textbearbeitung. Die Office-Suite ist dabei eine der attraktivsten Varianten. Ob es eine Tabelle ist, eine Präsentation, ein Diagramm, ein Roman, ein Aufsatz oder ein Tagebuch, alles lässt sich mit Programmen wie LibreOffice, oder sogar direkt im Browser cloudbasiert bearbeiten, formatieren, aufhübschen und exportieren. Schriftarten, Einrückungen, Druckvorlagen, Formeln, automatische Berechnungen; diese Programme können viel und gehören zu den komplexesten Anwendungen, die trotzdem im täglichen Gebrauch von Milliarden Menschen sind.

Aber nicht nur Großprojekte wie Datenvisualisierungen, Romane, Briefe und Buchhaltungstabellen werden mit Office-Programmen bearbeitet; mittlerweile fallen für einige Menschen auch einfachste Datengattungen wie Notizen, Schulaufgaben, Abgaben für Hausaufgaben und einfachste Textdokumente, sogar Bilder in das Beuteschema dieser Programme. Alles, was Text ist, öffnet sich automatisch darin. Eine zehn-Zeilen-Notiz, die schnell mal an die Vorgesetzte verschickt werden muss, wird in einem proprietären Format gespeichert und als PDF exportiert. Office-Suites werden immer größer -- LibreOffice (mit Abhängigkeiten) allein misst weit über einen Gigabyte -- und irgendwann fragt man sich, ob das wirklich noch sein muss.

Wie schwer kann Text denn sein?

Ich studiere Computerlinguistik und Linguistik an einer großen deutschen Universität. Fundamentaler Teil meines universitären Alltags ist die Textbearbeitung: zu meinen Aufgaben gehören sowohl Abgaben auf einfachste Fragebögen als auch wissenschaftliche Arbeiten im Umfang ein, zwei Dutzend Seiten.

Dass die Arbeiten in einer Office-Suite verfasst werden, ist wohl keine Frage; schließlich sind Funktionen wie ein sich selbst aktualisierendes Inhalts- und Literaturverzeichnis und automatisch durchnummerierte Fußnoten sehr praktisch. Für diese Großprojekte benutze ich auch gerne meinen Computer mit grafischer Oberfläche, Maus und allerlei benutzerfreundlichem Tamtam.

Am liebsten aber arbeite ich im Alltag in textbasierten Umgebungen. Meine Laptops laufen mit tilingbasierten Fenstermanagern, die mit der Tastatur gesteuert werden, und meine Arbeit verrichte ich ausschließlich in der Konsole: Blogartikel, kreatives Schreiben, Programmierprojekte. Ich fühle mich damit produktiver und wohler als in einer vollumfänglichen Desktopumgebung wie GNOME oder KDE. Und eigentlich, so sollte man meinen, sollte das kein Problem sein! Schließlich ist es 2022, und Text zu lesen und zu schreiben ist wohl die einfachste Anwendung eines Heimcomputers, die es gibt.

Sollte man meinen!

Die Aufgaben, die ich im Rahmen meines Studiums bearbeiten muss, gibt es nur im PDF-Format, heruntergeladen von einer Webseite, die ohne HTML5 und Javascript in einem modernen Browser nicht mehr funktioniert (auf Wiedersehen Nyxt, Qutebrowser und erst recht Lynx und Elinks); manchmal auch im mittlerweile Jahrzehnte alten proprietären .doc-Format von Microsoft Word. Das heißt Falkon öffnen, fluchen, Datei herunterladen, und das Ergebnis erst einmal in lesbaren Text konvertieren, oder direkt der Bequemlichkeit halber grafisch öffnen. Was mein Laptop nicht kann, weil er mittlerweile zwanzig Jahre alt und für die heute gängigen Office-Suites wohl zu antik ist. Also, ran an den PC.
Aber warum ist das so? Bei allen diesen Dateien handelt es sich inhaltlich lediglich um eine kurze unformatierte Liste weniger Aufgaben beziehungsweise meine ebenfalls simplen Antworten auf diese. Wieso muss das sein? Wir sollten eigentlich mittlerweile an einem Punkt sein, an dem das Lesen und Schreiben eines kurzen, unformatierten Texts keine Frage der Rechenleistung ist, oder?

Ausgezeichnet!

Wenn es nach mir ginge, würden Textdaten, die grundsätzlich nicht auf die Funktionen einer Office-Suite angewiesen sind, einfach als Rohtext gespeichert und verbreitet werden. Und selbst wenn es sich um mehr als nur ein paar einfache Zeilen handelt, gibt es Abhilfe. Auszeichnungssprachen wie Markdown sind eine ausgezeichnete Art und Weise, auch recht komplexe (das heißt mit Über- und Unterschriften, Zitaten, Fußnoten, in-line-Formatierungen und so weiter ausgestattete) Texte zu bauen. So ein Blogartikel wie dieser hier etwa lässt sich hervorragend in Markdown verfassen; an dieser Stelle Grüße aus GNU Emacs von einem Laptop mit einem Pentium III-Prozessor und 386MB an Arbeitsspeicher.

Text als einfach ausgezeichnete Rohdaten zu speichern hat einige Vorteile:

  • Speicherplatz: ein Rohtext ist wohl die platzsparendste Variante zur Speicherung von Textdaten, die es gibt.
  • Interkompatibilität: einen ordentlich formatierten Rohtext kann wohl jedes Programm und jede Maschine öffnen; das diskriminiert kein Setup, kein Betriebssystem, keine Preisklasse an Hardware.
  • Maschinenlesbarkeit: Auch Maschinen können ohne Probleme mit dem Text umgehen; etwa für systemweite Textsuchen oder texttechnologische Untersuchungen, wie ich sie in der Korpuslinguistik gerne anwende.
  • Barrierefreiheit: Bildschirmleser und andere Hilfsprogramme zur Unterstützung von Menschen mit Behinderung und anderen, die darauf angewiesen sind, kommen mit Rohtext besser klar als mit stark obfuszierten Formaten, die vielleicht ein Dokument für betroffene Personen unbrauchbar machen.
  • Anpassbarkeit: ein Rohtext ohne großartige Formatierung ist durch Benutzer darstellbar, wie auch immer es ihnen passt: Schriftart, Schriftgröße, Farbschemata. Und mit semantischen Auszeichnungssprachen wie Markdown lässt sich so ein Text auch grafisch hübsch darstellen. Je nachdem, wie man es gerne hätte. Und man ist nicht auf den (vielleicht fragwürdigen) ästhetischen Geschmack der Autorin oder des Autors angewiesen.

Wieso das aber nicht so ist, lässt sich erahnen: proprietäre Formate schaffen Monopolstellungen, und wenn eine .doc-Datei nur in Microsoft Word richtig dargestellt wird, veranlasst das mehr Nutzer, nicht zu GNU/Linux oder anderen Betriebssystemen zu wechseln. Es stellt quasi einen Zwang durch Vendor-Lock-In her. Und wie das funktioniert, ist in der Wirtschaft ersichtlich: eine Initiative, die Rechner einer größeren Firma auf GNU/Linux zu migrieren, scheitert oft an Microsoft Windows-exklusiven Programmen und Formaten, die einfach im Workflow eingebunden sind. Die Angewohnheit, jede Art Daten in überdimensionierten Office-Suites zu bearbeiten, ist also der Softwarefreiheit grundsätzlich entgegengestellt. Die freie Wahl der eigenen Programme wird unnötig dadurch eingeschränkt.

Ausblicke

Das Problem findet sich aber nicht nur im Office-Bereich. Auch das Internet selbst wird immer mehr zu einem zweiten Betriebssystem und hat den ursprünglichen Zweck, Hypertext-Dokumente zu verbreiten, zum Großteil verloren. Wer wie ich auf alte Hardware aus Kosten- und Hobbygründen angewiesen ist, und auch gerne hauptsächlich das Terminal verwendet, wird von den meisten Webseiten und auch vielen Textdokumenten einfach ausgeschlossen. Ohne proprietäres Javascript geht kaum noch etwas, ohne Icons, Frames, eingebettete Module, Webrendering und alles Mögliche sind die meisten Webseiten kaum verwendbar. Am Anfang des Internets hatten Web-Browser auch noch die Funktionalität, die Darstellung aller Webseiten uniform an die eigenen Bedürfnisse anzupassen, was heute undenkbar wäre.

Es gibt aber einen Funken Hoffnung; genau wie es vor allem unter jungen Leuten Interessen- und Hobbygruppen zur Rückkehr zum puren, spielerischen nur-(X)HTML-Retro-Internet gibt, könnte es ja auch eine kleine Bewegung wieder in Richtung ausgezeichnetem Rohtext zur Textweitergabe geben. Ich glaube, meinen Teil zu tun, auf dass wir irgendwann wieder eine kurze Notiz herunterladen können, die wir einfach in GNU nano, micro, vi(m) oder GNU Emacs öffnen können und die auf Anhieb gut und richtig dargestellt wird.

Tags

LibreOffice, Office, Text, Emacs

Apu
Geschrieben von Apu am 7. Juni 2022 um 13:22

Toller Beitrag, danke dafür. Ich schreibe meine Dokus mittlerweile auch in Markdown und wandle sie danach in HTML-Dokumente um. Hat man die Formatbefehle mal verinnerlicht, geht das Schreiben, bzw. Formatieren sehr schnell von der Hand.

Olaf
Geschrieben von Olaf am 7. Juni 2022 um 13:54

Ich freue mich auf die Artikelserie „Der Emacs Org mode“!

Doom
Geschrieben von Doom am 2. Mai 2023 um 10:54

Darauf warte ich auch noch :)

akf
Geschrieben von akf am 7. Juni 2022 um 15:32

Das Projekt Gemini ist ein Netzwerkprotokoll mit einer rein textbasierten Auszeichnungssprache; irgendwo zwischen Gopher und dem Web. https://gemini.circumlunar.space

Mancus Nemo
Geschrieben von Mancus Nemo am 7. Juni 2022 um 19:04

Hehe, da muss man geradezu an Gopher und Gemini im Kristallbrowser denken.

Fabian Schaar
Geschrieben von Fabian Schaar am 7. Juni 2022 um 20:42

Danke, danke -- du sprichst mir ein bisschen aus der Seele. Sicherlich sind Office-Suites praktisch; und doch bin ich es leid Berge an Plattenspeicher für Office-Funktionen draufgehen zu lassen, die ich nicht einmal bräuchte. Bei dem puristischen Html-Trend habe ich mich doch ein bisschen wiedererkannt. Gerade Text und Html sind, wenn man es mal richtig anwendet, unschlagbar. Jede Impress-Presentation ließe sich auch in einfachem Html schreiben, jede mehr oder weniger wissenschaftliche Arbeit ließe sich in reinem Text schreiben und wäre mindestens genauso lesbar. Doch leider gehören Vorgaben, was Layout, Einzug etc. pp. angeht zum nicht gerade liebenswerten Standard. Ich wünschte, die Templatefetischisten und Arial-Apologeten würden sich nur manchmal so sehr um den Inhalt scheren, wie um die äußere Form. Sei's drum, ein Standard wird auch immer von denen erhoben, die mit ihm arbeiten müssen -- und der jetzige gehört meiner Ansicht nach schon längst abgeschafft. Zeilenzählen, Seitenvorgaben, Schriftgrößenüberprüfen -- all das sollte gerade heute der Vergangenheit angehören: Hoch leben die Zeichen mit Leerzeichen und der Inhalt den sie vermitteln. Danke für den Artikel!

linmob
Geschrieben von linmob am 7. Juni 2022 um 23:23

Schöner Artikel!

Ich kratz mich immer am Kopf wenn in der Arbeit die Leute für ein paar Stichpunkte Word hernehmen…

Was mich jetzt natürlich brennend interessiert, was für ein 20 Jahre altes Laptop (ich nutze gelegentlich mal ein X60s, aber das ist mit seinen 15 Jahren ja ein Jungspund und Performancewunder) da zum Einsatz kommt, und was zur Konvertierung genutzt wird: Grafische Programme, oder kleine Werkzeuge à la pdf2txt, pdftohtml?

Caspar
Geschrieben von Caspar am 7. Juni 2022 um 23:31

Vielleicht könnte man den e-mail-server so einstellen, dass e-mails mit propritären Anhängen abgewiesen werden und um rohtext gebeten wird. Ich frag mich ob man haftet, wenn man eine Rechnung im PDF Format nicht bekommt. Wenn der Server sie abweißt, wie mails ohne oder mit altem ssl auch, gilt sie doch als unzugestellt.

Klabautermann
Geschrieben von Klabautermann am 8. Juni 2022 um 08:43

Ich kann dem im Großen und Ganzen nur zustimmen. Als Programmierer bin ich im Berufsleben bei der Doku auf MS-Office festgelegt gewesen, bis zur Verwendung von Excel für reine Tabellen als Dokumentation für Fehler, deren Bearbeitung und Beseitigung.

Für die eigene Dokumentation, beruflich wie im Hobby, benutze ich eigentlich von Anfang an nur Text, seit einigen Jahren wieder mit Markup. Das habe ich auf einem Apple ][ mit StarWriter (so hies das Programm, glaube ich) schon für meine Diplomarbeit benutzt.

Nur bei den Editioren habe ich etwas mehr Anspruch an den Komfort. Für reinen Text nehme ich bluefish. Und für Doku mit Markdown Atom, wegen des guten Viewers und weil ich damit auch alle meine Programme schreibe. Beides ist aber auch dem ständigen Wechsel zwischen Linux (hauptsächlich) und Windows (nur im Beruf) geschuldet.

Ich habe noch einige Office-Dokumente, vornehmlich Tabellen, die aber dann auch die spezifischen Eigenschaften wie Berchnungen oder spezeilles Layout benötigen. Man muss sich ja nicht für alles das Rad selbst erfinden (programmieren).

Jan
Geschrieben von Jan am 8. Juni 2022 um 13:21

Das spricht mir aus der Seele! Genau diese Erfahrung habe ich mit InDesign gemacht - bevor Adobe auf ein Abo-Modell umgestellt hat, hatte ich mir eine Studentenversion gekauft (2010?). Inzwischen lege ich neue Dokumente in Markdown an, und versucht sie in das Format zu rendern (Folie, Arbeitsblatt,…) das ich brauche. Diese Trennung zwischen Inhalt und Darstellung macht mich zuversichtlich, in zehn Jahren nicht wieder vor dem Problem zu stehen, jedes Mal, wenn ich mir ein altes Dokument ansehen (und vielleicht verändern) möchte, eine virtuelle Maschine mit einem ungeliebten alten Betriebssystem starten zu müssen. Danke für den schönen Artikel!

kamome
Geschrieben von kamome am 13. Juni 2022 um 23:52

Danke, schöne Ode!

schließlich sind Funktionen wie ein sich selbst aktualisierendes Inhalts- und Literaturverzeichnis und automatisch durchnummerierte Fußnoten sehr praktisch.

Da würde sich aber doch auch Asciidoc anbieten – hatten wir ja gerade (https://gnulinux.ch/asciidoc).