Serie - Strukturierte Notizen: Die göttliche Ordnung

Di, 20. September 2022, Ralf Hersel

Seit Beginn der Computer-Geschichte ist die Ordnung von Daten ein zentrales Element. Nicht nur bei der Informations-Technologie, sondern auch im allgemeinen Leben spielen Strukturen eine wesentliche Rolle. Weil ich dieses Thema für essenziell halte, habe ich es "Die göttliche Ordnung" genannt, wobei ihr Gott seid. Daher ist das Verständnis der möglichen Grundordnungen wichtig, für unsere Serie über strukturierte Notizen.

Michelangelo - Die Erschaffung Adams

Am Anfang war die Datei, oder eine Datenmenge. Es spielt keine Rolle, wie wir das benennen; wichtig ist, dass es eine Menge von Daten auf eurem Speichermedium oder in eurem Kopf gibt. Die entscheidende Frage ist, wie diese Daten organisiert werden können, damit man sie wiederfinden kann: sowohl technisch als auch im Kopf.

Die Hierarchie regelt die Welt

Ein Indiz, warum das so wichtig ist, könnt ihr aus der Geschichte des Internets ablesen. Am Anfang gab es hierarchische Dienste, wie CompuServe, Lycos oder AOL. Dort wurde die Fülle an Daten (Webpages) in einer Baumstruktur (also hierarchisch) organisiert: Das Internet → Sport → Fussball → UEFA-Cup → 2012, usw.

Weiterhin gibt es die Dateisysteme auf Computern. Am Anfang gab es lineare Systeme, wie Lochkarten und Magnetbänder. Seit der Erfindung von Random Access Memory (RAM) haben sich hierarchische Dateisysteme durchgesetzt. Alle momentan eingesetzten Dateisysteme sind hierarchisch: ext, ntfs, zfs, btrfs, fat, usw. Und das aus gutem Grunde.

Dem Menschen scheint eine Schubladisierung von Daten innezuwohnen. Wir sehen das bei Kapitel in Büchern, bei Aktenablagen, bei Branchenbüchern, bei Küchenschubladen, bei IMAP, bei Gesellschafts- und Firmenstrukturen, beim Aufbau von Dokumenten und an tausend anderen Stellen, insbesondere in der Natur: Ein Baum ist hierarchisch aufgebaut.

Das Problem bei hierarchischen Strukturen besteht in der Unärheit (ja, ich weiss, dass es dieses Wort nicht gibt). Man muss sich für genau eine Ablagestruktur entscheiden. Ein Dokument kann jedoch in den Folder 'Jahr 2022' und gleichzeitig in den Ordner 'Familienbilder' passen. Eine Lösung für dieses Zuordnungsproblem sind ewig lange Verzeichnisstrukturen. Diese erfordern Disziplin und stossen oft an die Grenzen von Pfadlängen von Dateisystemen.

Stichworte schaffen Flexibilität

Ein anderer Ansatz, um Daten zu strukturiert abzulegen sind Stichwörter, aka Tags. Dabei verzichtet man auf eine hierarchische Organisation und ersetzt diese durch die Zuweisung von Stichwörtern pro Datei. Die etablierten Dateisysteme unterstützten das Tagging nicht.

Der Vorteil des Taggings ist, dass man bei der Einordnung nicht eingeschränkt ist. Eine Rechnung lässt sich zum Beispiel so mit Stichworten versehen: "Rechnung, Meier GmbH, 2022, Büromöbel, Projekt_Refresh_Office". Damit kann das Dokument über eine Stichwortsuche aufgefunden werden, egal welchem Gedankengerüst man folgt.

Das grosse Problem beim Tagging ist die Uneinheitlichkeit. Um beim vorherigen Beispiel zu bleiben: "Rechnung oder Rechnungen", "2022 oder 22", "Meier Gmbh oder Meier", "Büromöbel oder Büro-Möbel", "Projekt_Refresh_Office oder Project Office"? Bei GNU/Linux.ch kennen wir dieses Problem nur zu gut. Wir haben ca. 9000 Stichwörter für die Artikelsuche und viele davon meinen dasselbe, beschreiben es aber etwas anders.

Einige der Note-taking-Apps, die wir in der Serie beschreiben, setzen auf Stichwörter, um die Texte zu organisieren. Ich glaube, dass die Entwickler hierbei Tagging als moderner empfunden haben, ohne sich tiefer mit den Grundlagen von Datenablage beschäftigt zu haben. Das Stichwort-Verfahren scheitert früher oder später; es ist nur eine Frage der Zeit und der Datenmenge. Diese These wird dadurch unterstützt, dass keines der relevanten Dateisysteme die Stichwort-basierte Dateieinordnung unterstützt, was mir gar nicht gefällt.

Die Suche beherrscht das Internet

Weiter oben in diesem Artikel habe ich es bereits angedeutet. Das Auffinden von Inhalten im Internet wurde im Jahr 1997 in seinen Grundfesten erschüttert. Larry Page und Sergey Brin starteten bereits 1996 mit dem Betrieb einer Suchmaschine, die damals noch den Namen "BackRub" trug. Am 15. September 1997 bekam das Projekt den Namen "Google" und veränderte die Art und Weise der Organisation von Daten. Seit dem wurde nicht mehr in Hierarchien gedacht, sondern nur noch über einen Suchbegriff nach Informationen gefahndet.

Lässt man die Bequemlichkeit ausser Acht und betrachtet lediglich das Verfahren, kommen jedem Informatikstudenten aus dem ersten Semester erhebliche Bedenken in den Sinn:

  • Hierarchische- und Stichwort-Organisation basiert auf Metadaten
  • Eine Suche-basierte Organisation basiert auf Inhalten, Metadaten und Referenzen
  • Die Suche ist fast immer auf die Interpretation der Inhalte angewiesen

Soll heissen, Hierarchische- und Stichwort-Organisation ist weitgehend nachvollziehbar, was bei der Suche nicht gegeben ist. Damit eine Suche gut funktioniert, müssen viele inhaltsbezogene Komponenten einbezogen werden. Wenn wir über die Internetsuche sprechen, kommen auch viele externe Faktoren hinzu, wie zum Beispiel die externe Aufmerksamkeit (wie oft ist die Seite verlinkt) und etliche weitere werbewirksame Faktoren.

Wenn man Google beiseite lässt und sich nur auf die reine Suche in Dateien beschränkt, gibt es weitere Herausforderungen. Sehr viele Dateien (Bilder, Videos, Anwendungen, Musik, binäre Office-Formate) lassen sich inhaltlich nicht durchsuchen. Dort ist man auf eine ordentliche Verschlagwortung angewiesen, wenn man nicht nur über den Dateinamen suchen möchte.

Das Beste von allem

Ihr ahnt, was jetzt kommt. Alle Organisationsprinzipien haben ihre Vor- und Nachteile. Da liegt es auf der Hand, die Verfahren zu kombinieren. Ohne es zum jetzigen Zeitpunkt genau zu wissen, behaupte ich, dass alle Anwendungen, die wir im Rahmen der Serie beschreiben werden, jedes der drei o.g. Organisationsprinzipien unterstützt; mehr oder weniger. Die meisten Note-taking Apps haben eine Hauptorganisation, entweder hierarchisch oder ein Tagging-System. Ein Suchfunkton bieten sie alle. Ob die Hauptorganisation auch noch durch das andere Prinzip (Hierarchie, Tags) ergänzt wird, ist je Anwendung unterschiedlich.

Tags

Outliner, Notizen, Knowledge, Organisation, Hierarchiestruktur, Tags, Suche