Duden-Abfrage in der Kommandozeile

Fr, 27. November 2020, Marco

In letzter Zeit habe ich des Öfteren Dokumente, welche abgegeben werden müssen, mit LaTeX in der Konsole bearbeitet. LaTeX kennt - die entsprechenden Einstellungen vorausgesetzt - viele deutsche Silbentrennungen, allerdings gibt es gewisse Wörter, für die die automatische Silbentrennung nicht bekannt ist. Wenn eine Silbentrennung nicht automatisch erkannt wird und das Zeilenende erreicht ist, kann es dazu führen, dass es zu einer overflow hbox-Warnung kommt. Diese Warnung sagt einfach gesagt aus, dass der Text über die definierte Textbreite hinaus geht. Damit ich die Warnungen beheben kann, habe ich jeweils auf der Webseite des Dudens nach dem jeweiligen Wort gesucht und die entsprechenden Trennzeichen hinzugefügt.

Da der ständige Wechsel zwischen dem Browser und der Konsole für mich eher mühsam war, habe ich nach einem Tool gesucht, welches in der Konsole die gewünschte Abfrage macht. Ich habe das Python-Programm Duden gefunden, welches ich kurz vorstellen möchte.

Das Kommandozeilen-Programm duden ist in Python geschrieben und unter der MIT-Lizenz veröffentlicht. Mit dem Befehl pip3 install duden kann das Programm systemweit installiert werden. Mit pip3 install duden --user ist es möglich, das Tool lediglich für den aktuellen Benutzer zu installieren. Die Anwendung des Tools ist sehr einfach. Wenn man zum Beispiel das Wort Lexikon nachschlagen möchte, so muss lediglich duden Lexikon eingegeben werden und es liefert die Ergebnisse, welche im Screenshot ersichtlich sind. Die Ausgabe des Programms kann mit unterschiedlichen Parametern angepasst werden. Ich habe für mich den Alias alias wordsep='duden --word-separation' eingerichtet, damit ich auf einen Blick erkenne, wie das Wort getrennt werden soll. Weitere Möglichkeiten des Programms sind das Exportieren in ein Yaml-Format oder eine Fuzzy-Suche. Das Modul kann auch in anderen Python-Anwendungen importiert werden, um die Funktionen zu nutzen. Detailliertere Informationen sind auf der Projektseite (siehe Quelle) ersichtlich. Wenn lediglich eine Silbentrennung gebraucht wird, kann auch die Python-Bibliothek pyphen verwendet werden, welche auf den hunspell-Bibliotheken basiert.

Quelle: https://github.com/radomirbosak/duden