Papier-Posteingang digitalisieren 2.0

Do, 24. März 2022, Tim Moritz

Mit der Software paperless-ngx lässt sich aus gescannten PDFs noch mehr rausholen. Es kommt mit einem komfortablen Webinterface und ist damit anderen Lösungen überlegen.

In meinem Artikel Papier-Posteingang digitalisieren gehe ich auf die Soft- und Hardware ein, die ich verwende um alle meine Dokumente, die ich per Post bekomme, digital zu verwalten. Dank der gnulinux.ch Community, hat sich die Lösung im Software-Bereich mittlerweile deutlich verbessert und heute möchte ich euch ein Update geben.

In den Kommentaren zu meinem Artikel, wurde ich auf verschiedene andere Software-Lösungen zur Texterkennung und Verwaltung eingescannter PDFs hingewiesen. Unter anderem wurde paperless-ng vorgeschlagen und diese Software habe ich ausprobiert und längere Zeit im Einsatz gehabt. Im Chat unserer Community wurde ich dann darauf hingewiesen das paperless-ng kaum noch weiterentwickelt wird und das es mit Projekt paperless-ngx einen aktiven Fork gibt. An dieser Stelle ein Dank an die Community! Ich werde in dem Artikel auf paperless-ngx eingehen, wobei die meiste Basisarbeit sicherlich dem Mutterprojekt zuzuschreiben ist.


Die vorher verwendete Software Paperwork hat ihren Zweck zwar erfüllt, aber hat leider auch einige Schwächen. Die Such- und Sortierfunktionen sind sehr eingeschränkt und als Desktop-Anwendung ist die Benutzung von mehreren Clients sehr unpraktisch. Dafür lässt sich in ihr direkt scannen, was ich selbst aber gar nicht benötige.

Paperless-ngx hingegen ist als Server-Anwendung gedacht. Es bringt ein Webinterface mit, was es auch ermöglicht vom Smartphone aus auf seine Dokumente zuzugreifen. Ein Administrationsbereich inkl. Benutzerverwaltung wird auch mitgeliefert.

Um PDFs in die Sammlung aufzunehmen, kann man, wie bei Paperwork, einen Ordner überwachen, aber zusätzlich lassen sich auch Dokumente per IMAP-Import oder per Upload im Webinterface hinzufügen.
Das Webinterface bietet eine gute Suchfunktion mit UND- und ODER-Syntax. Es lässt sich zusätzlich nach Datum, Korrespondenz, Dokumenttyp und Tags filtern. Um diese Daten zu füllen kann man, ebenfalls beqeuem über das Webinterface, eigene Regeln definieren. Ausserdem kann man diese Werte auch für jedes Dokument einzeln bearbeiten inkl. dem erkannten Textinhalt.

Wer das ganze mal ausprobieren möchte, findet die offizielle Demo hier (Login demo / demo).

Was ist eure Meinung dazu?

Diskutiere mit uns oder schreibe bei uns mit!