Frog extrahiert Text aus Bildern

  Ralf Hersel   Lesezeit: 3 Minuten  🗪 2 Kommentare

Text und QR-Codes auslesen leicht gemacht.

frog extrahiert text aus bildern

Die Anwendung Frog von Andrey Maksimov aus Moskau, steht unter der MIT-Lizenz und liest Text aus Fotos aus. Es unterstützt die Aufnahme von Screenshots, kann aber auch Bilder direkt auslesen. Ebenso wird die Decodierung von QR-Codes unterstützt. Dabei kommt die freie Tesseract-OCR Engine zum Einsatz. Die zugehörigen Sprachmodelle werden aus dem Tesseract-Repository heruntergeladen, die OCR-Vorgang erfolgt lokal.

Frog gibt es als Flatpak und Snap-Paket. Nach der Installation empfiehlt sich das Herunterladen der gewünschten Sprachen. Diese geschieht über das Dreipunkt-Menü, Preferences, Languages. Es stehen hunderte von Sprachen zur Verfügung und das Herunterladen dauert nur ein paar Sekunden.

Nun öffnet man entweder ein bestehendes Bild, oder erstellt einen Screenshot eines Fotos, Videos, PDFs, usw. Für den Screenshot wird das Standardwerkzeug der eigenen Desktop-Umgebung verwendet. Nach dem Erstellen des Screenshots erlaubt man mit einem Klick die Weitergabe der Aufnahme an Frog. Dieses beginnt sofort mit der Text-Extraktion und stellt das Ergebnis in einem Textfenster dar.

Als Beispiel habe ich einen Screenshot vom GNU/Linux-ch Logo von unsere Startseite verwendet. Das Ergebnis der OCR-Erkennung sieht so aus:

Aus dem Gnu und Tux macht Frog (bzw. Tesseract) ein R und ein a; ansonsten wurde alles korrekt erkannt. Nun kann man den Text kopieren, sich vorlesen lassen oder teilen. Ausserdem ist es möglich, aus diesem Fenster direkt die nächste Erkennung zu starten. Dann habe ich das Auslesen eines QR-Codes an diesem Beispiel getestet (nur den QR-Code, nicht den Text daneben):

Frog konnte daraus den korrekten Text "example" auslesen.

Fazit

Frog ist ein nützliches Werkzeug, um Texte aus Bildern oder QR-Codes auszulesen. Es macht die Verwendung von Tesseract für alle ganz einfach. Positiv ist, dass die Verarbeitung lokal stattfindet. Falls ihr Frog selbst als Flatpak ausprobieren möchtet und es anschliessend wieder deinstalliert, solltet ihr nicht vergessen anschliessend mit Flatsweep oder Warehouse den Müll für die Tür zu bringen.

Quellen:

https://flathub.org/apps/com.github.tenderowl.frog

https://tenderowl.com/

https://github.com/tesseract-ocr/

Tags

Tesseract, OCR, QR-Code, Textextraktion, Foto, Bild

Julian
Geschrieben von Julian am 12. Oktober 2023 um 13:19

Jetzt noch eine vergleichbare App für's Android im f-droid Store und ich bin glücklich. Kann jemand eine vorschlagen?

Help
Geschrieben von Help am 14. Oktober 2023 um 23:07

Probier mal das: https://f-droid.org/en/packages/io.github.subhamtyagi.ocr/

Ich hab es nicht probiert.