Screenshot für Texte

  Ralf Hersel   Lesezeit: 5 Minuten  🗪 1 Kommentar

Normcap ermöglicht Text-Extraktion aus Screenshots.

screenshot für texte

Ungewöhnliche Herausforderungen erfordern ungewöhnliche Lösungen. NormCap ist eine solche ungewöhnliche Lösung. Normalerweise möchte man einen Screenshot von seinem Monitor, einer Anwendung, oder von einem Ausschnitt machen. Als Resultat erhält man ein Pixel-Bild im png- oder jpg-Format. An dieser Stelle des Artikels frage ich mich selbst, warum die Screencapture-Anwendungen so beschränkt sind.

NormCap ist für höhere Zwecke geschaffen. Mit dieser Anwendung könnt ihr Texte aus Fotos auslesen. Dafür kombiniert die Anwendung eine gewöhnliche Bildschirmaufnahme mit Optical Character Recognition (über Tesseract). Zum Testen habe ich NormCap als Flatpak in einer VM installiert und das Titelbild geöffnet. Nach dem Start von NormCap, fragt die Anwendung, ob sie einen Full-Screenshot erstellen darf und stellt sogleich ein Fadenkreuz dar, mit dem der auszulesende Bereich markiert werden kann.

Dann erscheint eine Benachrichtigung darüber, dass NormCap nun im Hintergrund läuft. Sobald Tesseract seine OCR-Arbeit verrichtet hat, erhält man eine weitere Benachrichtigung. Nun liegt das Ergebnis in der Zwischenablage und kann weiterverwendet werden. Das Ergebnis meines Tests sieht so aus:

eee &
— Chicago Gribune —
MONDAY, JULY 21, 190
tee ere Section 1-3
‘GIANT LEAP FOR MANKIND"
Armstrong Takes Ist Step on Moon
BY FRED FARRAR
1Orceeme Tear Pree bemweet
Heuston, Jaly 21 (Menday]—“T'm going to step off the LM now. That's one small step for man; Owe giant leap for mankind,”
With these words, Neil A. Armstrong be came the first man to set foot om the surface of the moon.
The histerie moment came 20 seconds after #56 inst night, 3 hours and 16 minutes ahead of schedule and 6 hears and 39 minutes after Arm strong and Edwin E. Aldrin Jr. made a safe and virtually flawless landing on the moen.
The moon walk, which was televised live thracat the werld, ended at 12:09 a. m., 2 hours, 13 minutes, and 12 seconds after it started, when Armstrong follewed Aldrin back inte the lusar module.
At approximately 12:50 p. m. today, they are scheduled to Wifi off from the moon is the ascent tage to renmderveus and dock with astronaut Michael Collies, who remained im orbit around the moon in the mother ship, for the trip back to earth.
Wh. teadine aed the econ wall eee @ fool
that awed millions and wes a triamph for Ameri- can ingeneily, technology, and daring.
And the television broadcast gave the werld an instant aed unbelievably clear pictere of the rugged surface ef the moon as the astronauts walked and werked, moving in and eat of the camera's view.

Berücksichtigt man die grottenschlechte Vorlage, finde ich das Ergebnis sehr gut.

Ungewöhnlich ist, dass NormCap kein Anwendungsfenster hat. Stattdessen legt die App gleich los und beschränkt sich auf seine Aufgabe: Bereich auswählen, Zeichen erkennen, Zwischenablage füllen. Ganz so minimalistisch ist es doch nicht. Bevor man den Bereich auswählt, wird rechts oben ein rotes Zahnrad angezeigt, über das man auf die Einstellungen von NormCap Zugriff erhält.

Erwähnenswert ist der Capture Modus: mit der Standardeinstellung parse, versucht NormCap die Struktur des Textes zu bewahren (Umbrüche, Absätzte, usw.). Wählt man raw, wird der reine Text ausgelesen, ohne die Struktur zu berücksichtigen. Des Weiteren kann man Sprachen hinzufügen, damit Tesseract weiss, womit sie es zu tun hat. Zum Schluss zeige ich euch noch ein weiteres Ergebnis. Hier habe ich die GNU/Linux.ch-Seite mit der deutschen Spracheinstellung scannen lassen:

Zum Wochenende: Lässt KI die Blase platzen?
Dann geht doch zur KI und lass sie die Probleme der Community lösen! Lesezeit: 6 Minuten
Fr, 19. Mai 2023, Ralf Hersel
Wie so oft, werfen meine Artikel-Überschriften mehr Fragen auf, als sie den Artikel-Inhalt beschreiben. Ja, das kann man als Clickbaiting bezeichnen. Bei GNU/Linux.ch ist das aber
nicht negativ gemeint, weil wir in den Artikeln keine Werbung betreiben, euch nichts verkaufen wollen, nichts tracken und ohnehin ganz lieb sind. Mir macht es einfach Spass,
Titel zu schreiben, die auf den ersten Blick ein wenig in die Irre führen.

Keine Fehler! Sehr gute App!

Quelle: https://github.com/dynobo/normcap

Tags

Screenshot, OCR, Texterkennung

tuxfanmatze
Geschrieben von tuxfanmatze am 15. Mai 2023 um 21:45

Gutes Tool, hbe ich auch grad entdeckt. Ersetzt bei mir als ältere Tool Textsnatcher, welches mit einer sehr alten Flatpak XDG Platform Gnome 3.36 gebaut wurde, die end of life ist.