OCR Software – Definition, Prozess & Arten

24.10.2018 Digitalisieren für Unter... Lesedauer: 4min

Wie gefällt Ihnen dieser Beitrag?

0 Bewertungen


scan-blog-digitalisieren-ocr-software-01

Eingescannte Dokumente bedeuten oft zunächst Aufwand für ein Unternehmen, da die Datei nicht editiert oder Textpassagen gesucht werden können. Diesem Problem wirkt die OCR-Texterkennung entgegen, welche die bloße grafische Darstellung aus Pixeln in echten Text umwandelt. Gerade für die Texterkennung in PDF-Dokumenten ist eine solche Software sehr hilfreich, welche der folgende Artikel in allen Einzelheiten erklären soll.

OCR Software „kurz erklärt“

Eine OCR Software erkennt Buchstaben, Zahlen und Zeichen auf einem eingescannten Dokument und wandelt diese in editierbaren Text um. Das Verfahren beschleunigt die Digitalisierung und verringert den Verwaltungsaufwand maßgeblich.

Definition: OCR Software

OCR, kurz für Optical Character Recognition (zu Deutsch optische Zeichenerkennung), ist eine Software, welche den Text eines grafisch gescannten Dokuments in eine editierbare Version umwandelt. Dies erleichtert das Digitalisieren und die Verwaltung, da nun auch nach Textpassagen im Dokument gesucht werden kann.

Prozess

Viele ältere Scanner übernehmen das Dokument lediglich als Grafik, ohne dass der Text selbst bearbeitet werden kann. Die Überführung in ein editierbares Dokument erfolgt dann mit Hilfe einer OCR Software in den folgenden Schritten:

  1. Layoutanalyse
    In der Layoutanalyse scannt die Software den Seitenaufbau und trennt Bilder von Textpassagen. Auch Seitenanzahl und -nummern werden untersucht und abgespeichert. In einigen Fällen muss dieser Schritt auch manuell vorgenommen werden, abhängig vom Alter des verwendeten Programms.
  2. Textanalyse
    Im folgenden Schritt zerteilt die OCR Software die einzelnen Textblöcke zunächst in Sätze, dann in Wörter und schließlich in Buchstaben.
  3. Zeichenvergleich
    Anschließend werden die einzelnen Buchstaben und Zeichen mit Mustern einer Datenbank verglichen. Der Algorithmus geht hierbei sehr präzise vor, kann aber dennoch Fehler machen. Besonders sich ähnelnde Zeichen wie „B“ und „8“ oder „I“ und „l“ werden schnell verwechselt, da das OCR-Programm keinen Kontext erkennt.
  4. Textformulierung
    Im letzten Schritt rekonstruiert das Programm den Text aus den einzelnen Zeichen. Da im dritten Schritt durchaus Fehler unterlaufen können, wurde die OCR-Software stetig weiterentwickelt zu einer AI-OCR bzw. ICR (Intelligent Character Recognition), welche ebenfalls den Kontext des Textes erkennen und somit falsche Zeichen austauschen kann. Dies erspart den Schritt der manuellen Endkontrolle.
OCR-Software-Prozess

Arten

Generell können vier Arten von OCR Softwares unterschieden werden, welche entweder eine Weiterentwicklung des ursprünglichen Modells oder eine Ergänzung dazu darstellen.

Die einfache OCR erfolgt über einen simplen Zeichenvergleich auf Basis einer angelegten Musterdatenbank. Die Übersetzung ist hierbei limitiert auf die gespeicherten Zeichen und somit auch Sprache.

Die Optical Mark Recognition, kurz OMR, übernimmt alle Nicht-Bild- und Nicht-Text-Inhalte, beispielsweise Kontrollkästchen in Umfragen, Unterschriften, Wasserzeichen, Logos oder Symbole. Oft ist eine OMR in ein OCR-Programm bereits integriert. Dies ist jedoch abhängig vom Anbieter und von den Anforderungen des Nutzers.

Heute verwenden nahezu alle OCR Softwares KI (Künstliche Intelligenz), auch AI-OCR genannt, um auch den Kontext des gescannten Textes richtig zu interpretieren. Dadurch werden Verwechslungen zwischen ähnlich aussehenden Zeichen (z.B. B und 8, I und l, oder O und 0) behoben ohne die Notwendigkeit einer manuellen Kontrolle. Durch die Künstliche Intelligenz der ICR (Intelligent Character Recognition) können sogar handgeschriebene Texte in digitale Schrift umgewandelt werden, wenn sie leserlich genug sind oder die KI vorher auf diese Handschrift trainiert wurde.

Die intelligente Worterkennung ist die neueste Entwicklungsstufe der ICR, welche nicht mehr nur einzelne Zeichen erkennt und sinnvoll zusammenfügt, sondern vollständige Wörter durch deren grafischen Aufbau erkennt. Diese Technologie beschleunigt den Texterkennungsprozess maßgeblich.

Digitalisieren Sie die Unterlagen
Ihres Unternehmens
Starten Sie jetzt ins digitale Zeitalter und digitalisieren Sie ganze Archive oder schaffen Sie ein papierloses Büro. Wir scannen für Sie Dokumente, Akten, Rechnungen, Pläne sowie viele weitere Medien und machen sie digital einsehbar.

Zusammenfassung

Eine OCR Software, abgekürzt oft als OCR SW, ist also ein Programm, welches ein eingescanntes Dokument in eine editierbare Textdatei umwandelt. Dabei werden vier Arten unterschieden: die einfache OCR (Optical Character Recognition), die OMR (Optical Mark Recognition), welche alle nicht-Text Einheiten erkennt und übernimmt, die ICR (Intelligent Character Recognition), welche auch den Kontext des Dokuments beachtet, und die intelligente Worterkennung, welche noch schneller Ergebnisse liefert.

Der Prozess durchläuft vier Phasen, in welchen zunächst die Grundlegenden Daten des Layouts analysiert und festgelegt werden. Daraufhin wird der Text in seine einzelnen Zeichen zerlegt, welche nun mit Hilfe eines Zeichenvergleichs in Buchstaben übersetzt werden. Abschließend fasst die Software die Zeichen wieder in Wörtern und Sätzen zusammen.

Häufig gestellte Fragen

Eine OCR Software ist ein Programm, welches einen grafischen Scan in ein editierbares Textdokument umwandelt.

Ja, OCR Softwares verwenden KI für die Zeichenerkennung sowie Überarbeitung im Zuge einer Kontextanalyse. Letzteres fällt dabei unter die Weiterentwicklung ICR (Intelligent Character Recognition).

Online gibt es viele kostenlose und kostenpflichtige Tools zur OCR-Texterkennung. Für Unternehmen mit großen Massen an Dokumenten zur Digitalisierung eignet sich jedoch ein Scandienstleister wie ScanProfi, welcher alle Dokumente scannt und bei Bedarf auch regelkonform vernichtet.