OCR-Technologie hilft bei der Sprachübersetzungsentwicklung

Aug 15, 2022 Eine Nachricht hinterlassen

Was ist OCR?

Die optische Zeichenerkennung (OCR) bezieht sich auf den Prozess der Umwandlung von Textbildern in ein maschinenlesbares Textformat. Wenn Sie beispielsweise ein Formular oder eine Quittung scannen, speichert der Computer den Scan als Bilddatei. Sie können Text in einer Bilddatei nicht mit einem Texteditor bearbeiten, suchen oder zählen. Sie können OCR jedoch verwenden, um Bilder in Textdokumente umzuwandeln und Inhalte als Textdaten zu speichern.

png

Warum ist OCR so wichtig?

Die meisten Geschäftsabläufe beinhalten den Zugriff auf Informationen über Printmedien. Papierformulare, Rechnungen, gescannte Rechtsdokumente und gedruckte Verträge sind alle Teil des Geschäftsprozesses. Es braucht viel Zeit und Platz, um diese riesigen Dokumente zu speichern und zu verwalten. Trotz des Trends zum papierlosen Dokumentenmanagement ist das Scannen von Dokumenten in Bilder immer noch eine Herausforderung. Der Prozess erfordert menschliches Eingreifen, ist umständlich und langsam.

Außerdem kann die Digitalisierung von Dokumentinhalten zu Bilddateien mit verstecktem Text führen. Textverarbeitungsprogramme können Text in Bildern nicht wie Textdokumente verarbeiten. OCR löst dieses Problem, indem Textbilder in Textdaten umgewandelt werden, die von anderer kommerzieller Software analysiert werden können. Sie können die Daten dann verwenden, um Abläufe zu analysieren, zu verbessern, Prozesse zu automatisieren und die Produktivität zu steigern.

7d9be6872456af033802d073206010b

Wie funktioniert OCR?


Bildaufnahme

Scanner lesen Dokumente und wandeln diese Dokumente in binäre Daten um. Die OCR-Software analysiert das gescannte Bild und klassifiziert helle Bereiche als Hintergrund und dunkle Bereiche als Text.

Vorverarbeitung

Die OCR-Software bereinigt zunächst das Bild und entfernt Fehler in Vorbereitung auf das Lesen. Hier sind einige Reinigungstechniken, die dafür verwendet werden:

Leichte Offset-Korrektur oder Schräglage gescannter Dokumente während des Scannens, um Ausrichtungsprobleme zu beheben.

Entfernen Sie Rauschen, Flecken von digitalen Bildern oder glätten Sie die Ränder von Textbildern.

Bereinigen Sie Ränder und Linien in einem Bild.

Schrifterkennung mit mehrsprachiger OCR-Technologie

Texterkennung

Die beiden Haupttypen von OCR-Algorithmen oder Softwareprozessen, die von OCR-Software zur Texterkennung verwendet werden, sind Musterabgleich und Merkmalsextraktion.


Musterabgleich

Der Musterabgleich trennt ein Bild eines Zeichens (als Glyphe bezeichnet) und vergleicht es mit gespeicherten ähnlichen Glyphen. Der Musterabgleich funktioniert nur, wenn die gespeicherte Glyphe eine ähnliche Schriftart und Größe wie die Eingabeglyphe hat. Diese Methode eignet sich gut für gescannte Bilder von Dokumenten, die in bekannten Schriftarten eingegeben wurden.


Merkmalsextraktion

Die Merkmalsextraktion segmentiert oder zerlegt Glyphen in Merkmale wie Linien, geschlossene Schleifen, Linienorientierung und Linienfokus. Es verwendet dann diese Merkmale, um die beste oder engste Übereinstimmung unter den verschiedenen gespeicherten Glyphen zu finden.


Nachbearbeitung

Nach der Analyse wandelt das System die extrahierten Textdaten in Computerdateien um. Einige OCR-Systeme können kommentierte PDF-Dateien erstellen, die Pre- und Post-Scan-Versionen gescannter Dokumente enthalten.