OCR

Optical Character Recognition (OCR) ist die englische Bezeichnung für die optische Zeichenerkennung. Der Begriff steht heute nicht mehr nur für die Erkennung einzelner Zeichen, sondern vielmehr für Texterkennung. Die gelesenen Zeichen werden zu Wörtern zusammengefasst und mit Wörterbüchern verglichen, die Erkennungsgenauigkeit wird dadurch verbessert.

OCR ermöglicht die Umwandlung unterschiedlicher Dokumente, wie beispielsweise gescannter Papierdokumente, PDF-Dateien oder Digitalbilder in bearbeitbare und durchsuchbare Dateien.