|
OCR (Optical Character Recognition) |
|
|
Optical Character Recognition (OCR) ist die (automatische) Erkennung von Zeichen und Texten aus digitalen Abbildungen analoger Vorlagen (i.d.R. eingescannte Papierdokumente) und die Umwandlung dieser in elektronische Textdokumente. Die erkannten Zeichen werden in Zeichencode (ASCII oder
ISO 8859) gewandelt und stehen somit für eine maschinelle Weiterverarbeitung
zur Verfügung.
Ursprünglich stand das Kürzel OCR für Verfahren zur Erkennung
genormter Schriften wie OCR-A (nur Großbuchstaben) und OCR-B (Groß- und
Kleinbuchstaben) über optische Leseeinheiten.
|