OCR (ang. „optical character recognition” – optyczne rozpoznawanie znaków) określa proces lub oprogramowanie do przetwarzania plików graficznych lub rastrowych poprzez wyodrębnienie z nich tekstu w formie edytowalnej. Najczęściej stosowane w przypadku zeskanowanych dokumentów bez możliwości edytowania zawartego w nich tekstu. Proces ten stosowany jest m.in. podczas digitalizacji papierowych dokumentów lub – w branży tłumaczeniowej – przy przygotowaniu plików do tłumaczenia w programie CAT.
Autor:
Majka Maćkowska
05.02.2023