Mas, o que seria esse tal de OCR?
OCR é um acrônimo para o inglês Optical Character Recognition, uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem, ou mapa de bits. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável.
Confira abaixo uma dica bem interessante de um vídeo do olhar digital de como utilizar essa tecnologia.
Ps.: Existe um programinha chamado abby que também faz a função de OCR.