Vistas a la página

Clima

+11
°
C
+14°
+
San Juan
Jueves, 16
Viernes
+19° +
Sábado
+17° +
Domingo
+17° +
Lunes
+16° +
Martes
+14° +
Miércoles
+13° +
Previsión para 7 días

Auspiciantes

Tecno PC
Tu Mentor
Gustavo

Archivo del blog

On 11 enero 2011

1.- Instalar gscan2pdf & tesseract-ocr (junto con su respectivo paquete de idioma). O sea, en caso de que vayas a escanear documentos en inglés, instalá tesseract-ocr-eng; si son en español instalá tesseract-ocr-spa y así.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- El resto es bastante sencillo para aquellos que alguna vez escanearon e hicieron OCR a un documento en Windows. Abrí gscan2pdf, escaneá el documento, andá a Opciones > OCR y seleccioná Tesseract como motor de OCR. Existen otros motores, pero Tesseract es, por lejos, el que arroja mejores resultados. Por último, podés guardar el documento final como PDF, DJVU, etc. yendo a Archivo > Guardar.

Nota: al guardar los documentos escaneados es mejor guardarlos en formato DJVU (la calidad es la misma que la de un PDF pero hay una diferencia muy importante de tamaño).

El siguiente video está en inglés pero alcanza con verlo para entender cómo funciona todo.