domingo, abril 26, 2009

OCR Gratis: Convertir una imagen escaneada en texto con FreeOCR

Vía Arturogoga


http://www.arturogoga.com/2008/10/14/ocr-gratis-convertir-una-imagen-escaneada-en-texto-con-freeocr/

La mayoría de programas de reconocimiento óptico de texto (OCR) cuestan dinero, y si tuviese que elegir entre la gran cantidad de programas disponibles (incluyendo los comerciales), definitivamente me iría por  Abbyy FineReader. Ningún otro programa se le acerca en cuanto a facilidad de uso, calidad del resultado, y posibilidad de reconocer múltiples idiomas. El único problema, es que el programa cuesta. Y bastante ($269, para ser exactos, por la versión 9.0 Pro).

Así que, buscando algunas alternativas gratuitas, sobre todo cuando nuestra impresora multifuncional incluye un programa de escaneo, pero no uno que convierta lo escaneado en texto, en lugar de una simple imagen,  me topé con FreeOCR, un programa que cumple una similar función pero, honestamente, no ofrecerá la misma calidad de Abbyy. Sin embargo, para tareas comunes, funciona bastante bien.

Picture 12

FreeOCR es bastante simple de utilizar. Simplemente descargamos e instalamos el programa, y nos toparemos con una interfaz idéntica a la de la foto. Como pueden ver, entre los botones del menú, encontramos Scan (para escanear directamente) y Open para abrir imágenes que ya hayamos escaneado con anterioridad.

OCR, el último botón, es el que convertirá la imagen, a texto, que luego podremos copiar y pegar, o exportar a Word, etc.

El inconveniente? Que por defecto, no incluye el idioma español.

 

Cómo añadir español a FreeOCR?

FreeOCR está basado en el motor Tesseract OCR, ahora mantenido por google, así que para descargar el diccionario en español y permitirle al programa reconocer este idioma, tendremos que ir aquí:

http://code.google.com/p/tesseract-ocr/

Y buscar el Spanish language data for Tesseract (2.00 and up). Link directo aqui.

Luego de descargar el archivo y descomprimirlo, vamos a FreeOCR, y en Settings, le damos click a Open Language Folder.

Aquí, pegamos todos los archivos descargados del diccionario en español, y cerramos / volvemos abrir el programa. Ahora, notaremos que FreeOCR nos ofrece, a la mano derecha, la opción de elegir el español como idioma:

Picture 16

Como dije al comienzo, el programa no es tan completo, ni mucho menos más preciso que Abbyy, pero definitivamente nos puede sacar de un apuro, si tenemos la urgencia de convertir alguna imagen escaneada, en texto que se deje copiar / pegar

No hay comentarios.:

Publicar un comentario

Gracias! ¿Qué sería de la red sin tu opinion? Algo muy aburrido! :D