¿Cómo convertir a texto una imagen escaneada?

Es posible que en alguna ocasión hayamos necesitado convertir documentos escaneados desde una imagen hacia un documento de texto, pero por desconocimiento o falta de herramientas, no lo hayamos conseguido. Normalmente esto puede conseguirse con software de escritorio (programas que se instalan en nuestros ordenadores), pero hoy en día y con la moda de trabajar en la nube, prácticamente cualquier aplicación de software tiene su versión web. En esta ocasión hablamos de NewOcr.com.

NewOcr es una web para generar ficheros de texto a partir de su versión en imagen. Es una manera muy sencilla y cómoda de transcribir nuestros documentos escaneados hacia un fichero de texto, para que posteriormente se pueda modificar en formato .txt (archivo de texto) o en .doc (Microsoft Word).

  • La web ofrece reconocimiento y transcripción hasta en 75 idiomas diferentes.
  • No tiene límites de ficheros.
  • No es necesario registrarse para convertir los ficheros.
  • Todos los documentos que se envían son eliminados del servidor una vez completada la tarea (no se almacenan en ningún sitio).
  • Reconocimiento de ecuaciones matemáticas.
  • Análisis de diseño de página (reconocimiento de texto multi-columna)
  • Selección del área a escanear.
  • Rotación de página: en sentido horario/antihorario, 90º y 180º.
  • Descargar como fichero.
  • Editar en Google Docs.
  • Traducción usando Google Translate o Bing Translator.
  • Publicar online en Pastie.com o Pastebin.com
  • Copiar al porta-papeles.
  • Soporta páginas fotografiadas y escaneadas a baja calidad.
  • Soporta imágenes a baja resolución.
  • Formatos de ficheros que acepta: jpeg, jfif, png, gif, bmp, pbm, pgm, ppm, pcx.
  • Ficheros comprmidos: compresión unix, bzip2, bzip, gzip.
  • Documentos multi páginas: tiff, pdf, djvu
  • Documentos docx y odt con imágenes.
  • Múltiples imágenes en fichero zip.
  • Formatos de salida en texto plano (txt), MicroSoft Word (doc) y Adobe Acrobat (PDF)
 
A continuación pasamos a explicar su funcionamiento y los pasos a seguir para realizar una captura de un documento:
  1. Tenemos que acceder con nuestro navegador favorito a www.NewOcr.com
  2. Luego, en la pantalla principal podemos seleccionar el fichero de la imagen que queremos convertir a texto que se encuentra localizada en nuestro ordenador personal, o bien, podemos seleccionar el fichero de imagen desde una URL o dirección de internet. En nuestro ejemplo, vamos a localizar una imagen que tenemos en nuestro ordenador:

    entrar en newocr.com

    selección del fichero desde nuestro ordenador

     
  3. Una vez hemos indicado uno de los dos métodos para establecer el fichero de imagen inicial, pulsamos el botón "Preview"

    Previsualizar el fichero

    y esperamos unos instantes...

    previsualizar ocr
  4. Ahora nos saldrá las opciones con las que queremos convertir el fichero de imagen a texto:

    1 - Reconocimiento del idioma. En este caso, español.
    2 - Rotación de imagen. Dejarla a 0º si no se quiere girar.
    3 - Marcar la opción si la imagen tiene texto en columnas.
    4 - Se cambiar la selección por defecto del texto que queremos convertir.
    5 - Pulsar en OCR para proceder a la conversión de la imagen en fichero de texto.

    opciones de ocr para convertir el fichero de imagen a texto
  5. Luego mas abajo de la pantalla podrás observar que se ha convertido la imagen a texto.

    Fichero de texto convertido
     
  6. En este punto podemos descargar el fichero de texto en formato de texto plano, documento de word, o  en un fichero PDF. En nuestro ejemplo seleccionamos el fichero de Microsoft Word.

    Seleccionar opción de Microsoft Word
     
  7. Luego vemos que se descarga el fichero en nuestro navegador:

    Abrir fichero convertido
     
  8. Y que al abrirlo, observamos que se ha convertido en el fichero de texto en formato Microsoft Word totalmente editable para aplicar el formato que queramos.

    Documento de word final convertido

Y de esta manera puedes convertir cualquier tipo de imagen sin límites de intentos.

 

Javier Leal Madueño

Técnico Superior en Desarrollo de Aplicaciones Informáticas

Contenidos que te pueden interesar
Este sitio usa cookies para personalizar el contenido y los anuncios, ofrecer funciones de redes sociales y analizar el tráfico. Ninguna cookie será instalada a menos que se desplace exprésamente más de 400px. Leer nuestra Política de Privacidad y Política de Cookies. Las acepto | No quiero aprender cursos gratis. Sácame