Seguro que en más de una ocasión hemos hecho una fotografía a un documento o a un texto y posteriormente nos hemos visto obligados a extraer manualmente el texto a un documento de texto, perdiendo un valioso tiempo que podemos emplear en otras tareas. La solución a este problema pasa por utilizar programas de reconocimiento de caracteres, programas conocidos como OCR por sus siglas en inglés.

En internet, podemos encontrar un gran número de programas de este tipo, programas que podemos descargar en nuestro equipo o bien podemos utilizar versiones web para así no ocupar espacio en el disco duro si el uso que le vamos a dar es muy esporádico.

PDFelement

PDFelement es una interesante alternativa al todopoderoso Adobe Acrobat. No solo podemos editar y modificar archivos en este formato, sino que, además, también nos permite reconocer el texto tanto de imágenes como de archivos PDF para editar posteriormente en otras aplicaciones. Esta aplicación es compatible con más de 20 idiomas, realiza todo el proceso de forma local, por lo que no es necesario una conexión a internet y nuestros datos nunca saldrán de nuestro ordenador, por lo que es ideal para reconocer imágenes con datos personales.

OCR PDFelement

PDFelement está disponible para Windows y macOS. La versión gratuita de esta aplicación incluye un gran número de funciones, incluyendo la posibilidad de reconocer texto de imágenes y archivos en formato PDF. Pero, si queremos editar archivos en este formato, si debemos pasar por caja y comprar la respectiva licencia. Podemos descargar PDFelement a través del siguiente enlace.

Docsumo

Docsumo es una plataforma online que nos permite reconocer el texto tanto de imágenes como de archivos PDF con un máximo de 4 páginas o de 20 MB en caso de tratarse de una imagen. Esta plataforma nos permite reconocer textos en un gran número de idiomas y nos devuelve el texto en un archivo con extensión .json, .xlsx (Excel), .csv o .txt en formato plano.

Una vez se ha realizado el trabajo de reconocimiento del texto de la imagen, esta al igual que el documento creado se eliminan de sus servidores, por lo que, en principio, no debemos preocuparnos por nuestra seguridad, sin embargo, no es recomendable utilizar una plataforma online para extraer el texto de documentos importantes que incluyan datos personales.

También nos ofrece una aplicación para Windows en formato suscripción mensual, aplicación destinada a empresas que necesitan la tecnología OCR en el día a día. La versión online de Docsumo para reconocer texto de imágenes está disponibles a través del siguiente enlace.

OCR.space

Otra interesante opción que considerar para extraer el texto de cualquier imagen es OCR.space, una web que nos permite subir las imágenes o utilizar un enlace donde tenemos almacenada la imagen o archivo PDF del que queremos extraer el texto. Para que el proceso sea más rápido, podemos establecer el idioma en el que se encuentra el texto, nos permite modificar la orientación de la página e incluso reconocer tablas.

OCS space

Una vez ha reconocido el texto, la web nos devolverá un archivo en formato PDF. Si queremos que el proceso sea más rápido, podemos optar por que el texto se muestre en un cuadro de texto en la web y seamos nosotros los encargados de copiar y pegarlo en un documento nuevo. Este software no tiene ningún límite a la hora de subir archivos y está disponible a través del siguiente enlace

Fuente: https://www.softzone.es/

Dejá un comentario

Dejá una respuesta