Software de imágenes de documentos JOCR

JOCR es un software de reconocimiento óptico de caracteres (OCR) especializado que puede reconocer caracteres a partir de imágenes tomadas en el escritorio de la computadora.

Antes de profundizar en la funcionalidad, debe tenerse en cuenta que JOCR requiere el componente Microsoft Office Document Imaging, que es un componente de Microsoft Office 2003 y las versiones más recientes de Office. La herramienta de Office debe estar instalada para que JOCR funcione.



JOCR en sí es un programa de software portátil. La interfaz se parece a la de un programa de software de captura de pantalla. Ofrece capturar una región, el escritorio o la ventana activa. Luego, la imagen se muestra en la interfaz del programa con opciones para imprimirla o copiarla, o para reconocerla, lo que inicia el proceso de OCR.

OCR con JOCR

document imaging software

El reconocimiento es, obviamente, la parte principal, ya que analizará la imagen en cuestión para descubrir todos los personajes que contiene. El software de creación de imágenes de documentos muestra el número de caracteres identificados y los muestra en el editor de texto predeterminado desde donde se pueden editar o copiar fácilmente.



El software de creación de imágenes de documentos puede resultar útil en situaciones en las que es necesario copiar texto de elementos de la interfaz. Pueden ser mensajes de error, texto que se muestra en aplicaciones o imágenes. La tasa de reconocimiento depende en gran medida del tipo de imagen y texto utilizados. Varía de brillante (casi no se requiere edición) a débil (no se reconocieron ciertos caracteres, se requiere mucha edición).

JOCR es compatible con los siguientes idiomas: chino, checo, danés, holandés, inglés, finlandés, francés, alemán, griego, húngaro, italiano, japonés, coreano, noruego, polaco, portugués, ruso, español, sueco, turco.

Veredicto

JOCR es un programa bien diseñado que puede utilizar para convertir texto en cualquier imagen o programa que vea en la máquina Windows en texto.

Nota: Jocr no se ha actualizado desde 2006, lo que hace que sea probable que no funcione en las versiones más recientes de Windows u Office. Una solución comparable es GOCR, un software de reconocimiento de caracteres de código abierto que puede descargar desde la página de Sourceforge del proyecto.

El programa está disponible para Linux y Windows, y como código fuente. Debe cargar imágenes en el programa para que el contenido textual de las imágenes se pueda convertir en texto sin formato que pueda copiar. Si bien no admite la función de captura de pantalla, es bastante fácil crear una captura de pantalla usted mismo, guardarla como un archivo de imagen y cargarla en el programa para que se reconozca el texto.