Cómo leer plantillas PDF usando Java OCR

¿Alguien puede sugerir una solución para el siguiente escenario?

Tenemos menús de restaurantes. Cada restaurante tiene su propio menú. El objetivo es identificar los elementos en el menú, como elementos del menú, ingredientes, precios, etc. y actualizar la base de datos.

Ejemplo de Fox: un menú de restaurante puede contener elementos de menú como "Pollo", "Vegetariano", etc. en un grupo llamado "Sandwiches".

Para eso estoy planeando usar una implementación Java de OCR. ¿Funcionará esto?

Respuesta 1

Si quieres utilizar OCR dentro de su código se puede ir con Tessrect-OCR con algunos nativos developement.Its una biblioteca muy potente con tener acceso rápido output.this es para clase contenedora para Tessrect o también puede utilizar Tess4j alternativa a Tesjeract (primera uno). Esta es la misma biblioteca utilizada por Google y también puede agregar soporte para múltiples idiomas.

Respuesta: 2

Convierta el PDF a una imagen (usando javacv, etc.) y OCR con tesseract o tess4j. No es una solución permanente o la mejor, ¡pero funciona muy bien!

Respuesta: 3

Si está escribiendo el PDF y luego usándolo, no hay necesidad de hacerlo; simplemente lea el PDF (ver más abajo). Sin embargo, si está escaneando en PDF (una imagen, no texto), deberá recurrir a OCR.

Para leer el PDF de un archivo, puede usar algo como iText o PDFBox

Respuesta: 4

Quiero que mi código se repita, pero reinicialice la variable a 0. Cada vez que ingreso un número, lo agrego al resultado anterior, pero quiero que se restablezca. Adjunto dos imágenes a continuación. Uno es el actual ...

Me gustaría saber qué pensar cuando escribo lo que debería ser un método perfectamente bueno, pero no se reconoce como un método. Aquí está. GObject privado getCollidingObject () {gobj = ...

Este es el resultado final que estoy tratando de obtener: ItemStack block = new ItemStack (Block.dirt, 1); Y esto es lo que tengo String s = "Block.dirt"; ItemStack block = nuevo ItemStack (, 1); Eso ...

Estoy teniendo una duda Entiendo que jdk tiene [jre + herramientas de desarrollo (Java, javac, depurador, etc.) + código fuente (src.zip)]. Ahora trabajar en el compilador de Java no tiene nada que ver con ...