Elastic Search Lucene fórmula de cálculo utilizando Java

Nuevo en la búsqueda Elastic, que utiliza un índice para almacenar los documentos que, por ejemplo, es información de la compañía sobre los empleados, actualmente hay 600,000 datos de empleados en el índice, entre estos empleados tenemos que calcular los cálculos de distancia en función de un atributo particular como la dirección. Lo que hacemos es esencialmente los siguientes pasos:

  • Extraiga todos los documentos dentro del índice en un programa java.
  • Use Lambdas para el paralelismo e itere sobre cada documento y luego calcule la distancia (lavenshtien, NGram y TFID) con otros elementos en las colecciones y luego promedie el valor.

El problema con este flujo es que cargamos todos los documentos presentes en el índice en la memoria de Java y luego aplicamos las fórmulas, esto consume mucho tiempo tanto para cargar como para aplicar las fórmulas, además JVM tendrá una limitación de memoria para cargar los documentos en memoria.

Perdóname por un conocimiento limitado sobre el tema, pero ¿hay alguna manera de que podamos ejecutar estas fórmulas de distancia directamente en la búsqueda elástica en lugar de cargar todo el índice en la memoria?

Gracias por la ayuda...

Respuesta 1

PersistenceHelper-context.xml <bean id = "dataSource" class = "org.springframework.jdbc.datasource.DriverManagerDataSource"> <! ----> <nombre de propiedad = "driverClassName" value = "org ....

¿Hay alguna manera de comunicarse entre subprocesos, como obtener variables con getters a medida que se actualizan en un subproceso diferente? Por ejemplo, si estoy cargando imágenes en un subproceso ejecutable de esta manera: Subproceso ...

Tengo un RestTemplate que lo construyo con RestTemplateBuilder. Configuré el rootUri para el constructor. En el siguiente método (updateState1) a veces recibí el error "URI no es absoluto". Por ejemplo cuando llamé ...

Tengo actividad de fondo en la que escucho la ubicación de GPS. Encima tengo actividad de mapa. ¿Cómo puedo notificar la actividad del mapa cuando ocurrió un evento en segundo plano después de que la actividad ya ...