Mapeo de Elasticsearch: ¿existe una desventaja en el uso de texto de tipo para propiedades que son palabras clave por naturaleza?

Mi pila: Elasticsearch 5.4 (con la versión correspondiente de java client y kibana)

Hola, estoy usando el mapeo dinámico al crear nuevos índices, y estoy usando la sección a continuación en mi mapeo para propiedades desconocidas.

    {
      "string_fields": {
        "match": "*",
        "match_mapping_type": "string",
        "mapping": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        }
      }
    }

Estoy indexando aproximadamente 30k de documentos por segundo, y la cantidad de propiedades únicas desconocidas puede ser grande (alrededor de 5k en todos los índices).

Preguntas:
¿Hay algún impacto en el rendimiento (latencia / cálculo / memoria / disco)? Debería preocuparme al indexar propiedades como texto, donde, de hecho, deberían ser solo palabras clave por naturaleza.

¿Debería hacer un esfuerzo en la lógica de mi aplicación para identificar si cada nueva propiedad desconocida es más adecuada para mapearse como texto o palabra clave solamente?

Respuesta 1

Me gustaría ejecutar el trabajo ~ inmediatamente con el planificador de cuarzo usando el almacén de datos jdbc. Sin embargo, tengo entre 20 y 30 segundos de retraso entre la programación y el disparo, aunque programo con now () ...

Actualmente estoy desarrollando un complemento Eclipse y estoy un poco perdido ... Tengo una naturaleza personalizada y quiero agregar un .jar al classpath de los proyectos del usuario cuando el usuario agrega esta naturaleza (quiero actualizar. ..

Estoy usando netty en modo cliente usando ClientBootstrap. Cuando intento recibir un mensaje la mayoría de las veces funciona bien y me devuelve solo un cuerpo, pero a veces (el servidor siempre devuelve la misma respuesta) ...

Soy nuevo en AWS. ¿Alguien puede decirme cómo puedo usar el administrador de sesión memcached con instancias EC2 en las que está instalado tomcat para manejar los datos de sesión? ¿Cómo se puede usar elasticache en este contexto?