Ejecutar trabajo Hbase ImportTSV de forma remota

Estoy tratando de ejecutar HBase importTSV hadoop job para cargar datos en HBase desde un archivo TSV. Estoy usando el siguiente código.

    Configuration config = new Configuration();
    Iterator iter = config.iterator();
    while(iter.hasNext())
    {
        Object obj = iter.next();
        System.out.println(obj);
    }

    Job job = new Job(config);
    job.setJarByClass(ImportTsv.class);
    job.setJobName("ImportTsv");
    job.getConfiguration().set("user", "hadoop");
    job.waitForCompletion(true);

Me sale este error

ERROR security.UserGroupInformation: PriviledgedActionException como: E317376 causa: org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permiso denegado: usuario = E317376, acceso = ESCRITURA, inodo = "puesta en escena": hado supergrupo: rwxr-xr-x

No sé cómo se configura el nombre de usuario E317376. Este es el usuario de mi máquina Windows desde donde estoy tratando de ejecutar este trabajo en un clúster remoto. Mi cuenta de usuario de Haddop en Linux es "hadoop"

Cuando ejecuto esto en la máquina Linux, que es parte del clúster Hadoop bajo la cuenta de usuario hadoop, todo funciona bien. Pero quiero ejecutar programáticamente este trabajo en una aplicación web de Java. Estoy haciendo algo mal. Por favor ayuda...

Respuesta 1

deberías tener una propiedad como abajo en tu archivo mapred-site.xml

<property>
<name>mapreduce.jobtracker.staging.root.dir</name>
<value>/user</value>
<property>

y tal vez sea necesario cambiar la carpeta / user de su sistema de archivos dfs a 777

no olvide detener / iniciar sus rastreadores de trabajos y rastreadores de tareas (sh stop-mapred.sh y sh start-mapred.sh)

Respuesta: 2

Tengo datos como a continuación CategoryId CategoryName CategoryParentId 123 XYZ 111 111 ABC 222 PQR 555 DEF 111 321 IJK ...

Tengo una declaración SQL muy larga dentro de una cadena Java. En eclipse, ¿cómo puedo obtener fácilmente el texto de la declaración SQL sin la sintaxis de Java String? Lo he estado eliminando manualmente, pero en IntelliJ Idea, ...

Tengo un clúster Apache Flink con el modo independiente, quiero configurar Flink Metrics. config en flink-conf.yaml metrics.reporters: my_jmx_reporter, my_other_reporter metrics.reporter ...

Tengo que hacer coincidir la siguiente llamada para devolver un objeto: String [] [] parámetros = new String [] [] {new String [] {eq ("proveedor"), eq ("...