/ / Cómo unir dos tablas en Hbase: hadoop, mapreduce, hbase

Cómo unir dos tablas en Hbase - hadoop, mapreduce, hbase

Problema:

Soy nuevo en Hbase y me encontré con una situación en la que necesito unir dos tablas.
Supongamos que tengo la tabla Employee y la tabla Department ambas creadas en Hbase. Al leer Hbase en acción, supe que no podemos unir tablas en Hbase.

Solución:

Encontré una solución que al escribir el código de MapReduce usando clases e interfaces Hbase podemos lograr esta tarea.

Además, si alguien me puede ayudar con la codificación, sería muy útil

Respuestas

1 para la respuesta № 1

La forma más fácil sería cargar sus tablas HBase en Colmena o Impala y realizar una unión SQL con esas herramientas.


5 para la respuesta № 2

Deberías mirar este problema de jira en apache. Debe usar MultiTableInputFormat. https://issues.apache.org/jira/browse/HBASE-3996

Ver también: como unir tablas en hbase


1 para la respuesta № 3

Usar Hive o Impala es costoso cuando los datos son paragrande y nos enfrentamos a problemas como Hbase kill (servidor de región inactivo). por lo tanto, es conveniente cuando los datos son pequeños pero no para datos grandes. En mapreduce, tome el objeto de tabla Hbase para tomar una tabla y, al extender tablemapper, use la segunda tabla. De esta manera puedes unirte a 2 mesas.