/ / ¿El significado de “Las acciones de Apache Oozie son asíncronas”? - hadoop, asíncrono, oozie

¿Significado de "las acciones de Apache Oozie son asíncronas"? - hadoop, asíncrono, oozie

Esta documentación de Apache. Dice que las acciones de Apache Oozie son asíncronas. Pero también menciona el mecanismo para verificar el estado de la acción.

3.2.1.2 Las acciones son asíncronas

Todas las tareas de computación / procesamiento activadas por unLos nodos de acción son ejecutados de forma asíncrona por Oozie. Para la mayoría de los tipos de tareas de computación / procesamiento activadas por la acción del flujo de trabajo, el trabajo del flujo de trabajo debe esperar hasta que la tarea de computación / procesamiento se complete antes de pasar al siguiente nodo en el flujo de trabajo.

La excepción es la acción fs que se maneja como una acción síncrona.

Oozie puede detectar la finalización de las tareas de cálculo / procesamiento por dos medios diferentes, devoluciones de llamada y sondeo.

Cuando Oozie inicia una tarea de cálculo / procesamiento, Oozie proporciona una URL de devolución de llamada única para la tarea, la tarea debe invocar la URL dada para notificar su finalización.

En los casos en que la tarea no haya podido invocar elLa URL de devolución de llamada por cualquier motivo (es decir, una falla transitoria de la red) o cuando el tipo de tarea no puede invocar la URL de devolución de llamada una vez completada, Oozie tiene un mecanismo para encuestar las tareas de procesamiento / procesamiento para su finalización.

Así que después de una acción (por ejemplo, el trabajo MapReduce) esactivado, lo que sucederá esperará hasta que se complete / falle la acción actual O se moverá automáticamente a la siguiente tarea. Pero la siguiente tarea se decide en función del estado de la tarea actual

<ok to="myNextAction"/>
<error to="errorCleanup"/>

Entonces, ¿qué significa "las acciones son asíncronas"?

Respuestas

0 para la respuesta № 1

Oozie tiene trabajo principal de MR (trabajo de flujo de trabajo) y MR paraCada acción en el flujo de trabajo. El trabajo de flujo de trabajo es responsable solo de manejar el flujo de trabajo (iniciar tareas y esperar a que finalice). Las acciones se ejecutan en MR por separado, lo que significa que son asíncronas.