Помощ при програмиране, отговори на въпроси / Ява / Събиране на броячи и показатели на отделни работни места за хаоп - java, hasoop, mapreduce, metrics

Събиране на броячи и показатели на отделните работни места за хаоп - java, hasoop, mapreduce, metrics

Търся начин да се съберат всички броячи и показатели на отделните работни места за хаоп, за да се съхранят всички тези данни в elasticsearch за по-нататъшно отстраняване на проблеми и анализи.

Понастоящем намерих няколко метода, които биха могли да изглеждат отговарящи на изискванията:

По-специално, използвайки метрични износители, ContainerMetrics който позволява да се получи памет и CPU на контейнер и MRAppMetrics, но това агрегати всички показатели за всички задания.
Извличане на данни от сървър за история на MR с него REST API това е доста ясно, но изисква много HTTP повиквания, за да се съберат всички броячи за работни места, задачи и техните опити.
Включване на допълнителен потребителски интерфейс EventHandler в MRAppMasterна събитието диспечер, но MRAppMaster няма съответстващи механизми за регистриране на персонализирани събирачи.
Използвайки черна магия на javaagents (java instrumentation api), байткод модификации и aop-подобна функционалност за прехващане на всички изпълнения на EventHandler # дръжка (Т) метод. По този начин трябва да е в състояние да разреши всички изисквания, но се нуждае от допълнителна конфигурация на MR-jobs, разработване и регистрация на javaagent и като цяло изглежда доста сложна.

Така че, бих искал да попитам дали има по-прости начини за събиране на показатели и броячи на отделни работни места за хаоп?

Отговори:

1 за отговор № 1

Можете да насочвате показателите си към всеки получател всъщност: да внедрите свой собствен MetricsSink и да конфигурирате хаоп, за да го използвате.

Или можете да използвате MetricsSink, вече свързан с Hadoop distro, като GraphiteSink и да получите показателите си в Graphite.

Имайте предвид, че някои броячи не са налични, докато заданието не приключи (успешно или не).

Също така, вариант 2 е също така риск да попадне на HistoryServer в неприятности (когато правите анкета за работа с милион картографи, може би OOM).

Свързани въпроси

NameNode не работи - java, hasoop, mapreduce, hdfs

Картата на Хадоуп намалява примера, залепен на текущата работа - java, macos, hasoop, mapreduce, jobs

Подаване на работа на Hadoop без Hadoop време на изпълнение на клиент - java, hadoop

MapReduce Nutch уроци [затворен] - java, mapreduce, nutch

Как да активираме нови показатели за ганглиите от Hbase? - java, hasoop, hbase, metrics, ганглии

Какво е еквивалентно на hadoop-core-xxx.jar в hadoop 2.7.1 - java, hasoop, mapreduce, gps, giraph

Процедура за отстраняване на грешки за Hadoop Failed / Hung job - хаоуп, bigdata

Значение на $ PWD в mapred-site.xml - hasoop, mapreduce

Споделяне на клъстер с Hadoop - хаоп, cluster-computing, въртящ момент

хаоп работни места в безизходица с pyspark и oozie - hadoop, pyspark, oozie

Как да интерпретирам броячите за ефективността на MapReduce - хаоп, mapreduce

формат за вход за хаоп за поточно предаване. Формат на въвеждане на Wikihadoop - хаоп, хаооп-стрийминг

Инструменти за наблюдение на ефективността на Hadoop за Windows - хаоп, мониторинг, hortonworks-data-platform

Hadoop: възможно ли е да стартирате benchmark на TestDFSIO като потребител, който не е hdfs - hasoop, benchmarking

Mapreduce лог за провали Hadoop - hasoop, mapreduce, hadoop2, hadoopy

Hadoop MR2 Статистика за работа - хаоп

Какво представлява броячът на HBase MILLIS_BETWEEN_NEXTS? - хаоп, картограй, hbase

къде има hasoop съхранява изходните файлове на mapper, partitioner и combiner? - хаоп, картографиране

Кога да внедрите WritableComparable и кога да удължите WritableComparator - hasoop, mapreduce

Как да проверите Mapreduce регистрации на работни места в Hortonworks sandbox с HDP 2.4 - хаоп, прежда, hortonworks-data-платформа, hortonworks-sandbox