Pomoc w programowaniu, odpowiedzi na pytania / Hadoop / Replikacja vs migawka w HBase - hadoop, mapreduce, hbase, cloudera

Replikacja a Migawka w HBase - hadoop, mapreduce, hbase, cloudera

Mamy dwa systemy - jeden offlinesystem (Wydajność nie jest tu kluczowa), w której zadania MapReduce działają w klastrze HBase. Drugim jest system online (wydajność ma tutaj bardzo duże znaczenie), w którym API odczytuje z tego samego klastra HBase. Ponieważ jednak zadania MapReduce działające w tym samym klastrze występują problemy z wydajnością w systemie online. Próbujemy więc skonfigurować osobny klaster HBase dla systemu Offline, który jest replikacją kilku nazwisk rodzinnych z klastra Source. Tak więc w źródle wykonuje się duże zadanie MapReduce. W replikowanym klastrze działa tylko system online zapewniający najlepszą wydajność. Moje pytanie tutaj: Czy nie możemy użyć funkcji Snap shot w HBase do robienia tego samego? Chciałem też wiedzieć, jaka jest między nimi różnica?

Odpowiedzi:

1 dla odpowiedzi № 1

Jeśli używasz funkcji migawki do mapreduce, towyda również procesor, pamięć i dysk io również na węzłach klastra Live Hbase. Więc jeśli dysk IO lub CPU jest dla Ciebie wąskim gardłem, oddzielnym klastrem dla zadań mapreduce jest lepszym rozwiązaniem.

Powiązane pytania

Użycie zawarte w hbase - mysql, hadoop, hbase

Hbase BulkLoad bez mapreduce - mapreduce, hbase, bulk-load

Czy zadanie MapReduce uruchomione przez powłokę HBase do zliczania wierszy tabeli będzie widoczne w JobTracker? - mapreduce, hbase

Zmaganie się między Job i JobConf podczas korzystania z TableMapReduceUtil i MultipleOutputFormat - java, hadoop, mapreduce

Łatwy sposób na ustawienie samodzielnego Cloudera HBase 5? - hbase, cloudera

Czy Zookeeper jest obowiązkowy dla trybu rozproszonego (wersja klastra 1.oop), aby skonfigurować na nim Hbase? - hbase, apache-zookeeper

Przepływ pracy Hadoop Hbase - hadoop, hbase

integracja cloudera hbase i zookeeper - hadoop, hbase, cloudera-cdh, apache-zookeeper

Skonfiguruj hadoop / hbase w trybie pełnego rozproszenia - hadoop, hbase, distributed-database, nosql

Jak połączyć dwie tabele w Hbase - hadoop, mapreduce, hbase

Eksportuj tabelę w hbase - hadoop, hbase

HBase MapReduce, obsługa wielu tabel - hadoop, mapreduce, hbase, multi-table

Hbase master nie działa - hadoop, hbase

HBase: czy potrzebuję jobtracker / tasktracker - hadoop, mapreduce, hbase

HBASE (Importowanie danych) - hadoop, import, hbase

Co reprezentuje licznik HBase MILLIS_BETWEEN_NEXTS? - hadoop, mapreduce, hbase

Czy istnieje sposób dostępu do danych avro przechowywanych w hbase przy użyciu analizy ula do wykonania - hadoop, mapreduce, hive, hbase, avro

HBase Anti-Patterns - architektura, hadoop, hbase, hdfs

Jak zintegrować hadoop z zookeeperem i hbase - apache, hadoop, hbase, apache-zookeeper

iskr 1.3 odczyt i zapis do hbase - apache-spark, hbase, rdd