/ / W klastrze hadoop powinien być zainstalowany na wszystkich węzłach? - hadoop, obliczanie klastrów, ula

W klastrze hadoop, czy powinien on być zainstalowany na wszystkich węzłach? - hadoop, klastry komputerowe, ul

Jestem nowicjuszem w Hadoop / Hive i mam po prostuzaczął czytać dokumenty. Istnieje wiele blogów na temat instalowania Hadoop w trybie klastrowym. Wiem też, że Hive działa na szczycie Hadoop. Moje pytanie brzmi: Hadoop jest zainstalowany na wszystkich węzłach klastra. Czy powinienem także zainstalować Hive na wszystkich węzłach klastra lub tylko na węźle głównym?

Odpowiedzi:

26 dla odpowiedzi nr 1

Nie, to nie jest coś, co instalujesz na węzłach roboczych. Hive jest klientem Hadoop. Po prostu uruchom Hive zgodnie z instrukcjami widocznymi na stronie Witryna ula.


0 dla odpowiedzi nr 2

Nie trzeba instalować gałęzi w klastrze, komputer klienta wymaga gałęzi do przesyłania zadań. Tutaj Przewodnik instalacji ula Cloudera


0 dla odpowiedzi № 3

Hive jest zasadniczo używany do przetwarzania strukturyi częściowo ustrukturyzowane dane w Hadoop. Możemy również wykonać analizę dużych zbiorów danych, która jest obecna w HDFS, a także w systemie plików Amazon S3 przy użyciu Hive. W celu wyszukania gałęzi danych dostarcza również język zapytań znany jako HiveQL, który jest podobny do języka SQL. Za pomocą Hive można łatwo uruchamiać zapytania ad-hoc do analizy danych. Używając Hive, nie musimy pisać złożonych zadań Map-Reduce, musimy tylko przesłać zapytania SQL. Hive przekształca te zapytania SQL w zadania MapReduce.

Wreszcie Hive SQL zostanie przekonwertowany na MapReducezadań i nie musimy przesyłać zadania MapReduce ze wszystkich węzłów w klastrze Hadoop, w taki sam sposób, w jaki nie potrzebujemy instalować Hive we wszystkich węzłach klastra Hadoop