/ / Co to jest apepe zeppelin? [zamknięte] - hadoop, apache-iskra, bigdata, apache-zeppelin

Co to jest zeppelin Apache? [zamknięty] - hadoop, apache-iskra, bigdata, apache-zeppelin

Jak często słyszymy apache zeppelin, Tak mało pytań przychodzi nam do głowy:

  1. Czym jest Apache Zeppelin?
  2. Jakie nowe i / lub dodatkowe elementy dodaje do ekosystemu Big Data?
  3. Czy jest to już zastąpienie niektórych ram / narzędzi / narzędzi w ekosystemie Big Data?

Odpowiedzi:

6 dla odpowiedzi № 1
  1. Notebook Zeppelin zapewnia łatwy i prosty sposób wykonania dowolnego kodu w notatniku internetowym. Możesz wykonać Scala, SQL, a nawet zaplanować zadanie (przez cron), aby działało w regularnych odstępach czasu.

  2. Po pierwsze, łatwiej jest mieszać języki w tym samymnotatnik. Możesz zrobić SQL, scala, a następnie przecenić, aby udokumentować to wszystko razem. Możesz także łatwo przekonwertować swój notebook na styl prezentacji - może być prezentowany kierownictwu lub wykorzystywany w pulpitach nawigacyjnych.

  3. Notatnik Jupyter (dawniej znany jako IPython), niezwykle popularny w społeczności Pythona. Nie mogę użyć słowa „zastąp”, zamiast tego użyłbym podobnego ...


4 dla odpowiedzi nr 2

Zeppelin to świetne narzędzie. Umożliwia używanie różnych backendów / języków w jednym notatniku. Oto prosty przypadek użycia.

  1. Napisz opis używając Markdown
  2. Przygotuj dane za pomocą Shell. na przykład pobieraj pliki za pomocą curl / wget, wstrzykuj do HDFS
  3. Analiza danych za pomocą Sparka
  4. Prosta wizualizacja za pomocą SQL
  5. Wyeksportuj wynik za pomocą Shell
  6. Opublikuj wykres z linkiem

Wszystkie te kroki można wykonać w jednym notatniku. W jednym notebooku można zrobić o wiele więcej.

Zeppelin jest bardzo zbliżony do rozwiązania internetowego Databricks.com