Jak często słyszymy apache zeppelin
, Tak mało pytań przychodzi nam do głowy:
- Czym jest Apache Zeppelin?
- Jakie nowe i / lub dodatkowe elementy dodaje do ekosystemu Big Data?
- Czy jest to już zastąpienie niektórych ram / narzędzi / narzędzi w ekosystemie Big Data?
Odpowiedzi:
6 dla odpowiedzi № 1Notebook Zeppelin zapewnia łatwy i prosty sposób wykonania dowolnego kodu w notatniku internetowym. Możesz wykonać Scala, SQL, a nawet zaplanować zadanie (przez cron), aby działało w regularnych odstępach czasu.
Po pierwsze, łatwiej jest mieszać języki w tym samymnotatnik. Możesz zrobić SQL, scala, a następnie przecenić, aby udokumentować to wszystko razem. Możesz także łatwo przekonwertować swój notebook na styl prezentacji - może być prezentowany kierownictwu lub wykorzystywany w pulpitach nawigacyjnych.
Notatnik Jupyter (dawniej znany jako IPython), niezwykle popularny w społeczności Pythona. Nie mogę użyć słowa „zastąp”, zamiast tego użyłbym podobnego ...
4 dla odpowiedzi nr 2
Zeppelin to świetne narzędzie. Umożliwia używanie różnych backendów / języków w jednym notatniku. Oto prosty przypadek użycia.
- Napisz opis używając Markdown
- Przygotuj dane za pomocą Shell. na przykład pobieraj pliki za pomocą curl / wget, wstrzykuj do HDFS
- Analiza danych za pomocą Sparka
- Prosta wizualizacja za pomocą SQL
- Wyeksportuj wynik za pomocą Shell
- Opublikuj wykres z linkiem
Wszystkie te kroki można wykonać w jednym notatniku. W jednym notebooku można zrobić o wiele więcej.
Zeppelin jest bardzo zbliżony do rozwiązania internetowego Databricks.com