/ / Czy są jakieś narzędzia Pythona lub Scala do połączenia iskry / rekina - pythona, scala, apache-spark, shark-sql

Czy są jakieś narzędzia Pythona lub Scala do podłączenia iskry / rekina - pythona, scala, apache-spark, shark-sql

Chcę użyć Pythona lub Scala do podłączenia serwera rekina. Ale nie znalazłem żadnych narzędzi, by to zrobić. Czy są jakieś libs (python lub scala / java). Dzięki zaawansowanym.

Odpowiedzi:

0 dla odpowiedzi № 1

Nie jest jasne, co masz na myśli połączyć ale jedno i drugie rekin i iskra speak scala:

$./bin/shark-shell
scala> val youngUsers = sql2rdd("SELECT * FROM users WHERE age < 20")
scala> println(youngUsers.count)
...
scala> val featureMatrix = youngUsers.map(extractFeatures(_))
scala> kmeans(featureMatrix)

Ponadto iskra mówi pyton także.


1 dla odpowiedzi nr 2

Jeśli chcesz uruchamiać zapytania SQL używając Shark, Shark Sharkserver zachowuje się jak zwykły serwer Hive Thrift, więc powinieneś być w stanie ponownie wykorzystać istniejące metody Pythona do połączenia z Hive, takie jak

Shark Server obsługuje także Hive Interfejs JDBC, dzięki czemu można go użyć do uruchamiania zapytań ze Scala lub Java; po prostu użyj adresu serwera Shark zamiast adresu serwera Hive.