Pomoc w programowaniu, odpowiedzi na pytania / Scala / Jak uruchomić Kafkę jako strumień dla Apache Sparka używając Scala 2.11? - scala, apache-spark, apache-kafka

Jak uruchomić Kafkę jako strumień dla Apache Sparka używając Scala 2.11? - scala, apache-spark, apache-kafka

Nie udało mi się znaleźć żadnej wersji integracji Spark Streaming dla Kafki dla Scala 2.11. http://mvnrepository.com/artifact/org.apache.spark/spark-streaming-kafka_2.10 ale jest to 2.10

Czy każdy może wskazać mi wersję 2.11?

Odpowiedzi:

2 dla odpowiedzi № 1

Specyficzne dla twojego pytania:

Nie jest możliwe uruchomienie Sparka Kafki przeciwko Scali 2.11 (Spark-1.3)

Ogólna metoda budowania z kodu źródłowego:

Jeśli nie masz dostępnej wersji do kompilacji, możesz zbudować iskrę samodzielnie i spełnić swoje potrzeby, określając niektóre parametry kompilacji.

Szczegółową procedurę kompilacji można znaleźć: Budynek Spark

W skrócie, Wykonanie kompilacji przeciwko scala-2.10 zajmie tylko dwa kroki:

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"

mvn -Phadoop-2.4 -Dhadoop.version=2.4.0 -DskipTests clean package

Powinieneś określić profile lub właściwości, które pasują do twojej sytuacji w drugim poleceniu

Zanotuj część Budynek Spark stwierdza na Building for Scala 2.11:

Aby stworzyć pakiet Spark skompilowany ze Scala 2.11, użyj właściwości -Dscala-2.11:

dev/change-version-to-2.11.sh
mvn -Pyarn -Phadoop-2.4 -Dscala-2.11 -DskipTests clean package

Obsługa Scala 2.11 w Sparku nie obsługuje kilku funkcji z powodu zależności, które same nie są Scala 2.11 gotowe. W szczególności zewnętrzna biblioteka Kafki Sparka i komponent JDBC nie są jeszcze obsługiwane w kompilacjach Scala 2.11.

Powiązane pytania

Przeczytaj więcej tematów Kafki niż liczba rdzeni procesora - scala, apache-spark, apache-kafka, iskra streaming

Jak korzystać z konsumenta Kafki w iskrze - scala, apache-spark, apache-kafka, kafka-consumer-api

Spark / Spark Streaming w produkcji bez HDFS - scala, apache-spark, hdfs, streaming iskier

assemblyMergeStrategy powodujące scala.MatchError podczas kompilacji - scala, sbt, sbt-assembly

java.lang.ClassNotFoundException w sbt scala 2.11 IntelliJ IDEA sbt 1.0 - scala, apache-spark, apache-kafka

pakiet iskrow-java jak używać Sparka ze Scala? - scala, iskra-java

iskrzenie ze scala 2.10.4 do 2.11 - scala, wtyczka eclipse, apache-spark, apache-spark-sql

Spark Streaming Kafka spadek konsumpcji bezpośredniej konsumpcji - scala, serwisy amazon-web, apache-spark, apache-kafka, spark-streaming

Spark Streaming z Kafką w Scali - scala, apache-spark, apache-kafka

kafka.cluster.BrokerEndPoint nie można przesłać na adres kafka.cluster.Broker - scala, apache-spark, apache-kafka

przetwarzanie logów internetowych dla Spark Streaming - parsowanie, apache-kafka, strumieniowanie iskier

Spark Streaming + kafka "JobGenerator" java.lang.NoSuchMethodError - java, apache-spark, streaming, apache-kafka

Dlaczego KafkaUtils.createDirectStream rzuca NoSuchMethodError? - java, apache-spark, apache-kafka

Dlaczego nowy strumień Kafka Direct Stream w Spark Streaming przyjmuje zestaw tematów? - apache-iskierka, apache-kafka, iskrzące strumienie

Funkcjonalność strumieniowania iskrownika czas świecenia - wyjątek - apache-iskra, pyspark, iskra-streaming, iskra-ramka danych, akka-stream

Odzyskiwanie z przesyłania strumieniowego Punkt kontrolny kafka ClassNotFoundException - apache-spark

Jak wykonać przetwarzanie strumieniowe tylko wtedy, gdy istnieje co najmniej N wierszy? - apache-spark, apache-kafka, apache-spark-sql, strumieniowanie strukturalne

Jak napisać strumień Spark (Dstream / JavaDStream) do Kafki? - apache-kafka, strumieniowanie iskier

DSE Spark Streaming + Kafka NoSuchMethodError - apache-kafka, cassandra-2.0, kafka-consumer-api

Konsument Kafka nie zużywa wiadomości ze wszystkich partycji - apache-kafka, kafka-consumer-api