Hilfe bei der Programmierung, Antworten auf Fragen / Scala / Beim Ausführen von Spark-Submit muss der Pfad zu jar auf HDFS zeigen? - Scala, Apache-Funke

Beim Ausführen von Spark-Submit muss der Pfad zu jar auf HDFS zeigen? - Scala, Apache-Funke

Wenn der Befehl spark-submit ausgeführt wird, muss der Pfad zu JAR auf einen HDFS-Speicherort verweisen.

Vielleicht haben Sie keine Rechte, das Paket in HDFS hochzuladen, aber dennoch einen Spark-Job auszuführen.

Antworten:

0 für die Antwort № 1

Dies hängt vom Bereitstellungsmodus der Treiberinstanz ab.

Zum Beispiel, wenn Sie Spark-submit in ausführenClient-Modus In einem eigenständigen Cluster können Sie einen Pfad auf Ihrem lokalen Computer angeben, da der Spark-Treiber auf demselben Computer implementiert ist, auf dem Sie den Befehl spark-submit ausführen. Dann teilt es die JAR-Datei mit den Arbeitern.

Wenn Sie Spark-submit jedoch ausführenIm Cluster-Modus müssen Sie die JAR-Datei in einen Pfad hochladen, auf den von allen Cluster-Knoten aus zugegriffen werden kann, z. B. HDFS, da der Treiber im Cluster-Modus in einem beliebigen Worker des Clusters instanziiert wird.

Verwandte Fragen

Verwendung von Funke Job Server - Scala, Apache-Funke, Ooyala

Scala Error: value registerTempTable ist kein Mitglied von org.apache.spark.sql.SchemaRDD - scala, apache-spark, apache-spark-sql, Parkett

Ich verarbeitete verschiedene Operationen für 5mb-Bestandsdaten unter Verwendung von Funke 2. Scala schreibt die Ausgabe auf Hunderte von Dateien in hdfs - scala, hadoop, apache-spark

Kompatible Scala-Version für Spark 2.2.0? - Scala, Apache-Funke

Brauchen Sie eine Lösung, um Spark-Jobs zu planen - scala, apache-spark

Intellisense in Intellij mit Funkenbibliotheken - Scala, Apache-Spark, Intellij-Idee

Spark-Java-Paket wie Spark von Scala zu verwenden? - Scala, Funken-Java

Funken von Scala 2.10.4 bis 2.11 - Scala, Eclipse-Plugin, Apache-Funke, Apache-Spark-Sql

Ich erhalte einen java.lang.NoClassDefFoundError, wenn ich versuche, das Wortzählungsbeispiel in Spark auszuführen - scala, apache-spark

Spark Streaming mit Kafka in Scala - Scala, Apache-Funke, Apache-Kafka

Spark-Maven Abhängigkeitsverständnis - Maven, Apache-Funke

Eine Datei aus dem tar.gz-Archiv in Spark lesen - java, apache-spark

java.lang.NoClassDefFoundError für Spark-Submit - Java, Scala, Maven, Apache-Funke

Welchen Nutzen hat CDH (Cloudera)? [geschlossen] - Hadoop, Bigdata, Apache-Funke, Cloudera, Cloudera-Cdh

Spark Assembly Datei wird hochgeladen, obwohl spark.yarn.conf gesetzt wurde - hadoop, apache-spark, hdfs, yarn

ClassNotFoundException beim Versuch, das SparkPi-Beispiel auszuführen - apache-spark, scala-2.10

Spark submit wirft einen Fehler bei der Verwendung von Hive-Tabellen - Apache-Spark, Hive, Spark-Dataframe

Funke-Streaming-Funktionalität Zeit für das Einreichen von Funken durch Ausnahme - Apache-Spark, Pyspark, Spark-Streaming, Spark-Dataframe, Akka-Stream

spark-submit versagt, wenn das Glas auf s3 ist - apache-spark, amazon-s3

spark-submit Dateiübertragung vom lokalen zum Cluster - apache-spark-1.3