Hilfe bei der Programmierung, Antworten auf Fragen / Apache Funken / Hat Apache Funke Geo-Bewusstsein? - Apache-Spark, Spark-Datenrahmen

Hat Apache Funke Geo-Bewusstsein? - Apache-Spark, Spark-Datenrahmen

Ich versuche, eine Topologie für Apache-Funken-Cluster über verschiedene Standorte hinweg zu wählen. Hat Spark seine eigenen Awareness-Fähigkeiten?

Nehmen Sie zum Beispiel einen Cluster mit Arbeitern in Oregon und Penang an.

Jetzt beim Absenden einer Anwendung, die lädtDaten von Oregon verarbeiten es und speichern es zurück nach Oregon. Werden Oregon-Arbeiter bevorzugt (wenn sie frei sind)? Haven fand keine Dokumentation zu diesem Thema.

Antworten:

2 für die Antwort № 1

Wie hier beschrieben https://jaceklaskowski.gitbooks.io/mastering-apache-spark/content/spark-data-locality.html

Spark stützt sich auf Datenlokalisierung, auch bekannt als Datenplatzierungoder Nähe zu Daten Quelle, die Spark-Jobs für die Position der Daten empfindlich macht. Es ist daher wichtig, dass Spark auf dem Hadoop YARN-Cluster ausgeführt wird wenn die Daten von HDFS stammen. Das Datensystem selbst kann geo-bewusst sein, z.B. Kassandra: Verwendet Spark Datenlokalität? http://www.slideshare.net/RussellSpitzer/spark-cassandralocality

Verwandte Fragen

Dataframe Transformation (Datenaufbereitung) in Apache Spark Scala - Scala, Join, Apache-Spark, Multilabel-Klassifikation

Intellisense in Intellij mit Funkenbibliotheken - Scala, Apache-Spark, Intellij-Idee

Spark-Java-Paket wie Spark von Scala zu verwenden? - Scala, Funken-Java

Konvertieren Sie Spark DataFrame in MlLib Matrix - Scala, Apache-Spark, Spark-Datenframe, Apache-Spark-Mllib

Welche Zeilen sollte ich zu Spark-defaults.conf hinzufügen, um Phoenix von pyspark verwenden zu können? - python, pyspark, hortonworks-datenplattform, phoenix

Spark-Maven Abhängigkeitsverständnis - Maven, Apache-Funke

Neu in Spark und Spark SQL mit Java - Java, Apache-Spark, Apache-Spark-SQL, Datenmigration, BigData

Spark: Wie man ein Datenrahmen-Array ändert [String] in RDD [Array [String]] - Arrays, Scala, Apache-Spark

Link Crunch Spark Pipeline mit Spark-Anwendung beginnend mit SparkSession-Instanz - Apache-Funke, Apache-Crunch

Apache Funke bluemix unmöglich - Apache-Funke, IBM-Wolke

Apache Spark sieht nicht alle Ram meiner Maschinen - Apache-Spark, Google-Compute-Engine, Apache-Spark-MLLIB

Wie man einen Funkenjob tötet, wenn Anwendungsidentifikation bekannt ist? - Apache-Spark, Datastax-Unternehmen

Berechnung der Differenz zwischen Spark DataFrames - Apache-Spark

Spark SQL Zeilennummer oder Sequenznummer? - Apache-Funke, Apache-Spark-Sql

Zugriff auf die WebUI von Spark von einem Remote-Computer aus (Home)? - Apache-Funken

Warum starten Sprink-Streaming-Executors zu unterschiedlichen Zeiten? - Apache-Funke, Funkenströmung, Timeline

Warum erkennt Spark 8 Kerne, wenn ich nur 4 habe? - Apache-Spark, CPU-Kerne, Webui

Kann auf DataFrame von verschiedenen SparkSessions zugegriffen werden? - Apache-Funke, Apache-Spark-Sql, Spark-Datenrahmen

Ho, um ".gz" komprimierte Datei zu lesen, die Funken DF oder DS verwendet? - apache-spark, apache-spark-sql, Spark-Datenframe, gzip, Apache-Spark-Datensatz

Wie aktualisiert man in der Tabelle in Spark-SQL? - Apache-Spark-Sql, Hiveql