Hilfe bei der Programmierung, Antworten auf Fragen / Apache Funken / Wie funke.driver.memory für Spark / Zeppelin auf EMR - apache-funke, emr, amazon-emr, apache-zeppelin

Wie man spark.driver.memory für Spark / Zeppelin auf EMR setzt - apache-funke, emr, amazon-emr, apache-zeppelin

Bei Verwendung von EMR (mit Spark, Zeppelin), ändern spark.driver.memory In Zeppelin Spark werden die Interpretereinstellungen nicht funktionieren.

Ich frage mich, was ist der beste und schnellste Weg, Spark-Treiber-Speicher zu setzen, wenn EMR-Web-Schnittstelle (nicht aws CLI), um Cluster zu erstellen?

Kann die Bootstrap-Aktion eine Lösung sein? Wenn ja, können Sie bitte ein Beispiel dafür geben, wie die Bootstrap-Aktionsdatei aussehen sollte?

Antworten:

3 für die Antwort № 1

Sie können immer versuchen, die folgende Konfiguration für die Jobfluss- / Clustererstellung hinzuzufügen:

[
{
"Classification": "spark-defaults",
"Properties": {
"spark.driver.memory": "12G"
}
}
]

Sie können dies für die meisten Konfigurationen tun, ob für spark-defaultHadoop core-site, etc.

Ich hoffe das hilft !

Verwandte Fragen

In Hortonworks Sandbox 2.4 führt die Verwendung des SQLServer-Treibers von Spark zu "No Passable Driver Found" - sql-server, jdbc, apache-spark, hortonworks-data-platform, apache-zeppelin

Verarbeiten Sie große Textdateien mit Zeppelin und Spark - Scala, Apache-Spark, Apache-Zeppelin, Bigdata

Wie kann ich einen Datenrahmen in Zeppelin / Spark / Scala schön drucken? - Scala, Apache-Funke, Apache-Zeppelin

Konvertieren Pandas Datenrahmen zu RDD in Zeppelin - Python, Apache-Spark, Apache-Zeppelin

Versuchen, ein Glas und eine externe Klasse zu laden - mysql, jdbc, Apache-Funke, Apache-Zeppelin

Apache Zeppelin Konfiguration mit Spark - Linux, Ubuntu, Apache-Spark, Apache-Zeppelin

Warum erhalte ich diese E / A-Ausnahme beim Abfragen einer Hive-Tabelle mit SparkSQL in Zeppelin? - Hadoop, Apache-Funke, Bienenstock, Amazon-emr, Apache-Zeppelin

Was ist Apache Zeppelin? [geschlossen] - Hadoop, Apache-Funke, Bigdata, Apache-Zeppelin

Das Laden eines Datenrahmens, der 2 Minuten auf Spark-Shell dauerte, dauert ewig in Zeppelin - emr, amazon-emr

Problem beim Zugriff auf den Zeppelin-Kontext im Apache Livy Interpreter für Zeppelin - Apache-Zeppelin, livy

Problem beim Hinzufügen von Abhängigkeiten von lokalen Repository in Apache Livy Interpreter für Zeppelin - Apache-Zeppelin, Livy

Funken Datenrahmen Union Datenrahmen in Spark-Solr - Apache-Funken, Solr, Apache-Spark-Sql, Spark-Datenframe

Wie man Kontinuität des Zusammenhangs zwischen benachbarten Zeppelin-Zellen - Apache-Funke, Apache-Zeppelin - erhält

Apache Spark sieht nicht alle Ram meiner Maschinen - Apache-Spark, Google-Compute-Engine, Apache-Spark-MLLIB

Zeppelin - Spark 1.6 Probleme mit Abhängigkeiten - Apache-Spark, Apache-Zeppelin

Es ist nicht möglich, Apache Zeppelin mit DSE Cassandra Analytics-Knoten zu verbinden - Apache-Spark

Wie installiere ich Zeppeling richtig und lade PySpark? - Apache-Funke, Pyspark, Apache-Zeppelin

Apache Zeppelin nicht laden libmesos.so - Apache-Funke, Mesos, Mesosphäre, Apache-Zeppelin

Zugriff verweigert S3-Datei von Zeppelin installiert auf EMR - Amazon-Web-Services, Amazon-S3, Apache-Spark, Emr, Apache-Zeppelin

Wie installiert man Apache Zeppelin auf bestehenden Apache Spark Standalone-Cluster - Amazon-Web-Services, Apache-Spark, Big Data, Apache-Spark-SQL, Apache-Zeppelin