Hilfe bei der Programmierung, Antworten auf Fragen / Hadoop / Hadoop-Zahl der Reduzierstücke - Hadoop

Hadoop Anzahl der Reduzierungen - Hadoop

Ich benutze Hadoop, aber wenn ich meinen Job beginneAusführungs-Mapper werden nach Anzahl der Eingaben erzeugt (was natürlich die gewünschte Operation ist), aber Hadoop erzeugt nur einen Reduzierer unabhängig von der Eingabe. Obwohl es einen gültigen Input-Split gibt, weiß ich nicht, warum Hadoop nur einen Reducer für die Aufgabe erzeugt.

Könnte mir jemand vor der Durchsetzung weiterer Reduzierungen einen Hinweis geben, warum dies geschieht?

Antworten:

0 für die Antwort № 1

Überprüfen Sie, ob die Konfiguration für den Job (entweder eine XML-Conf-Datei oder etwas in Ihrem Treiber) die Eigenschaft enthält

mapred.reduce.tasks=1

Einige der Beispieljobs haben dies standardmäßig konfiguriert.

0 für die Antwort № 2

Standardmäßig verwendet Hadoop nur einen Reduzierer, unabhängig von der Größe der Eingabedaten. Hier ist, wie man die Anzahl der Reduzierungen erhöht.

Verwandte Fragen

Wie lauten die Umgebungseinstellungen in Apache Pig und Hadoop Connection zum Ausführen von Lernprogrammskripten? - Ubuntu, Hadoop, Apache-Schwein

Wie füge ich eine Datei in hadoop an? - Java, Hadoop

Wie man ein Argument an das Hauptprogramm in Hadoop weitergibt - Java, hadoop, mapreduce

AWS Erhöhen Sie Karten und Reducer mit Hadoop API - Java, Hadoop, Amazon-ec2, Amazon-Web-Services, Mapreduce

Gleiche Taste verschiedene Reduzierungen (HADOOP)? - Java, Hadoop, Mapreduce, Schlüsselwert, reduzieren

Was entspricht hadoop-core-xxx.jar in hadoop 2.7.1 - Java, Hadoop, mapreduce, gps, giraph

Welches Protokoll wird in Hadoop verwendet, um die Daten von Mappers zu Reducern zu kopieren? - http, hadoop, mapreduce, hdfs, tcp-ip

Hadoop "cd" (Verzeichnisbefehl ändern) funktioniert nicht - hadoop, Befehl

Bedeutung von $ PWD in mapred-site.xml - hadoop, mapreduce

Wie man NameNode implementiert Hoch verfügbar in hadoop 1.1. * - Hadoop, Hochverfügbarkeit

hadoop-config.sh in bin / und libexec / - hadoop, mapreduce

Kann ich Hadoop mit Mac pro Mid 2010 13inch Prozessor laufen lassen? - Hadoop, Cloudera

Wie implementiert man Diff in Hadoop? - Hadoop, Diff, BigData

Hadoop-Protokolldateien können nicht gefunden werden - Hadoop, Protokollierung

Wie man Partitionierer in Haoop v 0.21 nennt - Hadoop, Mapreduce, Hadoop-Partitionierung

Versetzt Hadoop den Schlüssel zu Reduziererzuordnungen? - Hadoop, Splunk

Hadoop-Slowstart-Konfiguration - Hadoop

Wie RecommenderJob (org.apache.mahout.cf.taste.hadoop.item.RecommenderJob) meine benutzerdefinierten Mapper und Reducer aufrufen wird? - Hadoop, Mahout

Können Reduzierer und Mapper auf demselben Datenknoten sein? - Hadoop, Mapper, Reducer

Beispiel für eine benutzerdefinierte Partitionierung - Hadoop, Mapreduce, Partitionierung