/ / Pridanie cesty pyspark python v oozii - apache-spark, pyspark, oozie

Pridanie pysparkovej pythonovej cesty do oozie - apache - spark, pyspark, oozie

Snažím sa spustiť jednoduchý python skript na Ooziepomocou funkcie Hue. Používam nainštalované balíčky, takže som tiež pridal do Cloudera managera, konfiguráciu iskier (Spark Service Advanced Snippet (bezpečnostný ventil) pre spark-conf / spark-env.sh)

if [ -z "${PYSPARK_PYTHON}" ]; then
export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python
fi

Pri spustení úlohy, i "vo chybe python ImportError: Žiadny modul s názvom pandas.io.json , čo znamená, že sa zdá, že PYSPARK_PYTHON nevyberie ten z anakond.

Snažil som sa pridať argumenty

PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python

na iskrovej akcii cez odtieň, ale nevyzerá to, že by to fungovalo.

Ak spustím skripty cez CLI a iskru, pošle to. Ak spúšťam iné python skripty na Oozie cez Hue (bez balíkov z anaconda) to funguje.

Čo mi chýba? : /

odpovede:

2 pre odpoveď č. 1

Ak používate iskru cez Oozie, musíte povedať, aké premenné prostredia by mali byť nastavené na nádobe launcher (tá, ktorá začína iskrovú reláciu).

Skúste pridať novú vlastnosť akcie iskry s kľúčom oozie.launcher.mapred.child.env a hodnoty PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python a mala by fungovať podľa očakávania.