Aide à la programmation, réponses aux questions / Scala / Lecture des lignes de la table Hive et écriture dans un fichier dans Scala-Spark - scala, apache-spark

Lecture des lignes de la table Hive et écriture dans un fichier dans Scala-Spark - scala, apache-spark

Je veux lire les lignes de données de l'une des ruchestableau dans le programme spark-scala.Après cela, les mêmes données doivent être écrites dans un fichier ligne par ligne. En fait, écrivez dans le fichier ligne par ligne. Quelqu'un pourrait-il partager des pointeurs? Spark version 1.6, Hive1.2.

Réponses:

0 pour la réponse № 1

Vous pouvez lire sur la table comme si ...

val mydf = hiveContext.sql("select * from hive_table_name")

mydf.write.save.format("com.databricks.spark.csv").option("header", "true").save(hdfs_path_to_save)

aide de l’analyseur CSV dont vous avez besoin si c’est avant Spark 2.0 https://github.com/databricks/spark-csv

questions connexes

Transformation de dataframe (préparation des données) dans scaque apache scala - scala, join, apache-spark, multi-label-classification

Essayer d'exécuter une requête spark sql depuis un UDF - scala, hadoop, apache-spark, apache-spark-sql, spark-dataframe

Version Scala compatible pour Spark 2.2.0? - scala, apache-spark

Besoin d'une solution pour planifier les emplois Spark - scala, apache-spark

Intellisense dans Intellij avec les bibliothèques d'étincelles - scala, apache-spark, intellij-idea

Comment mettre à jour un formulaire de table ORC Hive Spark avec Scala - scala, apache-spark, apache-spark-sql, hiveql, hivecontext

package spark-java comment utiliser Spark de Scala? - scala, spark-java

Erreur de création du contexte d'étincelle - scala, apache-spark, sbt

Erreur lors de l'instanciation de 'org.apache.spark.sql.hive.HiveSessionState': sur un serveur Linux - scala, hadoop, apache-spark, hive

spark de scala 2.10.4 à 2.11 - scala, eclipse-plugin, apache-spark, apache-spark-sql

Lecture de TSV dans Spark Dataframe avec Scala API - scala, apache-spark

J'obtiens une erreur java.lang.NoClassDefFoundError lorsque j'essaie d'exécuter l'exemple de nombre de mots dans Spark - scala, apache-spark

Existe-t-il des outils python ou scala permettant de connecter l’étincelle / le requin - python, scala, apache-spark, shark-sql

La bibliothèque Scala Breeze peut-elle être utilisée à partir du code Groovy? - java, scala, groovy, apache-spark, scala-brise

Un fichier CSV peut-il être converti en graphique à l'aide de GraphX en Java - java, scala, apache-spark

Pourquoi est-ce que je reçois cette exception d'entrée-sortie lorsque j'interroge une table Hive avec SparkSQL dans Zeppelin? - hadoop, apache-spark, ruche, amazon-emr, apache-zeppelin

Utilisation de TestHiveContext / HiveContext dans des tests unitaires - apache-spark, hive, apache-spark-sql, hivecontext

Supprimer de la table Hive à l'aide de Spark - apache-spark, hive

ClassNotFoundException lors de l'exécution de l'exemple SparkPi - apache-spark, scala-2.10

Spark submit génère une erreur lors de l'utilisation des tables Hive - apache-spark, hive, spark-dataframe