Pomoc w programowaniu, odpowiedzi na pytania / Scala / Czytanie wierszy z tabeli gałęzi i zapisywanie do pliku w Scala-Spark - scala, apache-spark

Czytanie wierszy z tabeli Hive i zapisywanie do pliku w Scala-Spark - scala, apache-spark

Chcę odczytać wiersze danych z jednego z gałęzitabeli w programie Spark-Scala. Następnie te same dane muszą być zapisywane w pliku wiersz po wierszu. Właściwie zapisz do pliku wiersz po rzędzie. Czy ktoś mógłby udostępnić wskaźniki? Wersja Spark 1.6, Hive 1.2.

Odpowiedzi:

0 dla odpowiedzi № 1

Możesz czytać ze stołu tak ...

val mydf = hiveContext.sql("select * from hive_table_name")

mydf.write.save.format("com.databricks.spark.csv").option("header", "true").save(hdfs_path_to_save)

tutaj jest pomoc z parserem csv, którego potrzebujesz, jeśli jest on wcześniejszy niż Spark 2.0 https://github.com/databricks/spark-csv

Powiązane pytania

Transformacja danych (przygotowanie danych) w scale spark scala - scala, join, apache-spark, multilabel-classification

Próba wykonania zapytania sql sql z UDF - scala, hadoop, apache-spark, apache-spark-sql, spark-dataframe

Zgodna wersja Scala dla Sparka 2.2.0? - scala, apache-spark

Potrzebujesz rozwiązania, aby zaplanować prace Sparka - scala, apache-spark

Intellisense w Intellij z bibliotekami iskrowymi - scala, apache-spark, intellij-idea

Jak zaktualizować tabelę ORC Spisek przy użyciu Scala - scala, apache-spark, apache-spark-sql, hiveql, hivecontext

pakiet iskrow-java jak używać Sparka ze Scala? - scala, iskra-java

Spark Błąd tworzenia kontekstu - scala, apache-spark, sbt

Błąd podczas tworzenia "org.apache.spark.sql.hive.HiveSessionState": na serwerze Linux - scala, hadoop, apache-spark, hive

iskrzenie ze scala 2.10.4 do 2.11 - scala, wtyczka eclipse, apache-spark, apache-spark-sql

Czytanie TSV w Spark Dataframe z Scala API - scala, apache-spark

Dostaję java.lang.NoClassDefFoundError gdy próbuję uruchomić przykład liczenia słów w Spark - scala, apache-spark

Czy są jakieś narzędzia Pythona lub Scala do podłączenia iskry / rekina - pythona, scala, apache-spark, shark-sql

Czy biblioteka Scala Breeze może być używana z kodu Groovy? - java, scala, groovy, apache-spark, scala-breeze

Czy plik CSV można przekonwertować na wykres za pomocą GraphX w Javie - java, scala, apache-spark

Dlaczego otrzymuję ten wyjątek we / wy podczas sprawdzania tabeli Hive przy użyciu SparkSQL w Zeppelinie? - hadoop, apache-spark, ul, amazon-emr, apache-zeppelin

Używanie TestHiveContext / HiveContext w testach jednostkowych - apache-spark, ul, apache-spark-sql, hivecontext

Usuń z tabeli Hive przy użyciu Spark - apache-spark, ul

Wyjątek ClassNotFoundException podczas próby uruchomienia przykładu SparkPi - apache-spark, scala-2.10

Spark przekazuje błąd rzutu podczas używania tabel Hive - apache-iskra, ul, iskra-ramka danych