プログラミングの助け、質問への回答 / Json / Scala：JSONにランダムな値を書き込んでファイルに保存してからSparkで分析 - json、scala、file、random

Scala：JSONにランダムな値を書き込み、ファイルに保存してからSparkで分析する - json、scala、file、random

JSONに10（または10億）のイベントを書き込み、ファイルとして保存したいと思います。

私はScalaのDatabricksノートに書いています。 JSON文字列に "Carbs"のようなフィールドに対してランダムに生成された値を持たせたいです。

{"Username": "patient1", "Carbs": 92, "Bolus": 24, "Basal": 1.33, "Date": 2017-06-28, "Timestamp": 2017-06-28 21:59:...}

私は首尾よくArray（）に日付を書いてそれからJSONファイルとして保存するのに以下を使用しました。

val dateDF = spark.range(10)
.withColumn("today", current_date())

しかし、ランダムな値を配列に書き込んでからその配列をJSONファイルとして保存するための最良の方法は何ですか？

回答：

回答№1は0

RDDをデータフレームに変換してからjsonフォーマットとして保存する

dataframe.write.mode("append").json(path)

関連する質問

apache spark scala - scala、join、apache-spark、マルチラベル分類におけるデータフレーム変換（データ準備）

Spark 2.2.0対応のScalaバージョン？ - scala、apache-spark

spark scala shell - scala、apache-sparkの並列化コレクション

スパークジョブのスケジューリングに必要なソリューション - scala、apache-spark

ScalaでGOOGLE_APPLICATION_CREDENTIALS環境変数を設定する - scala、apache-spark

spark-javaパッケージScalaからSparkを使用する方法は？ - スカラ、スパーク・ジャワ

Scalaハッシュマップ - scala、hashmap、akka

Hiveテーブルから行を読み込み、Scala-Sparkでファイルに書き込む - scala、apache-spark

スカラ2.10.4から2.11まで - spaek、eclipse-plugin、apache-spark、apache-spark-sql

Sparkで単語カウントの例を実行しようとすると、java.lang.NoClassDefFoundErrorが発生する - scala、apache-spark

入れ子になったjsonファイルをscala - css、csv、apache-sparkのcsvに変換する方法

jsonで複数の値をループし、毎回gatlingで1つの値を使用する - json、scala、session、gatling

Scalaの例外NoClassDefFoundError：eclipseのscala.util.parsing.json.JSONObject - json、scala

Elasticsearch-hadoop-json、scala、elasticsearch、apache-spark、apache-spark-sqlでSchemaRDD.saveToES（）を使用してHDFSからJSONをインデックスできません

複数のjsonファイルを効率的にDataframeまたはJavaRDDに読み込むにはどうすればよいですか？ - java、json、apache-spark

ランダム例外：スパークジョブで例外の後にタイムアウトした先物 - java、apache-spark

Scalaで配列を作成する（シード済み） - 配列、スカラ、ランダム、シード

スカラ：ランダムバイトの配列の埋め込み - 配列、スカラ

Spark Scalaで文字列を配列に変換する方法 - 配列、json、scala、apache-spark

SparkPiの例を実行しようとするとClassNotFoundExceptionが発生する - apache-spark、scala-2.10