Pomoc w programowaniu, odpowiedzi na pytania / Scala / Spark: wartość średnia nie jest członkiem Array [Any] - scala, apache-spark

Spark: wartość średnia nie jest członkiem Array [Any] - scala, apache-spark

Używam RDD z ramki danych do obliczenia średniej dla kolumny.Tutaj jest moje RDD

 dataframe.rdd.map(x => (x(2))).take(5)
# res51: Array[Any] = Array(499, 200, 400, 151, 65)

Szukam średniej tego Array, oto mój kod:

 dataframe.rdd.map(x => (x(2))).mean

<console>:31: error: value mean is not a member of org.apache.spark.rdd.RDD[Any]
dataframe.rdd.map(x => (x(2))).mean

Odpowiedzi:

2 dla odpowiedzi № 1

Jeśli masz dataframe jak poniżej

+----+----+------+
|col1|col2|col3  |
+----+----+------+
|a   |1   |908.76|
|b   |2   |901.74|
|c   |3   |83.71 |
|d   |5   |39.36 |
|e   |2   |234.64|
+----+----+------+

Możesz obliczyć oznaczać w dataframe używając mean funkcjonować jako

import org.apache.spark.sql.functions._
df.select(mean("col3").as("mean").show(false)

który powinien ci dać

+-------+
|mean   |
+-------+
|433.642|
+-------+

Jeśli nalegasz na używanie RDD następnie możesz wykonać następujące czynności

df.rdd.map(x => (x(2).asInstanceOf[Double])).mean

tutaj użyłem 2 ponieważ to jest ta kolumna, której bym chciał mean. Jedynym błędem, który popełniłeś, było to, że zapomniałeś wpisać typ x(3) zmienna, która była domyślna Any i scala kompilator nie można znaleźć metody średniej dla Any typ danych.

Mam nadzieję, że odpowiedź jest pomocna

Powiązane pytania

Transformacja danych (przygotowanie danych) w scale spark scala - scala, join, apache-spark, multilabel-classification

Spark import członka pakietu mllib - scala, apache-spark, apache-spark-mllib

Błąd Scala: wartość registerTempTable nie jest członkiem org.apache.spark.sql.SchemaRDD - scala, apache-spark, apache-spark-sql, parquet

Zgodna wersja Scala dla Sparka 2.2.0? - scala, apache-spark

org.apache.spark.ml.feature.IDF error - scala, apache-spark, apache-spark-mllib

Intellisense w Intellij z bibliotekami iskrowymi - scala, apache-spark, intellij-idea

pakiet iskrow-java jak używać Sparka ze Scala? - scala, iskra-java

wartość collectAsMap nie jest członkiem org.apache.spark.rdd.RDD - scala, apache-spark

wartość toDF nie jest członkiem org.apache.spark.rdd.RDD - scala, apache-spark, spark-dataframe

iskrzenie ze scala 2.10.4 do 2.11 - scala, wtyczka eclipse, apache-spark, apache-spark-sql

Dostaję java.lang.NoClassDefFoundError gdy próbuję uruchomić przykład liczenia słów w Spark - scala, apache-spark

Spark Streaming z Kafką w Scali - scala, apache-spark, apache-kafka

Scala Spark Dataframe - Policz liczbę łańcuchów dla każdego wiersza w kolumnie tablicy - scala, apache-spark, apache-spark-sql, databricks

błąd importowania biblioteki grafx w projekcie scala - scala, maven, intellij-idea, sbt, spark-graphx

Zrozumienie zależności między iskrowcami - maven, apache-spark

Czy biblioteka Scala Breeze może być używana z kodu Groovy? - java, scala, groovy, apache-spark, scala-breeze

Spark błąd pojedynczego zapytania SQL - java, sql, scala, apache-spark, apache-spark-sql

Czy plik CSV można przekonwertować na wykres za pomocą GraphX w Javie - java, scala, apache-spark

Wyjątek ClassNotFoundException podczas próby uruchomienia przykładu SparkPi - apache-spark, scala-2.10

iskrowanie się nie powiedzie, gdy słoik jest na s3 - apache-spark, amazon-s3