Помощ при програмиране, отговори на въпроси / Scala / Spark: value mean не е член на Array [Any] - scala, apache-spark

Spark: средната стойност не е член на Array [Any] - scala, apache-spark

Аз "m, използвайки RDD от dataframe за изчисляване на средно за колона. Тук е моят RDD

 dataframe.rdd.map(x => (x(2))).take(5)
# res51: Array[Any] = Array(499, 200, 400, 151, 65)

Търся средната стойност на този масив. Тук е моят код:

 dataframe.rdd.map(x => (x(2))).mean

<console>:31: error: value mean is not a member of org.apache.spark.rdd.RDD[Any]
dataframe.rdd.map(x => (x(2))).mean

Отговори:

2 за отговор № 1

Ако имате dataframe както е показано по-долу

+----+----+------+
|col1|col2|col3  |
+----+----+------+
|a   |1   |908.76|
|b   |2   |901.74|
|c   |3   |83.71 |
|d   |5   |39.36 |
|e   |2   |234.64|
+----+----+------+

Можете да изчислите означава в dataframe като се използва mean функция като

import org.apache.spark.sql.functions._
df.select(mean("col3").as("mean").show(false)

който трябва да ви даде

+-------+
|mean   |
+-------+
|433.642|
+-------+

Ако настоявате да използвате RDD след това можете да направите следното

df.rdd.map(x => (x(2).asInstanceOf[Double])).mean

тук съм използвал 2 защото това е колоната, която искам mean. Единствената грешка, която направихте, беше, че сте забравили да въведете x(3) променлива, която е по подразбиране Any и scala компилатор не можеше да намери метод, който да означава за Any Типът данни.

Надявам се, че отговорът е полезен

Свързани въпроси

Трансформация на данните (подготовка на данни) в apache scala scala - scala, join, apache-spark, multilabel-класификация

Импулсен внос на елемента на пакета mllib - скала, apache-spark, apache-spark-mllib

Scala грешка: стойността registerTempTable не е член на org.apache.spark.sql.SchemaRDD - scala, apache-spark, apache-spark-sql, паркет

Съвместима версия на Scala за Spark 2.2.0? - скала, apache-искра

грешка org.apache.spark.ml.feature.IDF - скала, apache-spark, apache-spark-mllib

Intellisense в Intellij с искрови библиотеки - scala, apache-spark, intellij-idea

пакет искра-ява как да използвате Spark от Scala? - скала, искра-ява

value collectAsMap не е член на org.apache.spark.rdd.RDD - scala, apache-spark

стойността toDF не е член org.apache.spark.rdd.RDD - scala, apache-spark, spark-dataframe

искра от скала 2.10.4 до 2.11 - скала, затъмнение-плъгин, apache-spark, apache-spark-sql

Получавам java.lang.NoClassDefFoundError, когато се опитам да стартирам пример за брой думи в Spark - scala, apache-spark

Spark Streaming с Кафка в Скала - скала, apache-spark, apache-kafka

Scala Spark Dataframe - бройте броя на струните за всеки ред в колона с масив - scala, apache-spark, apache-spark-sql, databricks

грешка за импортиране на графична библиотека в скала проект - скала, maven, intellij-idea, sbt, spark-graphx

разбирането на зависимостта на искри Майвън - maven, apache-spark

Може ли Библиотеката Scala Breeze да бъде използвана от Groovy код? - ява, скала, groovy, apache-spark, scala-breeze

Spark SQL единична цитат грешка - java, sql, скала, apache-spark, apache-spark-sql

Може ли файлът CSV да бъде преобразуван в графика чрез GraphX в Java - java, scala, apache-spark

ClassNotFoundException при опита да стартирате SparkPi пример - apache-spark, scala-2.10

искри-предстои да се провали, когато бурканът е на s3 - apache-spark, amazon-s3