Допомога у програмуванні, відповіді на питання / Скала / Які переваги SpecificMutableRow в Spark SQL? - scala, jvm, apache-spark, apache-spark-sql

Які переваги SpecificMutableRow у Spark SQL? - scala, jvm, apache-spark, apache-spark-sql

З коментарів здається:

Батьківський клас для змінних об'єктів контейнерів, які повторно використовуються при зміні значень, в результаті менше сміття.

і

Тип рядка, який містить спеціалізований масивоб'єкти контейнера типу MutableValue, обрані на основі даних типів кожного стовпця. Наміром є зменшення сміття при зміні значення примітивних стовпців.

Джерело - https://github.com/apache/spark/blob/master/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/SpecificMutableRow.scala

Хтось може пояснити, наскільки це ефективно? Це лише той факт, що він уникає боксу достатньо?

Відповіді:

2 для відповіді № 1

Це дозволяє уникнути боксу в місцях зберігання, але це, в основному, корисно в поєднанні з іншим специфічним інтерфейсом (тобто зчитуванням паркету або оцінкою вираження, сформованим кодом).

Інша перевага полягає в тому, що він повторно використовується (на відміну від загального ряду). Таким чином, для багатьох операцій він може працювати з низкою даних, не виділяючи жодних об'єктів.

Схожі запитання

Трансформація даних (підготовка даних) в apache іскрі scala - scala, join, apache-spark, multilabel-classification

Іскрове імпортування пакета mllib - scala, apache-spark, apache-spark-mllib

Сумісна версія Scala для Spark 2.2.0? - скала, апаче-іскрі

Помилка org.apache.spark.ml.feature.IDF - scala, apache-spark, apache-spark-mllib

IntelliSense у Intellijі з іскровими бібліотеками - скала, апач-іскр, intellij-ідея

spark-java пакет, як використовувати Spark від Scala? - скала, іскр-ява

Спробуйте отримати Apache Spark, що працює з IntelliJ - scala, apache-spark, intellij-idea, sbt

Іскра від scala 2.10.4 до 2.11 - scala, eclipse-plugin, apache-spark, apache-spark-sql

Я отримую java.lang.NoClassDefFoundError, коли я намагаюся запустити приклади підрахунку слів у Spark-scala, apache-spark

помилка імпорту бібліотеки graphx в scala project - scala, maven, intellij-idea, sbt, spark-graphx

Іскра мозкового розуміння залежності - Maven, Apache-Іскра

Нові для Spark і Spark SQL з Java - java, apache-spark, apache-spark-sql, data-migration, bigdata

Чи можна перетворити файл CSV в графік, використовуючи GraphX у Java - java, scala, apache-spark

Яка перевага використання CDH (cloudera)? [закрито] - хадооп, bigdata, apache-іскри, cloudera, cloudera-cdh

apache іскри bluemix неможливо - apache-іскри, ibm-cloud

Apache Spark не бачить весь баран моїх машин - apache-spark, google-compute-engine, apache-spark-mllib

ClassNotFoundException при спробі запустити приклад SparkPi - apache-spark, scala-2.10

Як вбити іскрове завдання, якщо відомий ідентифікатор програми? - апач-іскр, датастакс-підприємство

Чи можна використовувати apache-ignite rdd реалізацію в pyspark? - апач-іскрі, писпарк, запалити

Хо, щоб прочитати ".gz" стиснутий файл, використовуючи іскрові DF або DS? - apache-іскр, apache-spark-sql, spark-dataframe, gzip, apache-spark-data set