Помощ при програмиране, отговори на въпроси / Ява / От Scala до Java 1.8 - java, scala, lambda, bigdata, apache-искра

От Скала до Java 1.8 - java, scala, lambda, bigdata, apache-spark

Бих искал да напиша програма Spark, която анализираcsv лог файл, разделя думите чрез разделител ";" и създава обект, чиито стойности на атрибут са думи, разположени на конкретни позиции. Кодът ще изглежда така в Scala, но имам проблеми при превода на Java 1.8 (бих искал да използвам ламбда изразите в Java).

val file = sc.textFile("hdfs:/../vrLogs.csv")
class VREvent(val eventTimestamp: String, val deviceID: String, val eventType: String, val itemGroupName: String)
val vrEvents = file.map(_.split(";")).filter(_.size == 32).map(a => new VREvent(a(0), a(1), a(6), a(13)))

Не съм сигурен как да преведа тази част на Java: .map(a => new VREvent(a(0), a(1), a(6), a(13))).

Опитах това (без филтърната част):

JavaRDD<String> records = lines.flatMap(s -> Arrays.asList(s.split(";"))).map(a -> new CDREvent(a[0], a[1], a[6], a[13]));

Отговори:

3 за отговор № 1

Ако приемем, че lines е Stream<String>:

List<CDREvent> events =
lines
.map(s -> s.split(";"))
.filter(a -> a.length == 32)
.map(a -> new CDREvent(a[0], a[1], a[6], a[13]))
.collect(Collectors.toList());

Съпоставете всеки ред с a String[], филтрирайте всички масиви, които не са с дължина 32, картографирайте всеки String[] до a CDREvent, и ги съберете в нов списък.

Свързани въпроси

Съвместима версия на Scala за Spark 2.2.0? - скала, apache-искра

Скала и Спарк: Грешка при създаване на поток - скала, искра

пакет искра-ява как да използвате Spark от Scala? - скала, искра-ява

Грешка при създаването на контекста Spark - скала, apache-spark, sbt

искра от скала 2.10.4 до 2.11 - скала, затъмнение-плъгин, apache-spark, apache-spark-sql

Получавам java.lang.NoClassDefFoundError, когато се опитам да стартирам пример за брой думи в Spark - scala, apache-spark

Spark използва наследени функции скала (Java / SparkSQL) - java, apache-spark, apache-spark-sql

Apache Spark: проблем със Scala пример - java, scala, ubuntu, apache-spark

Може ли Библиотеката Scala Breeze да бъде използвана от Groovy код? - ява, скала, groovy, apache-spark, scala-breeze

Spark SQL единична цитат грешка - java, sql, скала, apache-spark, apache-spark-sql

Може ли файлът CSV да бъде преобразуван в графика чрез GraphX в Java - java, scala, apache-spark

Случайно изключение: фючърсите изтекоха след изключението в "Спарк" - java, apache-spark

Има ли официалния начин да се поддържат както Spark 1.6.2 и 2.0.0 на Hadoop прежда 2.7.2 клъстер? - хайоп, апаш-искра, прежда

Грешка при пускане на искрово приложение с помощта на конектор с искрово-касандра - касандра, apache-spark, съединител с искро-касандра

Празно разделяне в Pyspark - apache-spark, pyspark, rdd

ClassNotFoundException при опита да стартирате SparkPi пример - apache-spark, scala-2.10

Spark Няма останало място в устройството на WordCount - apache-spark

Apache искра - Cassandra Guava несъвместимост - apache-spark, касандра, искра-касандра-конектор

искри-предстои да се провали, когато бурканът е на s3 - apache-spark, amazon-s3

Spark s3 read дава NullPointerException - amazon-s3, apache-spark