Допомога у програмуванні, відповіді на питання / Amazon S3 / Spark s3 read дає NullPointerException - amazon-s3, apache-spark

Іскра s3 читає дає NullPointerException - amazon-s3, apache-іскри

Я намагаюся обробляти файли з файлової системи S3. Я експортував AWS_ACCESS_KEY_ID та AWS_SECRET_ACCESS_KEY. Я також встановив конфігурацію

hadoopConf.set ("fs.s3.awsAccessKeyId", "") hadoopConf.set ("fs.s3.awsSecretAccessKey", "")

Помилка:

[error] (run-main-0) java.lang.NullPointerException
java.lang.NullPointerException
at org.apache.hadoop.fs.s3native.NativeS3FileSystem.listStatus(NativeS3FileSystem.java:479)
at org.apache.hadoop.fs.Globber.listStatus(Globber.java:69)
at org.apache.hadoop.fs.Globber.glob(Globber.java:217)
at org.apache.hadoop.fs.FileSystem.globStatus(FileSystem.java:1642)
at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:257)
at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)
at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:304)
at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:207)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
at scala.Option.getOrElse(Option.scala:120)
at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

build.sbt Мій build.sbt має такі залежності

libraryDependencies += "org.apache.spark" %% "spark-core" % "1.5.1"

libraryDependencies += "org.apache.hadoop" % "hadoop-client" % "2.4.0"

libraryDependencies += "net.java.dev.jets3t" % "jets3t" % "0.9.3"

Я використовую AWS IAM для ключів доступу. Я щось пропускаю?

Будь-яка допомога буде вдячна.

Відповіді:

1 для відповіді № 1

Без деталей, я збираюся стріляти наосліп і сказати, що ваш шлях URI недійсний.

Схожі запитання

Іскра AMI для AWS EC-2 - Ubuntu, amazon-web-сервіси, amazon-ec2, apache-spark, ami

Відправлення даних з мого іскрового коду на червоне зміщення - scala, apache-spark, amazon-redshift

IntelliSense у Intellijі з іскровими бібліотеками - скала, апач-іскр, intellij-ідея

Іскра мозкового розуміння залежності - Maven, Apache-Іскра

Як підключити Кассандру до Іскра за допомогою Java. - Java, Cassandra, Apache-Іскра

Нові для Spark і Spark SQL з Java - java, apache-spark, apache-spark-sql, data-migration, bigdata

Чи існує спосіб Іскри читати файли AWS S3 без використання Hadoop? - hadoop, amazon-s3, apache-іскр

З'єднувати іскровий трубопровід із іскровим застосуванням, починаючи з екземпляра SparkSession - апач-іскри, apache-crunch

Іспанська установка Apache і db_metastore - apache-іскр

apache іскри bluemix неможливо - apache-іскри, ibm-cloud

Apache Spark не бачить весь баран моїх машин - apache-spark, google-compute-engine, apache-spark-mllib

Як вбити іскрове завдання, якщо відомий ідентифікатор програми? - апач-іскр, датастакс-підприємство

Скільки споживачів робить Іскр для потоку Kinesis? - апачі-іскри, іскрові потоки, амазонкинези

Іскра sql row_number або порядковий номер? - apache-spark, apache-spark-sql

Доступ до веб-інтерфейсу Spark від веб-вузла з віддаленого комп'ютера (вдома)? - апач-іскрі

Як встановити spark.driver.memory для Spark / Zeppelin на EMR - apache-spark, emr, amazon-emr, apache-ceppelin

Чому Іскр виявляє 8 ядер, коли у мене всього 4? - апачі-іскри, процесорні ядра, веббу

Хо, щоб прочитати ".gz" стиснутий файл, використовуючи іскрові DF або DS? - apache-іскр, apache-spark-sql, spark-dataframe, gzip, apache-spark-data set

Як налаштувати Spark, що працює в локальному режимі на Amazon EC2, для використання правил IAM для S3 - amazon-web-сервісів, amazon-s3, amazon-ec2, apache-spark-2.0

Як встановити Apache Zeppelin на існуючий кластер Apache Spark - amazon-web-сервіси, apache-spark, bigdata, apache-spark-sql, apache-zeppelin