プログラミングの助け、質問への回答 / Amazon S3 / Spark s3 readがNullPointerExceptionを与える - amazon-s3、apache-spark

Spark s3の読み込みでNullPointerExceptionが返される - amazon-s3、apache-spark

私はS3ファイルシステムからファイルを処理しようとしています。 AWS_ACCESS_KEY_IDとAWS_SECRET_ACCESS_KEYをエクスポートしました。設定もしました

hadoopConf.set（ "fs.s3.awsAccessKeyId"、 ""）hadoopConf.set（ "fs.s3.awsSecretAccessKey"、 ""）

エラー：

[error] (run-main-0) java.lang.NullPointerException
java.lang.NullPointerException
at org.apache.hadoop.fs.s3native.NativeS3FileSystem.listStatus(NativeS3FileSystem.java:479)
at org.apache.hadoop.fs.Globber.listStatus(Globber.java:69)
at org.apache.hadoop.fs.Globber.glob(Globber.java:217)
at org.apache.hadoop.fs.FileSystem.globStatus(FileSystem.java:1642)
at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:257)
at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)
at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:304)
at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:207)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
at scala.Option.getOrElse(Option.scala:120)
at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)

build.sbt 私のbuild.sbtには以下の依存関係があります

libraryDependencies += "org.apache.spark" %% "spark-core" % "1.5.1"

libraryDependencies += "org.apache.hadoop" % "hadoop-client" % "2.4.0"

libraryDependencies += "net.java.dev.jets3t" % "jets3t" % "0.9.3"

アクセスキーにはAWS IAMを使用します。私は何かが足りないのですか？

どんな助けでも大歓迎です。

回答：

回答№1は1

詳細な説明がない限り、私は盲目的に撃ち、あなたのURIパスは無効であると言っています。

関連する質問

AWS EC-2用のSpark AMI - ubuntu、amazon-web-services、amazon-ec2、apache-spark、ami

スパークコードからredshiftへのデータ送信 - scala、apache-spark、amazon-redshift

インテル®IntelliSenseのSparkライブラリ - scala、apache-spark、intellij-idea

スパーク依存関係の理解 - maven、apache-spark

Javaを使ってCassandraをSparkに接続する方法。 - java、cassandra、apache-spark

sparkとスパークSQLの新機能 - java、apache-spark、apache-spark-sql、data-migration、bigdata

SparkがHadoopを使用せずにAWS S3ファイルを読み込む方法はありますか？ - hadoop、amazon-s3、apache-spark

スパークアプリケーションをSparkSessionインスタンスからリンクするリンククランチスパークパイプライン - apache-spark、apache-crunch

Apacheスパークインストールとdb_metastore - apache-spark

apache spark bluemix impossible - apache-spark、ibm-cloud

Apache Sparkは私のマシンのすべてのRAMを表示しません - apache-spark、google-compute-engine、apache-spark-mllib

アプリケーションIDがわかっている場合、スパークジョブを強制終了するにはどうすればいいですか？ - apache-spark、datastax-enterprise

SpinesはKinesisストリームのために何人の消費者を始めますか？ - apache-spark、spark-streaming、amazon-kinesis

spark SQLのrow_numberまたはシーケンス番号？ - apache-spark、apache-spark-sql

リモートコンピュータ（自宅）からSparkのWebUIにアクセスしますか？ - apache-spark

EMRでspark / zeppelinのspark.driver.memoryを設定する方法 - apache-spark、emr、amazon-emr、apache-zeppelin

スパークは4コアしかないのになぜ8コアを検出するのですか？ - apache-spark、cpu-cores、webui

Spark DFまたはDSを使って ".gz"圧縮ファイルを読み込むには？ - apache-spark、apache-spark-sql、spark-dataframe、gzip、apache-spark-dataset

S3 - amazon-web-services、amazon-s3、amazon-ec2、apache-spark-2.0のIAMルールを使用するためにAmazon EC2上でローカルモードで動作するSparkを設定する方法

Apache Zeppelinを既存のApache Sparkスタンドアロンクラスタにインストールする方法 - amazon-web-services、apache-spark、bigdata、apache-spark-sql、apache-zeppelin