Допомога у програмуванні, відповіді на питання / Веб-сервіси Amazon / Як налаштувати Spark, що працює в локальному режимі на Amazon EC2, щоб використовувати правила IAM для S3 - amazon-web-сервіси, amazon-s3, amazon-ec2, apache-spark-2.0

Як налаштувати Spark, що працює в локальному режимі на Amazon EC2, для використання правил IAM для S3 - amazon-web-сервісів, amazon-s3, amazon-ec2, apache-spark-2.0

Я працюю Spark2 в локальному режимі на Amazon EC2, коли я намагаюся читати дані з S3 I, отримую таке виняток:

java.lang.IllegalArgumentException: Ідентифікаційний ключ доступу AWS та секретний ключ доступу повинні бути вказані як ім'я користувача або пароль (відповідно) URL-адреси s3 або шляхом встановлення властивостей fs.s3.awsAccessKeyId або fs.s3.awsSecretAccessKey (відповідно)

Я можу, але краще не вручну встановлювати AccessKey та SecretKey з коду через проблеми із безпекою.

EC2 встановлюється за допомогою правила IAM, що дозволяє йому отримати повний доступ до відповідного пакета S3. Для всіх інших дзвінків API Amazon достатньо, але, здається, іскра його ігнорує.

Чи можу я встановити іскру для використання цього правила IAM замість AccessKey та SecretKey?

Відповіді:

1 для відповіді № 1

Перейти до використання s3a:// схема (з JARs Hadoop 2.7.x на вашому класному шляху), і це відбувається автоматично. Схема "s3: //" з не-EMR версіями spark / hadoop - це не той роз'єм, який потрібно (він старий, не сумісний і був видалений з останніх версій)

1 для відповіді № 2

Я використовую hadoop-2.8.0 та spark-2.2.0-bin-hadoop2.7.

Інтеграція Spark-S3-IAM добре працює із наступними пакетами AWS на драйвері.

spark-submit --packages com.amazonaws:aws-java-sdk:1.7.4,org.apache.hadoop:hadoop-aws:2.7.3  ...

Фрагмент кодів Scala:

sc.textFile("s3a://.../file.gz").count()

Схожі запитання

Іскра AMI для AWS EC-2 - Ubuntu, amazon-web-сервіси, amazon-ec2, apache-spark, ami

Відправлення даних з мого іскрового коду на червоне зміщення - scala, apache-spark, amazon-redshift

Amazon Affiliate Code для сайту нагороди - php, amazon-web-services

Веб-сервіси Amazon - SQS - Lambda - java, amazon-web-сервіси, amazon-s3, amazon-ec2, aws-lambda

Які програми та зразки мені слід вивчати для веб-служб Amazon? - java, amazon-web-сервіси

Не вдається інтегрувати Amazon в прикладну програму iOS, інтеграцію, Amazon

c # Використовуючи AmazonS3 SDK для RIAK - c #, .net, amazon-s3, aws-sdk, riak

Скільки споживачів робить Іскр для потоку Kinesis? - апачі-іскри, іскрові потоки, амазонкинези

перевизначити налаштування конфігурації при використанні жиру банку для іскри на EMR - apache-іскрі, amazon-emr, typesafe-config

Що є найкращим підходом для даного випадку використання іскрового іскри - apache-spark, amazon-s3, emr

Де я можу знайти інформацію про екземпляр, який я маю на ec2 - amazon-web-сервісах, amazon-ec2

Сигнал Amazon EC2 від S3 - amazon-web-сервіси, amazon-s3, amazon-ec2

Amazon Product API: ecs.amazonaws.com vs. webservices.amazon.com кінцеві точки - Amazon-web-сервіси, amazon-product-api

Які типи EC2 не вимагають VPC? [закрито] - amazon-web-сервіси, amazon-ec2

Як запустити файл spark jar з консолі AWS без Spark-Shell - amazon-web-services, jar, apache-spark, emr

Amazon S3 завантажити зображення - amazon-web-сервіси, amazon-s3

Як додати spark.executor.extraClassPath до spark-conf, використовуючи bootsrap дію в EMR - amazon-web-сервіси, apache-spark, pyspark, emr

Які переваги перемикання Amazon SES від США до ЄС? [закрито] - amazon-web-сервіси, amazon-ec2, amazon-ses

Завантаження файлу на S3, потім обробка в EMR та останній перехід до Redshift - Amazon-web-сервіси, amazon-s3, aws-лямбда, amazon-redshift, amazon-emr

Як ділитись обліковими даними AWA Amazon (S3, EC2 тощо)? - Amazon-S3, Amazon-ec2, Amazon-веб-сервіси, сертифікати