Problembehebung bei Amazon EMR on EKS Spark Operator - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Problembehebung bei Amazon EMR on EKS Spark Operator

Lesen Sie die folgenden Abschnitte, falls Sie Probleme mit dem Amazon EMR on EKS Spark-Operator haben. Weitere Informationen, einschließlich der Schritte zum Abschließen der Installation, finden Sie unter Spark-Aufträge mit dem Spark-Operator ausführen.

Fehler bei der Installation des Helm-Charts

Wenn Sie die Schritte unter befolgt haben Den Spark-Operator installieren und beim Versuch, das Helm-Diagramm zu installieren oder zu überprüfen, ein INSTALLATION FAILED Fehler wie der folgende zurückgegeben wurde, haben Sie die Authentifizierungstoken möglicherweise nicht für das ECR Amazon-Repository für den Betreiber abgerufen.

Um dieses Problem zu beheben, wiederholen Sie den Schritt unter, Den Spark-Operator installieren um Ihren Helm-Client bei der ECR Amazon-Registrierung zu authentifizieren. Versuchen Sie dann den Installationsschritt erneut.

Error: INSTALLATION FAILED: Kubernetes cluster unreachable: the server has asked for the client to provide credentials

UnsupportedFileSystemException: Nein FileSystem für Schema „s3"

Möglicherweise tritt im Thread „main“ die folgende Ausnahme auf:

org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "s3"

Wenn dies der Fall ist, fügen Sie der SparkApplication-Spezifikation die folgenden Ausnahmen hinzu:

hadoopConf: # EMRFS filesystem fs.s3.customAWSCredentialsProvider: com.amazonaws.auth.WebIdentityTokenCredentialsProvider fs.s3.impl: com.amazon.ws.emr.hadoop.fs.EmrFileSystem fs.AbstractFileSystem.s3.impl: org.apache.hadoop.fs.s3.EMRFSDelegate fs.s3.buffer.dir: /mnt/s3 fs.s3.getObject.initialSocketTimeoutMilliseconds: "2000" mapreduce.fileoutputcommitter.algorithm.version.emr_internal_use_only.EmrFileSystem: "2" mapreduce.fileoutputcommitter.cleanup-failures.ignored.emr_internal_use_only.EmrFileSystem: "true" sparkConf: # Required for EMR Runtime spark.driver.extraClassPath: /usr/lib/hadoop-lzo/lib/*:/usr/lib/hadoop/hadoop-aws.jar:/usr/share/aws/aws-java-sdk/*:/usr/share/aws/emr/emrfs/conf:/usr/share/aws/emr/emrfs/lib/*:/usr/share/aws/emr/emrfs/auxlib/*:/usr/share/aws/emr/security/conf:/usr/share/aws/emr/security/lib/*:/usr/share/aws/hmclient/lib/aws-glue-datacatalog-spark-client.jar:/usr/share/java/Hive-JSON-Serde/hive-openx-serde.jar:/usr/share/aws/sagemaker-spark-sdk/lib/sagemaker-spark-sdk.jar:/home/hadoop/extrajars/* spark.driver.extraLibraryPath: /usr/lib/hadoop/lib/native:/usr/lib/hadoop-lzo/lib/native:/docker/usr/lib/hadoop/lib/native:/docker/usr/lib/hadoop-lzo/lib/native spark.executor.extraClassPath: /usr/lib/hadoop-lzo/lib/*:/usr/lib/hadoop/hadoop-aws.jar:/usr/share/aws/aws-java-sdk/*:/usr/share/aws/emr/emrfs/conf:/usr/share/aws/emr/emrfs/lib/*:/usr/share/aws/emr/emrfs/auxlib/*:/usr/share/aws/emr/security/conf:/usr/share/aws/emr/security/lib/*:/usr/share/aws/hmclient/lib/aws-glue-datacatalog-spark-client.jar:/usr/share/java/Hive-JSON-Serde/hive-openx-serde.jar:/usr/share/aws/sagemaker-spark-sdk/lib/sagemaker-spark-sdk.jar:/home/hadoop/extrajars/* spark.executor.extraLibraryPath: /usr/lib/hadoop/lib/native:/usr/lib/hadoop-lzo/lib/native:/docker/usr/lib/hadoop/lib/native:/docker/usr/lib/hadoop-lzo/lib/native