Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Einen Speicherort für die EMR Amazon-Cluster-Ausgabe konfigurieren
Das gängigste Ausgabeformat eines EMR Amazon-Clusters sind Textdateien, entweder komprimiert oder unkomprimiert. Diese Dateien werden in der Regel in einen Amazon-S3-Bucket geschrieben. Dieser Bucket muss erstellt werden, bevor Sie den Cluster starten. Sie geben den S3-Bucket als Ausgabespeicherort an, wenn Sie den Cluster starten.
Weitere Informationen finden Sie unter den folgenden Themen:
Themen
Erstellen und Konfigurieren eines Amazon S3-Buckets
Amazon EMR (AmazonEMR) verwendet Amazon S3 zum Speichern von Eingabedaten, Protokolldateien und Ausgabedaten. Amazon S3 bezeichnet diese Speicherorte als Buckets. Buckets unterliegen bestimmten Einschränkungen und Beschränkungen, um Amazon S3 und DNS den Anforderungen zu entsprechen. Weitere Informationen finden Sie unter Bucket-Einschränkungen und -Limits im Amazon Simple Storage Service-Entwicklerhandbuch.
Um einen Amazon-S3-Bucket zu erstellen, befolgen Sie die Anweisungen auf der Seite Bucket erstellen im Benutzerhandbuch zu Amazon Simple Storage Service.
Anmerkung
Wenn Sie im Assistenten Bucket erstellen die Protokollierung aktivieren, werden nur Bucket-Zugriffsprotokolle aktiviert und nicht Cluster-Protokolle.
Anmerkung
Weitere Informationen zur Angabe regionsspezifischer Buckets finden Sie unter Buckets and Regions im Amazon Simple Storage Service Developer Guide und Available Region
Nachdem Sie Ihren Bucket erstellt haben, können Sie die entsprechenden Zugriffsberechtigungen hierzu einrichten. Hierbei sollten Sie sich selbst (als Eigentümer) Lese- und Schreibzugriff erteilen. Wir empfehlen Ihnen dringend, bei der Konfiguration Ihres Buckets die bewährten Sicherheitsmethoden für Amazon S3 zu befolgen.
Erforderliche Amazon-S3-Buckets müssen vorhanden sein, bevor Sie einen Cluster erstellen können. Sie müssen alle erforderlichen Skripts und Daten auf Amazon S3 hochladen, auf die im Cluster verwiesen wird. In der folgenden Tabelle werden Beispiele für Speicherorte für Daten, Skripts und Protokolldateien beschrieben.
Informationen | Beispielspeicherort auf Amazon S3 |
---|---|
Skript oder Programm |
s3://amzn-s3-demo-bucket1/script/MapperScript.py
|
Protokolldateien |
s3://amzn-s3-demo-bucket1/logs
|
Eingabedaten |
s3://amzn-s3-demo-bucket1/input
|
Ausgabedaten |
s3://amzn-s3-demo-bucket1/output
|