Anwendungen konfigurieren - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Anwendungen konfigurieren

Um die Standardkonfigurationen für eine Anwendung zu überschreiben, können Sie ein Konfigurationsobjekt bereitstellen. Sie können entweder eine Kurzsyntax verwenden, um die Konfiguration bereitzustellen, oder Sie können das Konfigurationsobjekt in einer Datei referenzieren. JSON Konfigurationsobjekte bestehen aus einer Klassifizierung, Eigenschaften und optionalen verschachtelten Konfigurationen. Die Eigenschaften entsprechen den Anwendungseinstellungen, die Sie ändern möchten. Sie können mehrere Klassifizierungen für mehrere Anwendungen in einem einzigen Objekt angeben. JSON

Warnung

Die Amazon EMR Describe- und API List-Operationen geben benutzerdefinierte und konfigurierbare Einstellungen, die als Teil der EMR Amazon-Auftragsabläufe verwendet werden, im Klartext aus. Informationen zur Angabe vertraulicher Informationen wie Kennwörter in diesen Einstellungen finden Sie unter Vertrauliche Konfigurationsdaten in AWS Secrets Manager speichern.

Die verfügbaren Konfigurationsklassifizierungen variieren je nach EMR Amazon-Release-Version. Eine Liste der Konfigurationsklassifizierungen, die in einer bestimmten Release-Version unterstützt werden, finden Sie auf der Seite für diese Release-Version unter Über Amazon EMR Releases.

Im Folgenden finden Sie eine JSON Beispieldatei für eine Liste von Konfigurationen.

[ { "Classification": "core-site", "Properties": { "hadoop.security.groups.cache.secs": "250" } }, { "Classification": "mapred-site", "Properties": { "mapred.tasktracker.map.tasks.maximum": "2", "mapreduce.map.sort.spill.percent": "0.90", "mapreduce.tasktracker.reduce.tasks.maximum": "5" } } ]

Eine Konfigurationsklassifizierung bezieht sich häufig auf eine anwendungsspezifische Konfigurationsdatei. Die hive-site-Klassifizierung ist Einstellungen in der hive-site.xml-Konfigurationsdatei für Hive zugeordnet. Eine Ausnahme bildet die veraltete Bootstrap-Aktion configure-daemons, mit der Umgebungsparameter wie z. B. --namenode-heap-size definiert werden. Optionen wie diese sind in den Klassifizierungen hadoop-env und yarn-env mit ihren eigenen verschachtelten Exportklassifizierungen zusammengefasst. Verwenden Sie die Export-Unterklassifizierung, wenn eine Klassifizierung auf env endet.

Eine weitere Ausnahme ist s3get. Sie wurde verwendet, um ein EncryptionMaterialsProvider-Kundenobjekt auf jedem Knoten in einem Cluster für die Verwendung bei der clientseitigen Verschlüsselung zu platzieren. Der Klassifizierung emrfs-site wurde zu diesem Zweck eine Option hinzugefügt.

Im Folgenden finden Sie ein Beispiel für die hadoop-env-Klassifizierung.

[ { "Classification": "hadoop-env", "Properties": { }, "Configurations": [ { "Classification": "export", "Properties": { "HADOOP_DATANODE_HEAPSIZE": "2048", "HADOOP_NAMENODE_OPTS": "-XX:GCTimeRatio=19" }, "Configurations": [ ] } ] } ]

Im Folgenden finden Sie ein Beispiel für die yarn-env-Klassifizierung.

[ { "Classification": "yarn-env", "Properties": { }, "Configurations": [ { "Classification": "export", "Properties": { "YARN_RESOURCEMANAGER_OPTS": "-Xdebug -Xrunjdwp:transport=dt_socket" }, "Configurations": [ ] } ] } ]

Die folgenden Einstellungen gehören nicht zu einer Konfigurationsdatei, sondern werden von Amazon verwendetEMR, um möglicherweise mehrere Einstellungen in Ihrem Namen zu konfigurieren.

Von Amazon kuratierte Einstellungen EMR
Anwendung Klassifizierung der Versionsbezeichnung Gültige Eigenschaften Wann sollte dies verwendet werden?
Spark spark maximizeResourceAllocation Konfigurieren von Executors zur Nutzung der maximalen Ressourcen eines jeden Knotens