

AWS Data Pipeline ist für Neukunden nicht mehr verfügbar. Bestandskunden von AWS Data Pipeline können den Service weiterhin wie gewohnt nutzen. [Weitere Informationen](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Arbeiten mit Task Runner
<a name="dp-using-task-runner"></a>

 Task Runner ist eine Task-Agent-Anwendung, die geplante Aufgaben abfragt AWS Data Pipeline und sie auf Amazon EC2 EC2-Instances, Amazon EMR-Clustern oder anderen Rechenressourcen ausführt und dabei den Status meldet. Je nach Anwendung können Sie: 
+ Erlauben AWS Data Pipeline Sie, eine oder mehrere Task Runner-Anwendungen für Sie zu installieren und zu verwalten. Wenn eine Pipeline aktiviert ist, wird automatisch der Standard `Ec2Instance` oder das `EmrCluster` Objekt erstellt, auf das ein RunsOn-Feld der Aktivität verweist. AWS Data Pipeline kümmert sich um die Installation von Task Runner auf einer EC2-Instance oder auf dem Master-Knoten eines EMR-Clusters. In diesem Muster AWS Data Pipeline kann der Großteil der Instance- oder Clusterverwaltung für Sie erledigt werden. 
+ Führen Sie alle oder Teile einer Pipeline für von Ihnen verwaltete Ressourcen aus. Zu den potenziellen Ressourcen gehören eine Amazon EC2 EC2-Instance mit langer Laufzeit, ein Amazon EMR-Cluster oder ein physischer Server. Sie können einen Task-Runner (der entweder Task Runner oder ein benutzerdefinierter Task-Agent Ihres eigenen Geräts sein kann) fast überall installieren, vorausgesetzt, er kann mit dem Webservice kommunizieren. AWS Data Pipeline In diesem Muster übernehmen Sie fast die vollständige Kontrolle darüber, welche Ressourcen verwendet und wie sie verwaltet werden, und Sie müssen Task Runner manuell installieren und konfigurieren. Verwenden Sie dazu die Verfahren in diesem Abschnitt, wie in [Arbeiten an vorhandenen Ressourcen mit Task Runner ausführen](dp-how-task-runner-user-managed.md) beschrieben. 

# Task Runner auf AWS Data Pipeline-Verwaltete Ressourcen
<a name="dp-how-task-runner-dp-managed"></a>

 Wenn eine Ressource von gestartet und verwaltet wird AWS Data Pipeline, installiert der Webdienst automatisch Task Runner auf dieser Ressource, um Aufgaben in der Pipeline zu verarbeiten. Sie geben eine Rechenressource (entweder eine Amazon EC2 EC2-Instance oder ein Amazon EMR-Cluster) für das `runsOn` Feld eines Aktivitätsobjekts an. Wenn diese Ressource AWS Data Pipeline gestartet wird, installiert sie Task Runner auf dieser Ressource und konfiguriert sie so, dass sie alle Aktivitätsobjekte verarbeitet, deren `runsOn` Feld auf diese Ressource gesetzt ist. Wenn die Ressource AWS Data Pipeline beendet wird, werden die Task Runner-Protokolle an einem Amazon S3 S3-Speicherort veröffentlicht, bevor sie heruntergefahren wird.

![\[Der Task-Runner-Lebenszyklus auf einer verwalteten Ressource AWS Data Pipeline\]](http://docs.aws.amazon.com/de_de/datapipeline/latest/DeveloperGuide/images/dp-task-runner-managed-emr-jobflow.png)


 Wenn Sie beispielsweise in einer Pipeline die `EmrActivity` verwenden und im Feld `runsOn` eine `EmrCluster`-Ressource angeben. Bei der AWS Data Pipeline Verarbeitung dieser Aktivität wird ein Amazon EMR-Cluster gestartet und Task Runner auf dem Master-Knoten installiert. Dieser Task Runner verarbeitet dann die Aufgaben für Aktivitäten, deren `runsOn` Feld auf dieses `EmrCluster` Objekt festgelegt ist. Der folgende Ausschnitt aus einer Pipeline-Definition zeigt diese Beziehung zwischen den beiden Objekten. 

```
{
  "id" : "MyEmrActivity",
  "name" : "Work to perform on my data",
  "type" : "EmrActivity",
  "runsOn" : {"ref" : "MyEmrCluster"},
  "preStepCommand" : "scp remoteFiles localFiles",
  "step" : "s3://amzn-s3-demo-bucket/myPath/myStep.jar,firstArg,secondArg",
  "step" : "s3://amzn-s3-demo-bucket/myPath/myOtherStep.jar,anotherArg",
  "postStepCommand" : "scp localFiles remoteFiles",
  "input" : {"ref" : "MyS3Input"},
  "output" : {"ref" : "MyS3Output"}
},
{
  "id" : "MyEmrCluster",
  "name" : "EMR cluster to perform the work",
  "type" : "EmrCluster",
  "hadoopVersion" : "0.20",
  "keypair" : "myKeyPair",
  "masterInstanceType" : "m1.xlarge",
  "coreInstanceType" : "m1.small",
  "coreInstanceCount" : "10",
  "taskInstanceType" : "m1.small",
  "taskInstanceCount": "10",
  "bootstrapAction" : "s3://elasticmapreduce/libs/ba/configure-hadoop,arg1,arg2,arg3",
  "bootstrapAction" : "s3://elasticmapreduce/libs/ba/configure-other-stuff,arg1,arg2"
}
```

Informationen und Beispiele für die Ausführung dieser Aktivitäten finden Sie unter [EmrActivity](dp-object-emractivity.md).

 Wenn Sie mehrere AWS Data Pipeline verwaltete Ressourcen in einer Pipeline haben, wird Task Runner auf jeder von ihnen installiert, und alle Ressourcen fragen nach zu AWS Data Pipeline verarbeitenden Aufgaben ab. 

# Arbeiten an vorhandenen Ressourcen mit Task Runner ausführen
<a name="dp-how-task-runner-user-managed"></a>

Sie können Task Runner auf Rechenressourcen installieren, die Sie verwalten, z. B. einer Amazon EC2 EC2-Instance oder einem physischen Server oder einer Workstation. Task Runner kann überall auf jeder kompatiblen Hardware oder jedem kompatiblen Betriebssystem installiert werden, vorausgesetzt, es kann mit dem AWS Data Pipeline Webservice kommunizieren.

Dieser Ansatz kann nützlich sein, wenn Sie beispielsweise Daten verarbeiten AWS Data Pipeline möchten, die in der Firewall Ihres Unternehmens gespeichert sind. Durch die Installation von Task Runner auf einem Server im lokalen Netzwerk können Sie sicher auf die lokale Datenbank zugreifen und dann die AWS Data Pipeline nächste auszuführende Aufgabe abfragen. Wenn die Verarbeitung AWS Data Pipeline beendet oder die Pipeline gelöscht wird, läuft die Task Runner-Instanz weiterhin auf Ihrer Rechenressource, bis Sie sie manuell herunterfahren. Die Task Runner-Protokolle bleiben bestehen, nachdem die Pipeline-Ausführung abgeschlossen ist. 

Um Task Runner auf einer von Ihnen verwalteten Ressource zu verwenden, müssen Sie zuerst Task Runner herunterladen und ihn dann mithilfe der Verfahren in diesem Abschnitt auf Ihrer Rechenressource installieren. 

**Anmerkung**  
 Sie können Task Runner nur unter Linux, UNIX oder macOS installieren. Task Runner wird auf dem Windows-Betriebssystem nicht unterstützt.   
Um Task Runner 2.0 verwenden zu können, ist mindestens die Java-Version 1.7 erforderlich.

Um einen Task Runner, den Sie installiert haben, mit den Pipeline-Aktivitäten zu verbinden, die er verarbeiten soll, fügen Sie dem Objekt ein `workerGroup` Feld hinzu und konfigurieren Sie Task Runner so, dass er diesen Workergruppenwert abfragt. Dazu übergeben Sie die Worker-Group-Zeichenfolge als Parameter (z. B.`--workerGroup=wg-12345`), wenn Sie die Task Runner-JAR-Datei ausführen. 

![\[AWS Data Pipeline diagram showing monthly task flow for archiving processed invoices using Task Runner.\]](http://docs.aws.amazon.com/de_de/datapipeline/latest/DeveloperGuide/images/dp-task-runner-user-emr-jobflow.png)


```
{
  "id" : "CreateDirectory",
  "type" : "ShellCommandActivity",
  "workerGroup" : "wg-12345",
  "command" : "mkdir new-directory"
}
```

## Task Runner installieren
<a name="dp-installing-taskrunner"></a>

In diesem Abschnitt wird erklärt, wie Task Runner installiert und konfiguriert wird und welche Voraussetzungen dafür erforderlich sind. Die Installation ist ein einfacher manueller Prozess.

**Um Task Runner zu installieren**

1. Task Runner benötigt die Java-Versionen 1.6 oder 1.8. Verwenden Sie den folgenden Befehl, um festzustellen, ob Java installiert ist und welche Version ausgeführt wird:

   ```
   java -version
   ```

    Wenn Sie Java 1.6 oder 1.8 nicht auf Ihrem Computer installiert haben, laden Sie eine dieser Versionen von [http://www.oracle herunter. com/technetwork/java/index](http://www.oracle.com/technetwork/java/index.html).html. Laden Sie Java herunter und installieren Sie es und fahren Sie mit dem nächsten Schritt fort.

1. Laden Sie es `TaskRunner-1.0.jar` von [https://s3.amazonaws.com/datapipeline-us-east-1/us-east-1/ software/latest/TaskRunner/TaskRunner -1.0.jar](https://s3.amazonaws.com/datapipeline-us-east-1/us-east-1/software/latest/TaskRunner/TaskRunner-1.0.jar) herunter und kopieren Sie es dann in einen Ordner auf der Ziel-Computerressource. Für Amazon EMR-Cluster, die `EmrActivity` Aufgaben ausführen, installieren Sie Task Runner auf dem Master-Knoten des Clusters.

1. Wenn Sie Task Runner verwenden, um eine Verbindung zum AWS Data Pipeline Webservice herzustellen, um Ihre Befehle zu verarbeiten, benötigen Benutzer programmatischen Zugriff auf eine Rolle, die über Berechtigungen zum Erstellen oder Verwalten von Daten-Pipelines verfügt. Weitere Informationen finden Sie unter [Erteilen programmgesteuerten Zugriffs](dp-get-setup.md#dp-grant-programmatic-access).

1. Task Runner stellt über HTTPS eine Verbindung zum AWS Data Pipeline Webdienst her. Wenn Sie eine AWS Ressource verwenden, stellen Sie sicher, dass HTTPS in der entsprechenden Routingtabelle und Subnetz-ACL aktiviert ist. Wenn Sie eine Firewall oder einen Proxy verwenden, stellen Sie sicher, dass der Port 443 geöffnet ist.

# (Optional) Task Runner-Zugriff auf Amazon RDS gewähren
<a name="dp-taskrunner-rdssecurity"></a>

Mit Amazon RDS können Sie den Zugriff auf Ihre DB-Instances mithilfe von Datenbanksicherheitsgruppen (DB-Sicherheitsgruppen) kontrollieren. DB-Sicherheitsgruppen funktionieren wie eine Firewall. Sie steuern den Netzwerkzugriff auf die DB-Instance. Der Netzwerkzugriff auf Ihre DB-Instances ist standardmäßig deaktiviert. Sie müssen Ihre DB-Sicherheitsgruppen ändern, damit Task Runner auf Ihre Amazon RDS-Instances zugreifen kann. Task Runner erhält Amazon RDS-Zugriff von der Instance, auf der es ausgeführt wird. Daher hängen die Konten und Sicherheitsgruppen, die Sie zu Ihrer Amazon RDS-Instance hinzufügen, davon ab, wo Sie Task Runner installieren. 

**Um Zugriff auf Task Runner in EC2-Classic zu gewähren**

1. Öffnen Sie die Amazon RDS-Konsole.

1. Klicken Sie im Navigationsbereich auf ** Instances** (DB-Instances) und wählen Sie anschließend Ihre DB-Instance aus.

1. Wählen Sie unter **Sicherheit und Netzwerk** die Sicherheitsgruppe aus, die die Seite **Sicherheitsgruppen** mit dieser ausgewählten DB-Sicherheitsgruppe öffnet. Klicken Sie auf das Detailsymbol für die DB-Sicherheitsgruppe.

1. Legen Sie unter **Sicherheitsgruppendetails** eine Regel mit dem entsprechenden **Verbindungstyp** und **Details** an. Diese Felder hängen davon ab, wo Task Runner ausgeführt wird, wie hier beschrieben:
   + `Ec2Resource`
     + **Verbindungstyp**: `EC2 Security Group`

       **Details**: *my-security-group-name* (der Name der Sicherheitsgruppe, die Sie für die EC2-Instance erstellt haben)
   + `EmrResource`
     + **Verbindungstyp**: `EC2 Security Group`

       **Details**: `ElasticMapReduce-master`
     + **Verbindungstyp**: `EC2 Security Group`

       **Details**: `ElasticMapReduce-slave`
   + Ihre lokale Umgebung (lokal)
     + **Verbindungstyp**: `CIDR/IP`:

       **Details**: *my-ip-address* (die IP-Adresse Ihres Computers oder der IP-Adressbereich Ihres Netzwerks, falls sich Ihr Computer hinter einer Firewall befindet)

1. Klicken Sie auf Add (Hinzufügen).

**Um Zugriff auf Task Runner in EC2-VPC zu gewähren**

1. Öffnen Sie die Amazon RDS-Konsole.

1. Wählen Sie im Navigationsbereich **Instances** aus.

1. Klicken Sie auf das Detailsymbol für die DB-Sicherheitsgruppe. Öffnen Sie unter **Sicherheit und Netzwerk** den Link zur Sicherheitsgruppe, über den Sie zur Amazon EC2 EC2-Konsole gelangen. Wenn Sie das alte Konsolendesign für Sicherheitsgruppen verwenden, wechseln Sie zum neuen Konsolendesign, indem Sie auf das Symbol klicken, das oben auf der Konsolenseite angezeigt wird.

1. Wählen Sie auf der Registerkarte **Inbound** die Option **Edit**, **Add Rule**. Geben Sie den Datenbankanschluss an, den Sie beim Starten der DB-Instance verwendet haben. Die Quelle hängt davon ab, wo Task Runner ausgeführt wird, wie hier beschrieben:
   + `Ec2Resource`
     + *my-security-group-id*(die ID der Sicherheitsgruppe, die Sie für die EC2-Instance erstellt haben)
   + `EmrResource`
     + *master-security-group-id*(die ID der `ElasticMapReduce-master` Sicherheitsgruppe)
     + *slave-security-group-id*(die ID der `ElasticMapReduce-slave` Sicherheitsgruppe)
   + Ihre lokale Umgebung (lokal)
     + *ip-address*(die IP-Adresse Ihres Computers oder der IP-Adressbereich Ihres Netzwerks, falls sich Ihr Computer hinter einer Firewall befindet)

1. Klicken Sie auf **Speichern**.

## Task Runner starten
<a name="dp-activate-task-runner"></a>

Starten Sie Task Runner in einem neuen Befehlszeilenfenster, das sich auf das Verzeichnis bezieht, in dem Sie Task Runner installiert haben, mit dem folgenden Befehl.

```
java -jar TaskRunner-1.0.jar --config ~/credentials.json --workerGroup=myWorkerGroup --region=MyRegion --logUri=s3://amzn-s3-demo-bucket/foldername
```

Die Option `--config` zeigt auf Ihre Anmeldedaten-Datei.

Die Option `--workerGroup` gibt den Namen Ihrer Auftragnehmergruppe an, der für die zu verarbeitenden Aufgaben in Ihrer Pipeline den gleichen Wert haben muss.

Die Option `--region` gibt den Servicebereich an, von dem aus Aufgaben ausgeführt werden sollen.

Die `--logUri` Option wird verwendet, um Ihre komprimierten Protokolle an einen Speicherort in Amazon S3 zu übertragen.

Wenn Task Runner aktiv ist, gibt es den Pfad, in den die Protokolldateien geschrieben werden, im Terminalfenster aus. Im Folgenden wird ein -Beispiel gezeigt.

```
Logging to /Computer_Name/.../output/logs
```

Task-Runner sollte von Ihrer Anmelde-Shell getrennt ausgeführt werden. Wenn Sie eine Terminalanwendung verwenden, um eine Verbindung zu Ihrem Computer herzustellen, müssen Sie möglicherweise ein Dienstprogramm wie nohup oder screen verwenden, um zu verhindern, dass die Task-Runner-Anwendung beendet wird, wenn Sie sich abmelden. Weitere Informationen zu diesen Befehlszeilenoptionen finden Sie unter [Task Runner-Konfigurationsoptionen](dp-taskrunner-config-options.md).

## Die Task Runner-Protokollierung wird überprüft
<a name="dp-verify-task-runner"></a>

Der einfachste Weg, um zu überprüfen, ob Task Runner funktioniert, besteht darin, zu überprüfen, ob er Protokolldateien schreibt. Task Runner schreibt stündlich Protokolldateien in das Verzeichnis,`output/logs`, unter dem Verzeichnis, in dem Task Runner installiert ist. Der Dateiname ist `Task Runner.log.YYYY-MM-DD-HH`, wobei HH von 00 bis 23 in UDT läuft. Um Speicherplatz zu sparen, werden alle Protokolldateien, die älter als acht Stunden sind, mit komprimiert GZip.

# Task Runner-Threads und Vorbedingungen
<a name="dp-taskrunner-threading"></a>

 Task Runner verwendet für jede Aufgabe, Aktivität und Vorbedingung einen Threadpool. Die Standardeinstellung für `--tasks` ist 2, was bedeutet, dass zwei Threads aus dem Aufgabenpool zugewiesen sind und jeder Thread den AWS Data Pipeline Dienst nach neuen Aufgaben abfragt. Daher ist `--tasks` ein Attribut für die Leistungsoptimierung, mit dem der Pipeline-Durchsatz optimiert werden kann.

 Die Pipeline-Wiederholungslogik für Vorbedingungen erfolgt in Task Runner. Zwei Vorbedingungs-Threads sind AWS Data Pipeline für die Abfrage von Vorbedingungsobjekten zugewiesen. Task Runner berücksichtigt die Felder **RetryDelay** und **PreconditionTimeout der Vorbedingungsobjekte, die Sie unter Vorbedingungen definieren**. 

In vielen Fällen kann das Reduzieren des Timeouts für Abfragen und die Anzahl der Wiederholungen dazu beitragen, die Leistung Ihrer Anwendung zu verbessern. In ähnlicher Weise müssen Anwendungen mit Langzeitvorbedingungen die Werte für Timeout und Wiederholung erhöhen. Weitere Informationen zu Vorbedingungsobjekten finden Sie unter [Vorbedingungen](dp-concepts-preconditions.md).

# Task Runner-Konfigurationsoptionen
<a name="dp-taskrunner-config-options"></a>

Dies sind die Konfigurationsoptionen, die in der Befehlszeile verfügbar sind, wenn Sie Task Runner starten. 


****  

| Befehlszeilen-Parameter | Description | 
| --- | --- | 
| `--help` | Befehlszeilenhilfe. Beispiel: `Java -jar TaskRunner-1.0.jar --help` | 
| `--config` | Pfad und Dateiname Ihrer Datei `credentials.json`. | 
| `--accessId` | Ihre AWS Zugriffsschlüssel-ID für Task Runner, die Sie bei Anfragen verwenden können. Die `--secretKey` Optionen `--accessID` und bieten eine Alternative zur Verwendung einer Credentials.json-Datei. Wenn auch eine `credentials.json`-Datei vorgesehen ist, haben die Optionen `--accessID` und `--secretKey` Vorrang.  | 
| `--secretKey` | Ihr AWS geheimer Schlüssel, den Task Runner bei Anfragen verwenden kann. Weitere Informationen finden Sie unter `--accessID`.  | 
| `--endpoint` | Ein Endpunkt ist eine URL, die als Eintrittspunkt für einen Webservice fungiert. Der AWS Data Pipeline Service-Endpunkt in der Region, in der Sie Anfragen stellen. Optional. Im Allgemeinen reicht es aus, eine Region anzugeben, und Sie müssen den Endpunkt nicht festlegen. Eine Liste der AWS Data Pipeline Regionen und Endpunkte finden Sie unter [AWS Data Pipeline Regions and Endpoints](https://docs.aws.amazon.com/general/latest/gr/rande.html#datapipeline_region) in der. *Allgemeine AWS-Referenz* | 
| `--workerGroup` | Der Name der Worker-Gruppe, für die Task Runner Arbeit abruft. ErforderlichWenn Task Runner den Webdienst abfragt, verwendet er die von Ihnen angegebenen Anmeldeinformationen und den Wert von, `workerGroup` um auszuwählen, welche (falls vorhanden) Aufgaben abgerufen werden sollen. Sie können jeden Namen verwenden, der für Sie von Bedeutung ist. Die einzige Voraussetzung ist, dass die Zeichenfolge zwischen dem Task Runner und den entsprechenden Pipeline-Aktivitäten übereinstimmt. Der Name der Auftragnehmergruppe ist an eine Region gebunden. Auch wenn es in anderen Regionen identische Namen für Arbeitsgruppen gibt, ruft Task Runner immer Aufgaben aus der Region ab, die in angegeben ist`--region`. | 
| `--taskrunnerId` | Die ID des Task-Runners für die Berichterstellung zum Fortschritt. Optional. | 
| `--output` | Das Task Runner-Verzeichnis für Protokollausgabedateien. Optional. Protokolldateien werden in einem lokalen Verzeichnis gespeichert, bis sie an Amazon S3 übertragen werden. Diese Option überschreibt das Standard-Verzeichnis.  | 
| `--region` | Die -Region, die verwendet werden soll. Optional, aber es wird empfohlen, die Region immer festzulegen. Wenn Sie die Region nicht angeben, ruft Task Runner Aufgaben aus der Standard-Serviceregion ab. `us-east-1`Andere unterstützte Regionen sind: `eu-west-1`, `ap-northeast-1`, `ap-southeast-2`, `us-west-2`.  | 
| `--logUri` | Der Amazon S3 S3-Zielpfad für Task Runner, um Protokolldateien stündlich zu sichern. Wenn Task Runner beendet wird, werden aktive Protokolle im lokalen Verzeichnis in den Amazon S3 S3-Zielordner übertragen.  | 
| --proxyHost | Der Host des Proxys, der von Task Runner-Clients verwendet wird, um eine Verbindung zu AWS-Services herzustellen. | 
| --proxyPort | Port des Proxy-Hosts, der von Task Runner-Clients verwendet wird, um eine Verbindung zu AWS-Services herzustellen. | 
| --proxyUsername | Der Benutzername für den Proxy | 
| --proxyPassword | Das Passwort für den Proxy. | 
| --proxyDomain | Der Windows-Domänenname für NTLM Proxy. | 
| --proxyWorkstation | Der Windows-Arbeitsstationsname für NTLM Proxy. | 

# Task-Runner mit einem Proxy verwenden
<a name="dp-taskrunner-proxy"></a>

Wenn Sie einen Proxy-Host verwenden, können Sie beim Aufrufen von Task-Runner entweder seine [Konfiguration](https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-taskrunner-config-options.html) angeben oder die Umgebungsvariable HTTPS\$1PROXY festlegen. Die mit Task-Runner verwendete Umgebungsvariable akzeptiert dieselbe Konfiguration, die für die [AWS-Befehlszeilenschnittstelle](https://docs.aws.amazon.com/cli/latest/userguide/cli-http-proxy.html)verwendet wird. 

# Task Runner und Benutzerdefiniert AMIs
<a name="dp-custom-ami"></a>

Wenn Sie ein `Ec2Resource` Objekt für Ihre Pipeline angeben, AWS Data Pipeline erstellt eine EC2-Instance für Sie. Dabei wird ein AMI verwendet, das Task Runner für Sie installiert und konfiguriert. In diesem Fall ist ein PV-kompatibler Instancetyp erforderlich. Alternativ können Sie mit Task Runner ein benutzerdefiniertes AMI erstellen und dann die ID dieses AMI mithilfe des `imageId` Felds des `Ec2Resource` Objekts angeben. Weitere Informationen finden Sie unter [Ec2Resource](dp-object-ec2resource.md).

Ein benutzerdefiniertes AMI muss die folgenden Anforderungen erfüllen AWS Data Pipeline , um es erfolgreich für Task Runner verwenden zu können:
+ Erstellen Sie das AMI in derselben Region, in der die Instances ausgeführt werden. Weitere Informationen finden Sie unter [Creating Your Own AMI](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/creating-an-ami.html) im *Amazon EC2 EC2-Benutzerhandbuch*.
+ Stellen Sie sicher, dass der Virtualisierungstyp des AMI vom Instancetyp unterstützt wird, den Sie verwenden möchten. Beispielsweise benötigen die Instancetypen I2 und G2 einen HVM AMI, und die Instancetypen T1, C1, M1 und M2 erfordern einen PV AMI. Weitere Informationen finden Sie unter [Linux AMI Virtualization Types](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/virtualization_types.html) im *Amazon EC2 EC2-Benutzerhandbuch*.
+ Installieren Sie die folgenden Software:
  + Linux
  + Bash
  + wget
  + unzip
  + Java 1.6 oder 1.8
  + cloud-init
+ Erstellen und konfigurieren Sie einen Benutzer mit dem Namen`ec2-user`.