

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Asynchrone Analyse für Amazon Comprehend Insights
<a name="api-async-insights"></a>

In den folgenden Abschnitten wird die Amazon Comprehend API verwendet, um asynchrone Operationen zur Analyse von Amazon Comprehend Insights auszuführen.

**Topics**
+ [Voraussetzungen](#detect-topics-role-auth)
+ [Einen Analysejob starten](#how-start-job)
+ [Analyse-Jobs überwachen](#how-monitor-progress)
+ [Analyseergebnisse abrufen](#how-get-results)

## Voraussetzungen
<a name="detect-topics-role-auth"></a>

Dokumente müssen in Textdateien im UTF-8-Format vorliegen. Sie können Ihre Dokumente in zwei Formaten einreichen. Welches Format Sie verwenden, hängt von der Art der Dokumente ab, die Sie analysieren möchten, wie in der folgenden Tabelle beschrieben.


| Description | Format | 
| --- | --- | 
| Jede Datei enthält ein Eingabedokument. Dies eignet sich am besten für Sammlungen großer Dokumente. | Ein Dokument pro Datei | 
|  Die Eingabe besteht aus einer oder mehreren Dateien. Jede Zeile in einer Datei wird als Dokument betrachtet. Dies eignet sich am besten für kurze Dokumente, wie z. B. Beiträge in sozialen Netzwerken. Jede Zeile muss mit einem Zeilenvorschub (LF,\$1n), einem Zeilenwechsel (CR,\$1 r) oder beidem (CRLF,\$1 r\$1n) enden. Sie können das UTF-8-Zeilentrennzeichen (u\$12028) nicht verwenden, um eine Zeile zu beenden.  | Ein Dokument pro Zeile | 

Wenn Sie einen Analysejob starten, geben Sie den S3-Speicherort für Ihre Eingabedaten an. Der URI muss sich in derselben AWS Region befinden wie der API-Endpunkt, den Sie aufrufen. Der URI kann auf eine einzelne Datei verweisen oder er kann das Präfix für eine Sammlung von Datendateien sein. Weitere Informationen finden Sie unter [InputDataConfig](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_InputDataConfig.html)Datentyp.

Sie müssen Amazon Comprehend Zugriff auf den Amazon S3 S3-Bucket gewähren, der Ihre Dokumentensammlungs- und Ausgabedateien enthält. Weitere Informationen finden Sie unter [Rollenbasierte Berechtigungen sind für asynchrone Operationen erforderlich](security_iam_id-based-policy-examples.md#auth-role-permissions).

## Einen Analysejob starten
<a name="how-start-job"></a>

Um einen Analyseauftrag einzureichen, verwenden Sie entweder die Amazon Comprehend Comprehend-Konsole oder den entsprechenden `Start*` Vorgang:
+  [StartDominantLanguageDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartDominantLanguageDetectionJob.html)— Starten Sie einen Job, um die dominante Sprache in jedem Dokument der Sammlung zu ermitteln. Weitere Hinweise zur dominanten Sprache in einem Dokument finden Sie unter[Vorherrschende Sprache](how-languages.md).
+  [StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html)— Startet einen Job zur Erkennung von Entitäten in jedem Dokument der Sammlung. Weitere Informationen über Entitys finden Sie unter [Entitäten](how-entities.md).
+  [StartKeyPhrasesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartKeyPhrasesDetectionJob.html)— Startet einen Job zur Erkennung von Schlüsselbegriffen in jedem Dokument der Sammlung. Weitere Informationen zu Schlüsselbegriffen finden Sie unter[Schlüsselphrasen](how-key-phrases.md).
+  [StartPiiEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartPiiEntitiesDetectionJob.html)— Starten Sie einen Job zur Suche nach persönlich identifizierbaren Informationen (PII) in jedem Dokument der Sammlung. Weitere Informationen zu personenbezogenen Daten finden Sie unter. [Erkennung von PII-Entitäten](how-key-phrases.md)
+  [StartSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartSentimentDetectionJob.html)— Starten Sie einen Job, um die Stimmung in jedem Dokument der Sammlung zu ermitteln. Weitere Informationen zu Stimmungen finden Sie unter. [Stimmung](how-sentiment.md)

## Analyse-Jobs überwachen
<a name="how-monitor-progress"></a>

Der `Start*` Vorgang gibt eine ID zurück, mit der Sie den Fortschritt des Jobs überwachen können. 

Um den Fortschritt mithilfe der API zu überwachen, verwenden Sie einen von zwei Vorgängen, je nachdem, ob Sie den Fortschritt eines einzelnen Jobs oder mehrerer Jobs überwachen möchten. 

Verwenden Sie die `Describe*` Operationen, um den Fortschritt eines einzelnen Analyseauftrags zu überwachen. Sie geben die vom `Start*` Vorgang zurückgegebene Job-ID an. Die Antwort des `Describe*` Vorgangs enthält das `JobStatus` Feld mit dem Status des Jobs.

Verwenden Sie die `List*` Operationen, um den Fortschritt mehrerer Analyseaufträge zu überwachen. `List*`Operationen geben eine Liste der Jobs zurück, die Sie an Amazon Comprehend übermittelt haben. Die Antwort enthält für jeden Job ein `JobStatus` Feld, das Ihnen den Status des Jobs anzeigt.

Wenn das Statusfeld auf `COMPLETED` oder gesetzt ist`FAILED`, ist die Auftragsverarbeitung abgeschlossen.

Um den Status einzelner Jobs abzurufen, verwenden Sie den `Describe*` Vorgang für die Analyse, die Sie gerade durchführen.
+  [DescribeDominantLanguageDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeDominantLanguageDetectionJob.html)
+  [DescribeEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeEntitiesDetectionJob.html)
+  [DescribeKeyPhrasesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeKeyPhrasesDetectionJob.html)
+  [DescribePiiEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribePiiEntitiesDetectionJob.html)
+  [DescribeSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeSentimentDetectionJob.html)

Um den Status mehrerer Jobs abzurufen, verwenden Sie den `List*` Vorgang für die Analyse, die Sie gerade durchführen.
+  [ListDominantLanguageDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListDominantLanguageDetectionJobs.html)
+  [ListEntitiesDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListEntitiesDetectionJobs.html)
+  [ListKeyPhrasesDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListKeyPhrasesDetectionJobs.html)
+  [ListPiiEntitiesDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListPiiEntitiesDetectionJobs.html)
+  [ListSentimentDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListSentimentDetectionJobs.html)

Um die Ergebnisse auf Jobs zu beschränken, die bestimmten Kriterien entsprechen, verwenden Sie den `List*` Parameter der Operationen. `Filter` Sie können nach dem Jobnamen, dem Jobstatus sowie dem Datum und der Uhrzeit, zu der der Job übermittelt wurde, filtern. Weitere Informationen finden Sie in den `Filter` Parametern für die einzelnen `List*` Operationen in der Amazon Comprehend API-Referenz.

## Analyseergebnisse abrufen
<a name="how-get-results"></a>

Verwenden Sie nach Abschluss eines Analyseauftrags eine `Describe*` Operation, um den Speicherort der Ergebnisse zu ermitteln. Wenn der Auftragsstatus lautet`COMPLETED`, enthält die Antwort ein `OutputDataConfig` Feld, das ein Feld mit dem Amazon S3 S3-Speicherort der Ausgabedatei enthält. Die Datei,`output.tar.gz`, ist ein komprimiertes Archiv, das die Ergebnisse der Analyse enthält.

Wenn der Status eines Jobs lautet`FAILED`, enthält die Antwort ein `Message` Feld, das den Grund beschreibt, warum der Analyseauftrag nicht erfolgreich abgeschlossen wurde.

Verwenden Sie den entsprechenden `Describe*` Vorgang, um den Status einzelner Jobs abzurufen:
+  [DescribeDominantLanguageDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeDominantLanguageDetectionJob.html)
+  [DescribeEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeEntitiesDetectionJob.html)
+  [DescribeKeyPhrasesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeKeyPhrasesDetectionJob.html)
+  [DescribeSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeSentimentDetectionJob.html)

Die Ergebnisse werden in einer einzigen Datei mit einer JSON-Struktur für jedes Dokument zurückgegeben. Jede Antwortdatei enthält auch Fehlermeldungen für jeden Job, bei dem das Statusfeld auf gesetzt ist`FAILED`.

Jeder der folgenden Abschnitte enthält Beispiele für die Ausgabe für die beiden Eingabeformate.

### Ergebnisse zur Erkennung dominanter Sprachen erhalten
<a name="async-dominant-language"></a>

Im Folgenden finden Sie ein Beispiel für eine Ausgabedatei aus einer Analyse, bei der die dominante Sprache erkannt wurde. Das Format der Eingabe ist ein Dokument pro Zeile. Weitere Informationen finden Sie unter dem Vorgang [DetectDominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectDominantLanguage.html).

```
{"File": "0_doc", "Languages": [{"LanguageCode": "en", "Score": 0.9514502286911011}, {"LanguageCode": "de", "Score": 0.02374090999364853}, {"LanguageCode": "nl", "Score": 0.003208699868991971}, "Line": 0}
{"File": "1_doc", "Languages": [{"LanguageCode": "en", "Score": 0.9822712540626526}, {"LanguageCode": "de", "Score": 0.002621392020955682}, {"LanguageCode": "es", "Score": 0.002386554144322872}], "Line": 1}
```

Im Folgenden finden Sie ein Beispiel für die Ausgabe einer Analyse, bei der das Eingabeformat ein Dokument pro Datei ist:

```
{"File": "small_doc", "Languages": [{"LanguageCode": "en", "Score": 0.9728053212165833}, {"LanguageCode": "de", "Score": 0.007670710328966379}, {"LanguageCode": "es", "Score": 0.0028472368139773607}]}
{"File": "huge_doc", "Languages": [{"LanguageCode": "en", "Score": 0.984955906867981}, {"LanguageCode": "de", "Score": 0.0026436643674969673}, {"LanguageCode": "fr", "Score": 0.0014206881169229746}]}
```

### Ergebnisse der Entitätserkennung abrufen
<a name="async-entities"></a>

Im Folgenden finden Sie ein Beispiel für eine Ausgabedatei aus einer Analyse, bei der Entitäten in Dokumenten erkannt wurden. Das Format der Eingabe ist ein Dokument pro Zeile. Weitere Informationen finden Sie unter dem Vorgang [DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html). Die Ausgabe enthält zwei Fehlermeldungen, eine für ein Dokument, das zu lang ist, und eine für ein Dokument, das nicht im UTF-8-Format ist.

```
{"File": "50_docs", "Line": 0, "Entities": [{"BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "Cluj-NapocaCluj-Napoca", "Type": "LOCATION"}"]}
{"File": "50_docs", "Line": 1, "Entities": [{"BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Maat", "Type": "PERSON"}}]}
{"File": "50_docs", "Line": 2, "ErrorCode": "DOCUMENT_SIZE_EXCEEDED", "ErrorMessage": "Document size exceeds maximum size limit 102400 bytes."}
{"File": "50_docs", "Line": 3, "ErrorCode": "UNSUPPORTED_ENCODING", "ErrorMessage": "Document is not in UTF-8 format and all subsequent lines are ignored."}
```

Im Folgenden finden Sie ein Beispiel für die Ausgabe einer Analyse, bei der das Eingabeformat ein Dokument pro Datei ist. Die Ausgabe enthält zwei Fehlermeldungen, eine für ein Dokument, das zu lang ist, und eine für ein Dokument, das nicht im UTF-8-Format ist. 

```
{"File": "non_utf8.txt", "ErrorCode": "UNSUPPORTED_ENCODING", "ErrorMessage": "Document is not in UTF-8 format and all subsequent line are ignored."}
{"File": "small_doc", "Entities": [{"BeginOffset": 0, "EndOffset": 4, "Score": 0.645766019821167, "Text": "Maat", "Type": "PERSON"}]}
{"File": "huge_doc", "ErrorCode": "DOCUMENT_SIZE_EXCEEDED", "ErrorMessage": "Document size exceeds size limit 102400 bytes."}
```

### Ergebnisse der Erkennung von Schlüsselbegriffen werden abgerufen
<a name="async-key-phrases"></a>

Im Folgenden finden Sie ein Beispiel für eine Ausgabedatei aus einer Analyse, bei der Schlüsselausdrücke in einem Dokument erkannt wurden. Das Format der Eingabe ist ein Dokument pro Zeile. Weitere Informationen finden Sie unter dem Vorgang [DetectKeyPhrases](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectKeyPhrases.html).

```
{"File": "50_docs", "KeyPhrases": [{"BeginOffset": 0, "EndOffset": 22, "Score": 0.8948641419410706, "Text": "Cluj-NapocaCluj-Napoca"}, {"BeginOffset": 45, "EndOffset": 49, "Score": 0.9989854693412781, "Text": "Cluj"}], "Line": 0}            
```

Das Folgende ist ein Beispiel für die Ausgabe einer Analyse, bei der das Eingabeformat ein Dokument pro Datei ist.

```
{"File": "1_doc", "KeyPhrases": [{"BeginOffset": 0, "EndOffset": 22, "Score": 0.8948641419410706, "Text": "Cluj-NapocaCluj-Napoca"}, {"BeginOffset": 45, "EndOffset": 49, "Score": 0.9989854693412781, "Text": "Cluj"}]}            
```

### Abrufen von Ergebnissen der Erkennung personenbezogener Daten (PII)
<a name="async-pii"></a>

Im Folgenden finden Sie ein Beispiel für eine Ausgabedatei aus einem Analysejob, bei dem PII-Entitäten in Dokumenten erkannt wurden. Das Format der Eingabe ist ein Dokument pro Zeile. 

```
{"Entities":[{"Type":"NAME","BeginOffset":40,"EndOffset":69,"Score":0.999995},{"Type":"ADDRESS","BeginOffset":247,"EndOffset":253,"Score":0.998828},{"Type":"BANK_ACCOUNT_NUMBER","BeginOffset":406,"EndOffset":411,"Score":0.693283}],"File":"doc.txt","Line":0}
{"Entities":[{"Type":"SSN","BeginOffset":1114,"EndOffset":1124,"Score":0.999999},{"Type":"EMAIL","BeginOffset":3742,"EndOffset":3775,"Score":0.999993},{"Type":"PIN","BeginOffset":4098,"EndOffset":4102,"Score":0.999995}],"File":"doc.txt","Line":1}
```

Im Folgenden finden Sie ein Beispiel für die Ausgabe einer Analyse, bei der das Eingabeformat ein Dokument pro Datei ist.

```
{"Entities":[{"Type":"NAME","BeginOffset":40,"EndOffset":69,"Score":0.999995},{"Type":"ADDRESS","BeginOffset":247,"EndOffset":253,"Score":0.998828},{"Type":"BANK_ROUTING","BeginOffset":279,"EndOffset":289,"Score":0.999999}],"File":"doc.txt"}
```

### Ergebnisse zur Stimmungserkennung abrufen
<a name="async-sentiment"></a>

Im Folgenden finden Sie ein Beispiel für eine Ausgabedatei aus einer Analyse, bei der die in einem Dokument zum Ausdruck gebrachte Stimmung ermittelt wurde. Es enthält eine Fehlermeldung, weil ein Dokument zu lang ist. Das Format der Eingabe ist ein Dokument pro Zeile. Weitere Informationen finden Sie unter dem Vorgang [DetectSentiment](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectSentiment.html).

```
{"File": "50_docs", "Line": 0, "Sentiment": "NEUTRAL", "SentimentScore": {"Mixed": 0.002734508365392685, "Negative": 0.008935936726629734, "Neutral": 0.9841893315315247, "Positive": 0.004140198230743408}}
{"File": "50_docs", "Line": 1, "ErrorCode": "DOCUMENT_SIZE_EXCEEDED", "ErrorMessage": "Document size is exceeded maximum size limit 5120 bytes."}
{"File": "50_docs", "Line": 2, "Sentiment": "NEUTRAL", "SentimentScore": {"Mixed": 0.0023119584657251835, "Negative": 0.0029857370536774397, "Neutral": 0.9866572022438049, "Positive": 0.008045154623687267}}
```

Das Folgende ist ein Beispiel für die Ausgabe einer Analyse, bei der das Eingabeformat ein Dokument pro Datei ist.

```
{"File": "small_doc", "Sentiment": "NEUTRAL", "SentimentScore": {"Mixed": 0.0023450672160834074, "Negative": 0.0009663937962614, "Neutral": 0.9795311689376831, "Positive": 0.017157377675175667}}
{"File": "huge_doc", "ErrorCode": "DOCUMENT_SIZE_EXCEEDED", "ErrorMessage": "Document size is exceeds the limit of 5120 bytes."}
```