

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Einen benutzerdefinierten Entitätserkennungsjob (API) starten
<a name="detecting-cer-async-api"></a>

Sie können die API verwenden, um einen asynchronen Analysejob für die benutzerdefinierte Entitätserkennung zu starten und zu überwachen.

Um einen benutzerdefinierten Entitätserkennungsjob mit dem [StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html)Vorgang zu starten, geben Sie den EntityRecognizerArn, der Amazon-Ressourcenname (ARN) des trainierten Modells ist, an. Sie finden diesen ARN in der Antwort auf die [CreateEntityRecognizer](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_CreateEntityRecognizer.html)Operation. 

**Topics**
+ [Erkennung benutzerdefinierter Entitäten mit dem AWS Command Line Interface](#detecting-cer-async-api-cli)
+ [Erkennung benutzerdefinierter Entitäten mithilfe der AWS SDK für Java](#detecting-cer-async-api-java)
+ [Erkennung benutzerdefinierter Entitäten mit dem AWS SDK für Python (Boto3)](#detecting-cer-async-api-python)
+ [API-Aktionen für PDF-Dateien überschreiben](#detecting-cer-api-pdf)

## Erkennung benutzerdefinierter Entitäten mit dem AWS Command Line Interface
<a name="detecting-cer-async-api-cli"></a>

Verwenden Sie das folgende Beispiel für Unix-, Linux- und MacOS-Umgebungen. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\$1), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^). Verwenden Sie die folgende Anforderungssyntax, um benutzerdefinierte Entitäten in einer Dokumentenmappe zu erkennen:

```
aws comprehend start-entities-detection-job \
     --entity-recognizer-arn "arn:aws:comprehend:region:account number:entity-recognizer/test-6" \
     --job-name infer-1 \
     --data-access-role-arn "arn:aws:iam::account number:role/service-role/AmazonComprehendServiceRole-role" \
     --language-code en \
     --input-data-config "S3Uri=s3://Bucket Name/Bucket Path" \
     --output-data-config "S3Uri=s3://Bucket Name/Bucket Path/" \
     --region region
```

Amazon Comprehend antwortet mit `JobID` und `JobStatus` und gibt die Ausgabe des Jobs im S3-Bucket zurück, den Sie in der Anfrage angegeben haben.

## Erkennung benutzerdefinierter Entitäten mithilfe der AWS SDK für Java
<a name="detecting-cer-async-api-java"></a>

Beispiele für Amazon Comprehend, die Java verwenden, finden Sie unter [Amazon Comprehend](https://github.com/awsdocs/aws-doc-sdk-examples/tree/main/javav2/example_code/comprehend) Java-Beispiele.

## Erkennung benutzerdefinierter Entitäten mit dem AWS SDK für Python (Boto3)
<a name="detecting-cer-async-api-python"></a>

In diesem Beispiel wird ein benutzerdefinierter Entitätserkenner erstellt, das Modell trainiert und es dann in einem Entitätserkennungsauftrag mit dem ausgeführt. AWS SDK für Python (Boto3)

Instanziieren Sie das SDK für Python. 

```
import boto3
import uuid
comprehend = boto3.client("comprehend", region_name="region")
```

Erstellen Sie einen Entitätserkenner: 

```
response = comprehend.create_entity_recognizer(
    RecognizerName="Recognizer-Name-Goes-Here-{}".format(str(uuid.uuid4())),
    LanguageCode="en",
    DataAccessRoleArn="Role ARN",
    InputDataConfig={
        "EntityTypes": [
            {
                "Type": "ENTITY_TYPE"
            }
        ],
        "Documents": {
            "S3Uri": "s3://Bucket Name/Bucket Path/documents"
        },
        "Annotations": {
            "S3Uri": "s3://Bucket Name/Bucket Path/annotations"
        }
    }
)
recognizer_arn = response["EntityRecognizerArn"]
```

Alle Erkennungsprogramme auflisten: 

```
response = comprehend.list_entity_recognizers()
```

Warten Sie, bis der Entity Recognizer den Status TRAINIERT erreicht hat: 

```
while True:
    response = comprehend.describe_entity_recognizer(
        EntityRecognizerArn=recognizer_arn
    )

    status = response["EntityRecognizerProperties"]["Status"]
    if "IN_ERROR" == status:
        sys.exit(1)
    if "TRAINED" == status:
        break

    time.sleep(10)
```

Starten Sie einen Job zur Erkennung benutzerdefinierter Entitäten: 

```
response = comprehend.start_entities_detection_job(
    EntityRecognizerArn=recognizer_arn,
    JobName="Detection-Job-Name-{}".format(str(uuid.uuid4())),
    LanguageCode="en",
    DataAccessRoleArn="Role ARN",
    InputDataConfig={
        "InputFormat": "ONE_DOC_PER_LINE",
        "S3Uri": "s3://Bucket Name/Bucket Path/documents"
    },
    OutputDataConfig={
        "S3Uri": "s3://Bucket Name/Bucket Path/output"
    }
)
```

## API-Aktionen für PDF-Dateien überschreiben
<a name="detecting-cer-api-pdf"></a>

Für Bilddateien und PDF-Dateien können Sie die standardmäßigen Extraktionsaktionen mithilfe des `DocumentReaderConfig` Parameters in `InputDataConfig` überschreiben.

Das folgende Beispiel definiert eine JSON-Datei mit dem Namen myInputData config.JSON, um die `InputDataConfig` Werte festzulegen. Es legt fest`DocumentReadConfig`, dass die Amazon Textract `DetectDocumentText` Textract-API für alle PDF-Dateien verwendet wird.

**Example**  

```
"InputDataConfig": {
  "S3Uri": s3://Bucket Name/Bucket Path",
  "InputFormat": "ONE_DOC_PER_FILE",
  "DocumentReaderConfig": {
      "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT",
      "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION"
  }
}
```

Geben Sie im `StartEntitiesDetectionJob` Vorgang die Datei myInputData config.json als Parameter an: `InputDataConfig`

```
  --input-data-config file://myInputDataConfig.json  
```

Weitere Informationen zu den `DocumentReaderConfig` Parametern finden Sie unter. [Optionen für die Textextraktion festlegen](idp-set-textract-options.md)