Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Sie können einen asynchronen Analysejob ausführen, um benutzerdefinierte Entitäten in einer Gruppe von einem oder mehreren Dokumenten zu erkennen.
Bevor Sie beginnen
Sie benötigen ein benutzerdefiniertes Entitätserkennungsmodell (auch als Recognizer bezeichnet), bevor Sie benutzerdefinierte Entitäten erkennen können. Weitere Informationen zu diesen Modellen finden Sie unterTraining von benutzerdefinierten Entitätserkennungsmodellen.
Ein Erkennungsprogramm, das mit Klartext-Anmerkungen trainiert wurde, unterstützt die Entitätserkennung nur für Klartext-Dokumente. Ein Erkennungsprogramm, das mit Anmerkungen zu PDF-Dokumenten trainiert wurde, unterstützt die Objekterkennung für Klartextdokumente, Bilder, PDF-Dateien und Word-Dokumente. Für Dateien, bei denen es sich nicht um Textdateien handelt, führt Amazon Comprehend die Textextraktion durch, bevor die Analyse ausgeführt wird. Informationen zu den Eingabedateien finden Sie unter. Eingaben für asynchrone benutzerdefinierte Analysen
Wenn Sie Bilddateien oder gescannte PDF-Dokumente analysieren möchten, muss Ihre IAM-Richtlinie die Erlaubnis zur Verwendung von zwei Amazon Textract Textract-API-Methoden (DetectDocumentText und AnalyzeDocument) gewähren. Amazon Comprehend ruft diese Methoden während der Textextraktion auf. Eine Beispielrichtlinie finden Sie unter Für die Durchführung von Dokumentenanalyseaktionen erforderliche Berechtigungen.
Um einen asynchronen Analyseauftrag auszuführen, führen Sie die folgenden allgemeinen Schritte aus:
-
Speichern Sie die Dokumente in einem Amazon S3 S3-Bucket.
-
Verwenden Sie die API oder Konsole, um den Analysejob zu starten.
-
Überwachen Sie den Fortschritt des Analysejobs.
-
Nachdem der Job vollständig ausgeführt wurde, rufen Sie die Ergebnisse der Analyse aus dem S3-Bucket ab, den Sie beim Start des Jobs angegeben haben.