Trainieren von benutzerdefinierten Entity Recognizer-Modellen - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Trainieren von benutzerdefinierten Entity Recognizer-Modellen

Ein benutzerdefinierter Entity Recognizer identifiziert nur die Entitätstypen, die Sie beim Trainieren des Modells einbeziehen. Es enthält nicht automatisch die voreingestellten Entitätstypen. Wenn Sie auch die voreingestellten Entitätstypen wie LOCATION, DATE oder Bol identifizieren möchten, müssen Sie zusätzliche Trainingsdaten für diese Entitäten bereitstellen.

Wenn Sie einen benutzerdefinierten Entity Recognizer mithilfe von kommentierten PDF-Dateien erstellen, können Sie den Recognizer mit einer Vielzahl von Eingabedateiformaten verwenden: Klartext, Bilddateien (JPG, PNG, TIFF), PDF-Dateien und Word-Dokumente, ohne dass eine Vorverarbeitung oder eine Dokumentabflachung erforderlich ist. Amazon Comprehend unterstützt keine Anmerkung von Bilddateien oder Word-Dokumenten.

Anmerkung

Ein benutzerdefinierter Entity Recognizer, der kommentierte PDF-Dateien verwendet, unterstützt nur englische Dokumente.

Nachdem Sie einen benutzerdefinierten Entity Recognizer erstellt haben, können Sie den Fortschritt der Anforderung mithilfe der -DescribeEntityRecognizerOperation überwachen. Sobald das Status Feld istTRAINED, ist das Erkennungsmodell bereit für die Erkennung benutzerdefinierter Entitäten.