Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Amazon Comprehend unterstützt die Dokumentenverarbeitung in einem Schritt zur benutzerdefinierten Klassifizierung und Erkennung benutzerdefinierter Entitäten. Sie können beispielsweise eine Mischung aus Nur-Text-Dokumenten und halbstrukturierten Dokumenten (wie PDF-Dokumenten, Microsoft Word-Dokumenten und Bildern) in einen benutzerdefinierten Analysejob eingeben.
Für Eingabedateien, die eine Textextraktion erfordern, führt Amazon Comprehend automatisch die Textextraktion durch, bevor die Analyse ausgeführt wird. Um den Textinhalt zu extrahieren, verwendet Amazon Comprehend einen internen Parser für native halbstrukturierte Dokumente und Amazon Textract APIs für Bilder und gescannte Dokumente.
Die Amazon Comprehend-Dokumentenverarbeitung ist in allen Amazon Comprehend verfügbarUnterstützte Regionen, außer dass Asien-Pazifik (Tokio) und AWS GovCloud (USA West) nur Klartextmodelle für die benutzerdefinierte Klassifizierung unterstützen.
Die folgenden Themen enthalten Details zu den Eingabedokumenttypen, die Amazon Comprehend für benutzerdefinierte Analysen unterstützt.