Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Parsing bezieht sich auf das Verständnis und die Extraktion von Inhalten aus Rohdaten. Amazon Bedrock Knowledge Bases bietet die folgenden Optionen zum Analysieren Ihrer Datenquelle während der Aufnahme:
-
Amazon Bedrock Standard-Parser — Analysiert nur Text in Textdateien, einschließlich .txt-, .md-, .html-, .doc/.docx-, .xls/.xlsx- und .pdf-Dateien. Für diesen Parser fallen keine Nutzungsgebühren an.
Anmerkung
Da der Standardparser nur Text ausgibt, empfehlen wir, Amazon Bedrock Data Automation oder ein Foundation-Modell als Parser anstelle des Standardparsers zu verwenden, wenn Ihre Dokumente Abbildungen, Diagramme, Tabellen oder Bilder enthalten. Amazon Bedrock Data Automation und Foundation Models können diese Elemente aus Ihren Dokumenten extrahieren und als Ausgabe zurückgeben.
-
Amazon Bedrock Knowledge Bases bietet die folgenden Parser zum Analysieren multimodaler Daten, einschließlich Abbildungen, Diagramme und Tabellen in PDF-Dateien, zusätzlich zu JPEG- und PNG-Bilddateien. Diese Parser können diese Zahlen, Diagramme, Tabellen und Bilder auch extrahieren und als Dateien in einem S3-Ziel speichern, das Sie bei der Erstellung der Wissensdatenbank angeben. Beim Abrufen der Wissensdatenbank können diese Dateien in der Antwort oder in der Quellenangabe zurückgegeben werden.
-
Amazon Bedrock Data Automation — Ein vollständig verwalteter Service, der multimodale Daten effektiv verarbeitet, ohne dass zusätzliche Eingabeaufforderungen erforderlich sind. Die Kosten für diesen Parser hängen von der Anzahl der Seiten im Dokument oder der Anzahl der zu verarbeitenden Bilder ab. Weitere Informationen zu diesem Service finden Sie unter Amazon Bedrock Data Automation.
-
Fundamentmodelle — Verarbeitet multimodale Daten unter Verwendung eines Fundamentmodells. Dieser Parser bietet Ihnen die Möglichkeit, die für die Datenextraktion verwendete Standardaufforderung anzupassen. Die Kosten für diesen Parser hängen von der Anzahl der Eingabe- und Ausgabetokens ab, die vom Foundation-Modell verarbeitet werden. Eine Liste der Modelle, die das Parsen von Amazon Bedrock Knowledge Bases-Daten unterstützen, finden Sie unter. Unterstützte Modelle und Regionen für das Parsen
-
Wichtig
Wenn Sie Amazon Bedrock Data Automation oder Foundation Models als Parser wählen, wird die von Ihnen gewählte Methode verwendet, um alle PDF-Dateien in Ihrer Datenquelle zu analysieren, auch wenn die PDF-Dateien nur Text enthalten. Der Standard-Parser wird nicht verwendet, um diese PDF-Dateien zu analysieren. Für Ihr Konto fallen Gebühren für die Nutzung von Amazon Bedrock Data Automation oder des Foundation-Modells beim Parsen dieser Dateien an.
Beachten Sie bei der Auswahl, wie Ihre Daten analysiert werden sollen, Folgendes:
-
Ob es sich bei Ihren Daten um reine Textdaten handelt oder ob sie multimodale Daten wie Bilder, Grafiken und Diagramme enthalten, die von der Wissensdatenbank abgefragt werden sollen.
-
Gibt an, ob Sie die Option zum Anpassen der Eingabeaufforderung verwenden möchten, mit der das Modell angewiesen wird, wie Ihre Daten analysiert werden sollen.
-
Die Kosten für den Parser. Amazon Bedrock Data Automation verwendet Preise pro Seite, während Foundation-Model-Parser Gebühren auf der Grundlage von Eingabe- und Ausgabetoken berechnen. Weitere Informationen finden Sie unter Amazon Bedrock – Preise
.
Informationen zur Konfiguration der Analyse Ihrer Wissensdatenbank finden Sie in der Verbindungskonfiguration für Ihre Datenquelle unter. Connect eine Datenquelle mit Ihrer Wissensdatenbank