Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

Konfiguration von Datensätzen

Fokusmodus
Konfiguration von Datensätzen - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Um einem Schwungrad beschriftete Trainings- oder Testdaten hinzuzufügen, verwenden Sie die Amazon Comprehend Comprehend-Konsole oder API, um einen Datensatz zu erstellen.

Sie konfigurieren jeden Datensatz als Trainingsdaten oder Testdaten. Sie verknüpfen den Datensatz mit einem bestimmten Schwungrad und einem benutzerdefinierten Modell. Wenn Sie einen Datensatz erstellen, lädt Amazon Comprehend die Daten in den Data Lake des Flywheel hoch. Einzelheiten zu den Dateiformaten für die Trainingsdaten finden Sie unter oder. Vorbereitung der Trainingsdaten für Klassifikatoren Trainingsdaten für Entity Recognizer vorbereiten

Wenn Sie das Flywheel löschen, löscht Amazon Comprehend die Datensätze. Die hochgeladenen Daten bleiben im Data Lake verfügbar.

Einen Datensatz erstellen (Konsole)

Erstellen eines Datensatzes
  1. Melden Sie sich bei der Amazon Comprehend Comprehend-Konsole an AWS Management Console und öffnen Sie sie.

  2. Wählen Sie im linken Menü Flywheels und dann das Schwungrad aus, zu dem Sie die Daten hinzufügen möchten.

  3. Wählen Sie die Registerkarte Datensätze.

  4. Wählen Sie in der Tabelle Trainingsdatensätze oder Testdatensätze die Option Datensatz erstellen aus.

  5. Geben Sie unter Datensatzdetails einen Namen für den Datensatz und optional eine Beschreibung ein.

  6. Wählen Sie unter Datenspezifikationen die Konfigurationsfelder Datenformat und Datensatztyp aus.

  7. (Optional) Wählen Sie unter Eingabeformat das Format der Eingabedokumente aus.

  8. Geben Sie unter Speicherort für Anmerkungen auf S3 den Amazon S3 S3-Speicherort der Annotationsdatei ein.

  9. Geben Sie unter Speicherort der Trainingsdaten auf S3 den Amazon S3 S3-Speicherort der Dokumentdateien ein.

  10. Wählen Sie Create (Erstellen) aus.

Einen Datensatz (API) erstellen

Sie können den CreateDatasetVorgang verwenden, um einen Datensatz zu erstellen.

aws comprehend create-dataset \ --flywheel-arn "myFlywheel2" \ --dataset-name "my-training-dataset" --dataset-type "TRAIN" --description "my training dataset" --cli-input-json file://inputConfig.json }

Die Datei inputConfig.json enthält den folgenden Inhalt.

{ "DataFormat": "COMPREHEND_CSV", "DocumentClassifierInputDataConfig": { "S3Uri": "s3://my-comprehend-datasets/multilabel_train.csv" } }

Um dem Datensatz Tags hinzuzufügen oder zu entfernen, verwenden Sie die UntagResourceOperationen TagResourceund.

Beschreiben Sie einen Datensatz

Verwenden Sie den Amazon Comprehend DescribeDatasetComprehend-Vorgang, um konfigurierte Informationen über ein Schwungrad abzurufen.

aws comprehend describe-dataset \ --dataset-arn "datasetARN"

Die Antwort enthält den folgenden Inhalt.

{ "DatasetProperties": { "DatasetArn": "arn:aws::comprehend:aws-region:111122223333:flywheel/myTestFlywheel/dataset/train-dataset", "DatasetName": "train-dataset", "DatasetType": "TRAIN", "DatasetS3Uri": "s3://my-test-datalake/flywheelbasictest/myTestFlywheel/schemaVersion=1/20220801T014326Z/datasets/train-dataset/20220801T194844Z", "Description": "Good Dataset", "Status": "COMPLETED", "NumberOfDocuments": 90, "CreationTime": 1659383324.297 } }
DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.