Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Um einem Schwungrad beschriftete Trainings- oder Testdaten hinzuzufügen, verwenden Sie die Amazon Comprehend Comprehend-Konsole oder API, um einen Datensatz zu erstellen.
Sie konfigurieren jeden Datensatz als Trainingsdaten oder Testdaten. Sie verknüpfen den Datensatz mit einem bestimmten Schwungrad und einem benutzerdefinierten Modell. Wenn Sie einen Datensatz erstellen, lädt Amazon Comprehend die Daten in den Data Lake des Flywheel hoch. Einzelheiten zu den Dateiformaten für die Trainingsdaten finden Sie unter oder. Vorbereitung der Trainingsdaten für Klassifikatoren Trainingsdaten für Entity Recognizer vorbereiten
Wenn Sie das Flywheel löschen, löscht Amazon Comprehend die Datensätze. Die hochgeladenen Daten bleiben im Data Lake verfügbar.
Einen Datensatz erstellen (Konsole)
Erstellen eines Datensatzes
-
Melden Sie sich bei der Amazon Comprehend Comprehend-Konsole
an AWS Management Console und öffnen Sie sie. -
Wählen Sie im linken Menü Flywheels und dann das Schwungrad aus, zu dem Sie die Daten hinzufügen möchten.
-
Wählen Sie die Registerkarte Datensätze.
-
Wählen Sie in der Tabelle Trainingsdatensätze oder Testdatensätze die Option Datensatz erstellen aus.
-
Geben Sie unter Datensatzdetails einen Namen für den Datensatz und optional eine Beschreibung ein.
-
Wählen Sie unter Datenspezifikationen die Konfigurationsfelder Datenformat und Datensatztyp aus.
-
(Optional) Wählen Sie unter Eingabeformat das Format der Eingabedokumente aus.
-
Geben Sie unter Speicherort für Anmerkungen auf S3 den Amazon S3 S3-Speicherort der Annotationsdatei ein.
-
Geben Sie unter Speicherort der Trainingsdaten auf S3 den Amazon S3 S3-Speicherort der Dokumentdateien ein.
-
Wählen Sie Create (Erstellen) aus.
Einen Datensatz (API) erstellen
Sie können den CreateDatasetVorgang verwenden, um einen Datensatz zu erstellen.
aws comprehend create-dataset \ --flywheel-arn "myFlywheel2" \ --dataset-name "my-training-dataset" --dataset-type "TRAIN" --description "my training dataset" --cli-input-json file://inputConfig.json }
Die Datei inputConfig.json
enthält den folgenden Inhalt.
{
"DataFormat": "COMPREHEND_CSV",
"DocumentClassifierInputDataConfig": {
"S3Uri": "s3://my-comprehend-datasets/multilabel_train.csv"
}
}
Um dem Datensatz Tags hinzuzufügen oder zu entfernen, verwenden Sie die UntagResourceOperationen TagResourceund.
Beschreiben Sie einen Datensatz
Verwenden Sie den Amazon Comprehend DescribeDatasetComprehend-Vorgang, um konfigurierte Informationen über ein Schwungrad abzurufen.
aws comprehend describe-dataset \ --dataset-arn "datasetARN"
Die Antwort enthält den folgenden Inhalt.
{ "DatasetProperties": { "DatasetArn": "arn:aws::comprehend:
aws-region
:111122223333:flywheel/myTestFlywheel/dataset/train-dataset", "DatasetName": "train-dataset", "DatasetType": "TRAIN", "DatasetS3Uri": "s3://my-test-datalake/flywheelbasictest/myTestFlywheel/schemaVersion=1/20220801T014326Z/datasets/train-dataset/20220801T194844Z", "Description": "Good Dataset", "Status": "COMPLETED", "NumberOfDocuments": 90, "CreationTime": 1659383324.297 } }