Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen von Trainings- und Testdatensätzen mit Bildern
Sie können mit einem Projekt beginnen, das einen einzelnen Datensatz enthält, oder mit einem Projekt, das separate Trainings- und Testdatensätze enthält. Wenn Sie mit einem einzelnen Datensatz beginnen, teilt Amazon Rekognition Custom Labels Ihren Datensatz während des Trainings auf, um einen Trainingsdatensatz (80 %) und einen Testdatensatz (20 %) für Ihr Projekt zu erstellen. Beginnen Sie mit einem einzigen Datensatz, wenn Amazon Rekognition Custom Labels entscheiden soll, wo Bilder zum Trainieren und Testen verwendet werden. Um die vollständige Kontrolle über Trainings, Tests und Leistungsoptimierungen zu haben, empfehlen wir, dass Sie Ihr Projekt mit separaten Trainings- und Testdatensätzen beginnen.
Sie können Trainings- und Testdatensätze für ein Projekt erstellen, indem Sie Bilder von einem der folgenden Speicherorte importieren:
Wenn Sie Ihr Projekt mit separaten Trainings- und Testdatensätzen beginnen, können Sie für jeden Datensatz unterschiedliche Quellverzeichnisse verwenden.
Je nachdem, von wo Sie Ihre Bilder importieren, haben Ihre Bilder möglicherweise keine Labels. Beispielsweise haben Bilder, die von einem lokalen Computer importiert wurden, keine Label. Bilder, die aus einer Amazon SageMaker Ground Truth Manifest-Datei importiert wurden, sind beschriftet. Sie können die Amazon Rekognition Custom Labels-Konsole verwenden, um Labels hinzuzufügen, zu ändern und zuzuweisen. Weitere Informationen finden Sie unter Labeling von Bildern.
Wenn Bilder fehlerhaft hochgeladen werden, Bilder fehlen oder Labels in Bildern fehlen, lesen Sie Debuggen eines fehlgeschlagenen Modelltrainings.
Weitere Informationen zu Datensätzen finden Sie unter Verwalten von Datensätzen.
Erstellen Sie Trainings- und Testdatensätze () SDK
Sie können den verwenden AWS SDK, um Trainings- und Testdatensätze zu erstellen.
Mit CreateDataset
diesem Vorgang können Sie optional Tags angeben, wenn Sie einen neuen Datensatz erstellen, um Ihre Ressourcen zu kategorisieren und zu verwalten.
Trainingsdatensatz
Sie können den verwenden AWS SDK, um einen Trainingsdatensatz auf folgende Weise zu erstellen.
-
Verwenden Sie es CreateDatasetmit einer von Ihnen bereitgestellten Manifestdatei im Amazon Sagemaker-Format. Weitere Informationen finden Sie unter Erstellen einer Manifestdatei. Beispielcode finden Sie unter Erstellen eines Datensatzes mit einer SageMaker Ground Truth Truth-Manifestdatei (SDK).
-
Verwenden Sie
CreateDataset
, um einen bestehenden Amazon Rekognition Custom Labels-Datensatz zu kopieren. Beispielcode finden Sie unter Erstellen eines Datensatzes unter Verwendung eines vorhandenen Datensatzes (SDK). -
Erstellen Sie einen leeren Datensatz mit
CreateDataset
und fügen Sie zu einem späteren Zeitpunkt Datensatzeinträge mit hinzu. UpdateDatasetEntries Informationen zum Erstellen eines leeren Datensatzes finden Sie unter Hinzufügen eines Datensatzes zu einem Projekt. Informationen zum Hinzufügen von Bildern zu einem Datensatz finden Sie unter Weitere Bilder hinzufügen (SDK). Sie müssen die Datensatzeinträge hinzufügen, bevor Sie ein Modell trainieren können.
Testdatensatz
Sie können den verwenden AWS SDK, um einen Testdatensatz auf folgende Weise zu erstellen:
-
Verwenden Sie es CreateDatasetmit einer von Ihnen bereitgestellten Manifestdatei im Amazon Sagemaker-Format. Weitere Informationen finden Sie unter Erstellen einer Manifestdatei. Beispielcode finden Sie unter Erstellen eines Datensatzes mit einer SageMaker Ground Truth Truth-Manifestdatei (SDK).
-
Verwenden Sie
CreateDataset
, um einen bestehenden Amazon Rekognition Custom Labels-Datensatz zu kopieren. Beispielcode finden Sie unter Erstellen eines Datensatzes unter Verwendung eines vorhandenen Datensatzes (SDK). -
Erstellen Sie einen leeren Datensatz mit
CreateDataset
und fügen Sie zu einem späteren Zeitpunkt Datensatzeinträge mitUpdateDatasetEntries
hinzu. Informationen zum Erstellen eines leeren Datensatzes finden Sie unter Hinzufügen eines Datensatzes zu einem Projekt. Informationen zum Hinzufügen von Bildern zu einem Datensatz finden Sie unter Weitere Bilder hinzufügen (SDK). Sie müssen die Datensatzeinträge hinzufügen, bevor Sie ein Modell trainieren können. -
Teilen Sie den Trainingsdatensatz in separate Trainings- und Testdatensätze auf. Erstellen Sie zunächst einen leeren Testdatensatz mit
CreateDataset
. Verschieben Sie dann 20% der Trainingsdatensatzeinträge in den Testdatensatz, indem Sie aufrufen. DistributeDatasetEntries Informationen zum Erstellen eines leeren Datensatzes finden Sie unter Hinzufügen eines Datensatzes zu einem Projekt (SDK). Informationen zum Aufteilen des Trainingsdatensatzes finden Sie unter Verteilen eines Trainingsdatensatzes (SDK).