Creazione di un set di dati con un file manifest () SDK

L'CreateDatasetoperazione viene utilizzata per creare i set di dati associati a un progetto Amazon Lookout for Vision.

Se desideri utilizzare un singolo set di dati per addestramento e test, crea un unico set di dati con il DatasetType valore impostato su. train Durante l'addestramento, il set di dati viene suddiviso internamente per creare un set di dati di addestramento e test. Non hai accesso ai set di dati di addestramento e test divisi. Se desideri un set di dati di test separato, effettua una seconda chiamata a CreateDataset con il set di DatasetType valori. test Durante l'addestramento, i set di dati di addestramento e test vengono utilizzati per addestrare e testare il modello.

Facoltativamente, puoi utilizzare il DatasetSource parametro per specificare la posizione di un file manifest in formato SageMaker Ground Truth utilizzato per popolare il set di dati. In questo caso, la chiamata a è asincrona. CreateDataset Per verificare lo stato corrente, invoca DescribeDataset. Per ulteriori informazioni, consulta Visualizzazione dei set di dati. Se si verifica un errore di convalida durante l'importazione, il valore di Status è impostato su CREATE _ FAILED e viene impostato il messaggio di stato ()StatusMessage.

Suggerimento

Se state creando un set di dati con il set di dati di esempio per iniziare, utilizzate il file manifest (getting-started/dataset-files/manifests/train.manifest) in cui viene creato lo script. Fase 1: crea il file del manifesto e carica delle immagini

Se state creando un set di dati con le immagini di esempio del circuito stampato, avete due opzioni:

Crea il file manifest usando il codice. Il notebook Python di Amazon Lookout for Vision Lab mostra come creare il file manifest per le immagini di esempio del circuito stampato. In alternativa, usa il codice di esempio Datasets nel Code Examples Repository. AWS
Se hai già utilizzato la console Amazon Lookout for Vision per creare un set di dati con le immagini di esempio del circuito stampato, riutilizza i file manifest creati per te da Amazon Lookout for Vision. Le posizioni dei file manifest di formazione e test sono. s3://bucket/datasets/project name/train or test/manifests/output/output.manifest

Se non si specificaDatasetSource, viene creato un set di dati vuoto. In questo caso, la chiamata a CreateDataset è sincrona. Successivamente, è possibile etichettare le immagini nel set di dati chiamando. UpdateDatasetEntries Per il codice di esempio, consulta Aggiungere altre immagini (SDK).

Se desideri sostituire un set di dati, elimina prima il set di dati esistente con DeleteDatasete poi crea un nuovo set di dati dello stesso tipo chiamando. CreateDataset Per ulteriori informazioni, consulta Eliminazione di un set di dati.

Dopo aver creato i set di dati, puoi creare il modello. Per ulteriori informazioni, consulta Addestramento di un modello (SDK).

È possibile visualizzare le immagini etichettate (JSONlinee) all'interno di un set di dati chiamando. ListDatasetEntries Puoi aggiungere immagini etichettate chiamando. UpdateDatasetEntries

Per visualizzare informazioni sui set di dati di test e addestramento, vedere. Visualizzazione dei set di dati

Per creare un set di dati () SDK

Se non l'hai già fatto, installa e configura il AWS CLI e il AWS SDKs. Per ulteriori informazioni, consulta Fase 4: Configurare e AWS CLIAWS SDKs.

Usa il seguente codice di esempio per creare un set di dati.

CLI

Imposta i valori seguenti:

project-nameal nome del progetto a cui vuoi associare il set di dati.
dataset-typeal tipo di set di dati che vuoi creare (trainotest).
dataset-sourcealla posizione Amazon S3 del file manifest.
Bucketal nome del bucket Amazon S3 che contiene il file manifest.
Keyal percorso e al nome del file manifest nel bucket Amazon S3.


aws lookoutvision create-dataset --project-name project\
  --dataset-type train or test\
  --dataset-source '{ "GroundTruthManifest": { "S3Object": { "Bucket": "bucket", "Key": "manifest file" } } }' \
  --profile lookoutvision-access

Python

Questo codice è tratto dal repository AWS Documentation SDK examples GitHub . Guarda l'esempio completo qui.


    @staticmethod
    def create_dataset(lookoutvision_client, project_name, manifest_file, dataset_type):
        """
        Creates a new Lookout for Vision dataset

        :param lookoutvision_client: A Lookout for Vision Boto3 client.
        :param project_name: The name of the project in which you want to
                             create a dataset.
        :param bucket: The bucket that contains the manifest file.
        :param manifest_file: The path and name of the manifest file.
        :param dataset_type: The type of the dataset (train or test).
        """
        try:
            bucket, key = manifest_file.replace("s3://", "").split("/", 1)
            logger.info("Creating %s dataset type...", dataset_type)
            dataset = {
                "GroundTruthManifest": {"S3Object": {"Bucket": bucket, "Key": key}}
            }
            response = lookoutvision_client.create_dataset(
                ProjectName=project_name,
                DatasetType=dataset_type,
                DatasetSource=dataset,
            )
            logger.info("Dataset Status: %s", response["DatasetMetadata"]["Status"])
            logger.info(
                "Dataset Status Message: %s",
                response["DatasetMetadata"]["StatusMessage"],
            )
            logger.info("Dataset Type: %s", response["DatasetMetadata"]["DatasetType"])

            # Wait until either created or failed.
            finished = False
            status = ""
            dataset_description = {}
            while finished is False:
                dataset_description = lookoutvision_client.describe_dataset(
                    ProjectName=project_name, DatasetType=dataset_type
                )
                status = dataset_description["DatasetDescription"]["Status"]

                if status == "CREATE_IN_PROGRESS":
                    logger.info("Dataset creation in progress...")
                    time.sleep(2)
                elif status == "CREATE_COMPLETE":
                    logger.info("Dataset created.")
                    finished = True
                else:
                    logger.info(
                        "Dataset creation failed: %s",
                        dataset_description["DatasetDescription"]["StatusMessage"],
                    )
                    finished = True

            if status != "CREATE_COMPLETE":
                message = dataset_description["DatasetDescription"]["StatusMessage"]
                logger.exception("Couldn't create dataset: %s", message)
                raise Exception(f"Couldn't create dataset: {message}")

        except ClientError:
            logger.exception("Service error: Couldn't create dataset.")
            raise

Java V2

Questo codice è tratto dal GitHub repository AWS Documentation SDK examples. Guarda l'esempio completo qui.


/**
 * Creates an Amazon Lookout for Vision dataset from a manifest file.
 * Returns after Lookout for Vision creates the dataset.
 * 
 * @param lfvClient    An Amazon Lookout for Vision client.
 * @param projectName  The name of the project in which you want to create a
 *                     dataset.
 * @param datasetType  The type of dataset that you want to create (train or
 *                     test).
 * @param bucket       The S3 bucket that contains the manifest file.
 * @param manifestFile The name and location of the manifest file within the S3
 *                     bucket.
 * @return DatasetDescription The description of the created dataset.
 */
public static DatasetDescription createDataset(LookoutVisionClient lfvClient,
                String projectName,
                String datasetType,
                String bucket,
                String manifestFile)
                throws LookoutVisionException, InterruptedException {

        logger.log(Level.INFO, "Creating {0} dataset for project {1}",
                        new Object[] { projectName, datasetType });

        // Build the request. If no bucket supplied, setup for empty dataset creation.
        CreateDatasetRequest createDatasetRequest = null;

        if (bucket != null && manifestFile != null) {

                InputS3Object s3Object = InputS3Object.builder()
                                .bucket(bucket)
                                .key(manifestFile)
                                .build();

                DatasetGroundTruthManifest groundTruthManifest = DatasetGroundTruthManifest.builder()
                                .s3Object(s3Object)
                                .build();

                DatasetSource datasetSource = DatasetSource.builder()
                                .groundTruthManifest(groundTruthManifest)
                                .build();

                createDatasetRequest = CreateDatasetRequest.builder()
                                .projectName(projectName)
                                .datasetType(datasetType)
                                .datasetSource(datasetSource)
                                .build();
        } else {
                createDatasetRequest = CreateDatasetRequest.builder()
                                .projectName(projectName)
                                .datasetType(datasetType)
                                .build();
        }

        lfvClient.createDataset(createDatasetRequest);

        DatasetDescription datasetDescription = null;

        boolean finished = false;

        // Wait until dataset is created, or failure occurs.
        while (!finished) {

                datasetDescription = describeDataset(lfvClient, projectName, datasetType);

                switch (datasetDescription.status()) {
                        case CREATE_COMPLETE:
                                logger.log(Level.INFO, "{0}dataset created for project {1}",
                                                new Object[] { datasetType, projectName });
                                finished = true;
                                break;
                        case CREATE_IN_PROGRESS:
                                logger.log(Level.INFO, "{0} dataset creating for project {1}",
                                                new Object[] { datasetType, projectName });

                                TimeUnit.SECONDS.sleep(5);

                                break;

                        case CREATE_FAILED:
                                logger.log(Level.SEVERE,
                                                "{0} dataset creation failed for project {1}. Error {2}",
                                                new Object[] { datasetType, projectName,
                                                                datasetDescription.statusAsString() });
                                finished = true;
                                break;
                        default:
                                logger.log(Level.SEVERE, "{0} error when creating {1} dataset for project {2}",
                                                new Object[] { datasetType, projectName,
                                                                datasetDescription.statusAsString() });
                                finished = true;
                                break;

                }
        }

        logger.log(Level.INFO, "Dataset info. Status: {0}\n Message: {1} }",
                        new Object[] { datasetDescription.statusAsString(),
                                        datasetDescription.statusMessage() });

        return datasetDescription;

}

Addestra il tuo modello seguendo i passaggi riportati inAddestramento di un modello (SDK).

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Creazione di un set di dati con un file manifest (console)

Immagini etichettate