Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Puoi creare un set di dati utilizzando un file manifest in formato Amazon SageMaker AI Ground Truth. Puoi utilizzare il file manifest da un job Amazon SageMaker AI Ground Truth. Se le immagini e le etichette non sono nel formato di un file manifest SageMaker AI Ground Truth, puoi creare un file manifest in formato SageMaker AI e utilizzarlo per importare le immagini etichettate.
L'CreateDataset
operazione viene aggiornata per consentire di specificare facoltativamente i tag durante la creazione di un nuovo set di dati. I tag sono coppie chiave-valore che è possibile utilizzare per classificare e gestire le risorse.
Argomenti
- Creazione di un set di dati con un file manifest SageMaker AI Ground Truth (Console)
- Creazione di un set di dati con un file manifest SageMaker AI Ground Truth () SDK
- Crea una richiesta di set di dati
- Etichettatura delle immagini con un job Amazon SageMaker AI Ground Truth
- Creazione di un file manifesto
- Importazione di etichette a livello di immagine nei file manifest
- Localizzazione di oggetti nei file manifest
- Regole di convalida per i file manifest
- Conversione di altri formati set di dati in un file manifest
Creazione di un set di dati con un file manifest SageMaker AI Ground Truth (Console)
La procedura seguente mostra come creare un set di dati utilizzando un file manifest in formato SageMaker AI Ground Truth.
-
Creare un file manifest per il set di dati di addestramento in uno dei seguenti modi:
-
Crea un file manifest con un SageMaker AI GroundTruth Job seguendo le istruzioni all'indirizzo Etichettatura delle immagini con un job Amazon SageMaker AI Ground Truth.
-
Creare il file manifest seguendo le istruzioni riportate all'indirizzo Creazione di un file manifesto.
Se si desidera creare un set di dati di test, ripetere il passaggio 1 per creare il set di dati di test.
-
Apri la console Amazon Rekognition all'indirizzo. https://console.aws.amazon.com/rekognition/
-
Scegli Usa etichette personalizzate.
-
Scegli Avvia.
-
Nel pannello di navigazione a sinistra, scegli Progetti.
-
Nella pagina Progetti, scegliere il progetto a cui aggiungere un set di dati. Viene visualizzata la pagina dei dettagli del progetto.
-
Scegli Crea set di dati. Viene visualizzata la pagina Creare set di dati.
-
In Configurazione iniziale, scegliere Iniziare con un singolo set di dati o Iniziare con un set di dati di addestramento. Per creare un modello di qualità superiore, consigliamo di iniziare con set di dati di addestramento e test separati.
-
Nella sezione Dettagli del set di dati di addestramento, scegli Importa immagini etichettate da SageMaker Ground Truth.
-
In.manifest file location, inserire la posizione del file manifest che è stata creata al passaggio 1.
-
Scegli Crea set di dati. Si apre la pagina dei set di dati per il progetto.
-
Se si deve aggiungere o modificare etichette, fare Immagini etichettate.
-
Seguire i passaggi indicati in Addestramento di un modello (Console) per addestrare il modello.
Creazione di un set di dati con un file manifest SageMaker AI Ground Truth () SDK
La procedura seguente mostra come creare set di dati di addestramento o test da un file manifest utilizzando il. CreateDatasetAPI
Puoi utilizzare un file manifest esistente, come l'output di un job SageMaker AI Ground Truth, o creare il tuo file manifest.
-
Se non l'hai ancora fatto, installa e configura il AWS CLI AWS SDKs. Per ulteriori informazioni, consulta Passaggio 4: configura AWS CLI e AWS SDKs.
-
Creare un file manifest per il set di dati di addestramento in uno dei seguenti modi:
-
Crea un file manifest con un SageMaker AI GroundTruth Job seguendo le istruzioni all'indirizzo Etichettatura delle immagini con un job Amazon SageMaker AI Ground Truth.
-
Creare il file manifest seguendo le istruzioni riportate all'indirizzo Creazione di un file manifesto.
Se si desidera creare un set di dati di test, ripetere il passaggio 2 per creare il set di dati di test.
-
-
Utilizzare il seguente codice di esempio per creare il set di dati di addestramento e test.
Usa il seguente codice per creare un set di dati. Sostituisci quanto segue:
-
project_arn
— il ARN progetto a cui vuoi aggiungere il set di dati di test. -
type
— il tipo di set di dati che vuoi creare (TRAINo) TEST -
bucket
: il bucket che contiene il file manifest per il set di dati. -
manifest_file
: il nome e il percorso del file manifest.
aws rekognition create-dataset --project-arn
project_arn
\ --dataset-typetype
\ --dataset-source '{ "GroundTruthManifest": { "S3Object": { "Bucket": "bucket
", "Name": "manifest_file
" } } }' \ --profile custom-labels-access --tags '{"key1": "value1", "key2": "value2"}' -
Se è necessario aggiungere o modificare etichette, confrontare Gestione delle etichette (SDK).
-
Seguire i passaggi indicati in Addestramento di un modello (SDK) per addestrare il modello.
Crea una richiesta di set di dati
Di seguito è riportato il formato della richiesta di operazione: CreateDataset
{
"DatasetSource": {
"DatasetArn": "string",
"GroundTruthManifest": {
"S3Object": {
"Bucket": "string",
"Name": "string",
"Version": "string"
}
}
},
"DatasetType": "string",
"ProjectArn": "string",
"Tags": {
"string": "string"
}
}