Creare un job di classificazione delle immagini utilizzando AutoML API - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creare un job di classificazione delle immagini utilizzando AutoML API

Le seguenti istruzioni mostrano come creare un job Amazon SageMaker Autopilot come esperimento pilota per tipi di problemi di classificazione delle immagini utilizzando Reference. SageMaker API

Nota

Attività come la classificazione di testo e immagini, la previsione di serie temporali e la messa a punto di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 di AutoML. REST API Se il linguaggio che preferisci è Python, puoi fare riferimento AWS SDK for Python (Boto3)o direttamente all'MLV2oggetto Auto di Amazon Python SageMaker . SDK

Gli utenti che preferiscono la comodità di un'interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli pre-addestrati e modelli di base di intelligenza artificiale generativa o creare modelli personalizzati su misura per testi specifici, classificazione delle immagini, esigenze di previsione o intelligenza artificiale generativa.

Puoi creare un esperimento di classificazione delle immagini Autopilot a livello di codice richiamando l'CreateAutoMLJobV2APIazione in qualsiasi linguaggio supportato da Amazon Autopilot o da. SageMaker AWS CLI

Per informazioni su come questa API azione si traduce in una funzione nella lingua di tua scelta, consulta la sezione Vedi anche di e scegli un. CreateAutoMLJobV2 SDK Ad esempio, per gli utenti di Python, vedi la sintassi completa della richiesta di create_auto_ml_job_v2 in AWS SDK for Python (Boto3).

Di seguito è riportata una raccolta di parametri di richiesta di input obbligatori e facoltativi per l'CreateAutoMLJobV2APIazione utilizzata nella classificazione delle immagini.

Parametri obbligatori

Quando chiami CreateAutoMLJobV2 per creare un esperimento Autopilot per la classificazione delle immagini, devi fornire i seguenti valori:

Tutti gli altri parametri sono facoltativi.

Parametri facoltativi

Le sezioni seguenti forniscono dettagli su alcuni parametri opzionali che è possibile passare al processo AutoML di classificazione delle immagini.

È possibile fornire il proprio set di dati di convalida e un rapporto di suddivisione dei dati personalizzato oppure lasciare che Autopilot suddivida automaticamente il set di dati.

Ogni AutoMLJobChanneloggetto (vedi il parametro obbligatorio A utoMLJobInputDataConfig) ha un valoreChannelType, che può essere impostato su uno training o più validation valori che specificano come utilizzare i dati durante la creazione di un modello di apprendimento automatico.

È necessario fornire almeno un'origine dati ed è consentito un massimo di due origine dati: una per i dati di addestramento e una per i dati di convalida. Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

Il modo in cui suddividere i dati in set di dati di addestramento e convalida dipende dalla presenza di una o due origine dati.

  • Se disponi di una origine dati, ChannelType è impostato su training come impostazione predefinita e deve avere questo valore.

    • Se il valore ValidationFraction in AutoMLDataSplitConfig non è impostato, per impostazione predefinita viene utilizzato per la convalida lo 0,2 (20%) dei dati di questa origine.

    • Se ValidationFraction è impostato su un valore compreso tra 0 e 1, il set di dati viene suddiviso in base al valore specificato, dove il valore specifica la frazione del set di dati utilizzata per la convalida.

  • Se si dispone di due origini dati, per impostazione predefinita il ChannelType di uno degli oggetti AutoMLJobChannel deve essere impostato su training. Il ChannelType dell'altra origine dati deve essere impostato su validation. Le due fonti di dati devono avere lo stesso formato, CSV o Parquet, e lo stesso schema. In questo caso non è necessario impostare ValidationFraction perché tutti i dati di ciascuna origine vengono utilizzati per l'addestramento o la convalida. L'impostazione di questo valore causa un errore.

Per abilitare l’implementazione automatica per il miglior modello candidato di un processo AutoML, includi un ModelDeployConfig nella richiesta di processo AutoML. Ciò consentirà l'implementazione del modello migliore su un SageMaker endpoint. Di seguito sono riportate le configurazioni disponibili per la personalizzazione.