Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'une tâche de classification d'images à l'aide de l'AutoML API
Note
Les tâches telles que la classification du texte et des images, les prévisions de séries chronologiques et le réglage précis de grands modèles linguistiques sont exclusivement disponibles via la version 2 de l'AutoML. REST API Si le langage de votre choix est Python, vous pouvez vous référer AWS SDK for Python (Boto3)
Les utilisateurs qui préfèrent la commodité d'une interface utilisateur peuvent utiliser Amazon SageMaker Canvas pour accéder à des modèles préentraînés et à des modèles de base d'IA génératifs, ou créer des modèles personnalisés adaptés à des textes spécifiques, à une classification d'images, à des besoins de prévision ou à une IA générative.
Vous pouvez créer une expérience de classification d'images sur pilote automatique par programmation en appelant l'CreateAutoMLJobV2
APIaction dans n'importe quel langage pris en charge par Amazon SageMaker Autopilot ou le. AWS CLI
Pour plus d'informations sur la façon dont cette API action se traduit par une fonction dans la langue de votre choix, consultez la section Voir aussi de CreateAutoMLJobV2
et choisissez unSDK. À titre d'exemple, pour les utilisateurs de Python, consultez la syntaxe complète des demandes de create_auto_ml_job_v2
dans le kit AWS SDK for Python (Boto3).
Vous trouverez ci-dessous un ensemble de paramètres de demande d'entrée obligatoires et facultatifs pour l'CreateAutoMLJobV2
APIaction utilisée dans la classification des images.
Paramètres requis
Lorsque vous appelez CreateAutoMLJobV2
pour créer une expérience Autopilot de classification d'image, vous devez fournir les valeurs suivantes :
-
Un paramètre
AutoMLJobName
pour spécifier le nom de votre tâche. -
Au moins un paramètre
AutoMLJobChannel
dansAutoMLJobInputDataConfig
pour spécifier votre source de données. -
Un paramètre
AutoMLProblemTypeConfig
de typeImageClassificationJobConfig
. -
Un élément
OutputDataConfig
pour spécifier le chemin de sortie Amazon S3 pour stocker les artefacts de votre tâche AutoML. -
A
RoleArn
pour spécifier ARN le rôle utilisé pour accéder à vos données.
Tous les autres paramètres sont facultatifs.
Paramètres facultatifs
Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre tâche AutoML de classification d'image.
Vous pouvez fournir votre propre jeu de données de validation et un rapport de répartition des données personnalisé, ou laisser Autopilot répartir automatiquement le jeu de données.
Chaque AutoMLJobChannel
objet (voir le paramètre obligatoire A utoMLJobInputDataConfig) possède unChannelType
, qui peut être défini sur l'une training
ou l'autre des validation
valeurs spécifiant la manière dont les données doivent être utilisées lors de la création d'un modèle d'apprentissage automatique.
Au moins une source de données doit être fournie et deux sources de données maximum sont autorisées : une pour les données d'entraînement et l'autre pour les données de validation. Le fractionnement des données en jeux de données d'entraînement et de validation varie selon que vous disposiez d'une ou de deux sources de données.
Le fractionnement des données en jeux de données d'entraînement et de validation varie selon que vous disposiez d'une ou de deux sources de données.
-
Si vous n'avez qu'une source de données,
ChannelType
est défini surtraining
par défaut et doit avoir cette valeur.-
Si la valeur
ValidationFraction
deAutoMLDataSplitConfig
n'est pas définie, 0,2 (20 %) des données de cette source sont utilisées pour la validation par défaut. -
Si
ValidationFraction
est défini sur une valeur comprise entre 0 et 1, le jeu de données est divisé en fonction de la valeur spécifiée, où la valeur spécifie la fraction du jeu de données utilisé pour la validation.
-
-
Si vous disposez de deux sources de données, le
ChannelType
de l'un des objetsAutoMLJobChannel
doit être défini surtraining
(valeur par défaut). LeChannelType
de l'autre source de données doit être défini survalidation
. Les deux sources de données doivent avoir le même format, CSV soit Parquet, et le même schéma. Vous ne devez pas définir la valeur deValidationFraction
dans ce cas, car toutes les données de chaque source sont utilisées à des fins d'entraînement ou de validation. La définition de cette valeur provoque une erreur.
Pour activer le déploiement automatique pour le meilleur modèle candidat d'une tâche AutoML, incluez un élément ModelDeployConfig
dans la demande de tâche AutoML. Cela permettra de déployer le meilleur modèle sur un SageMaker terminal. Vous trouverez ci-dessous les configurations disponibles pour la personnalisation.
-
Pour permettre à Autopilot de générer le nom du point de terminaison, définissez
AutoGenerateEndpointName
surTrue
. -
Pour fournir votre propre nom pour le point de terminaison, définissez
AutoGenerateEndpointName to
.False
and provide a name of your choice in EndpointName