Création d'une tâche de classification d'images à l'aide de l'AutoML API - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'une tâche de classification d'images à l'aide de l'AutoML API

Les instructions suivantes montrent comment créer une tâche Amazon SageMaker Autopilot en tant qu'expérience pilote pour les types de problèmes de classification d'images à l'aide SageMaker API de Reference.

Note

Les tâches telles que la classification du texte et des images, les prévisions de séries chronologiques et le réglage précis de grands modèles linguistiques sont exclusivement disponibles via la version 2 de l'AutoML. REST API Si le langage de votre choix est Python, vous pouvez vous référer AWS SDK for Python (Boto3)SDKdirectement à MLV2l'objet Auto d'Amazon SageMaker Python.

Les utilisateurs qui préfèrent la commodité d'une interface utilisateur peuvent utiliser Amazon SageMaker Canvas pour accéder à des modèles préentraînés et à des modèles de base d'IA génératifs, ou créer des modèles personnalisés adaptés à des textes spécifiques, à une classification d'images, à des besoins de prévision ou à une IA générative.

Vous pouvez créer une expérience de classification d'images sur pilote automatique par programmation en appelant l'CreateAutoMLJobV2APIaction dans n'importe quel langage pris en charge par Amazon SageMaker Autopilot ou le. AWS CLI

Pour plus d'informations sur la façon dont cette API action se traduit par une fonction dans la langue de votre choix, consultez la section Voir aussi de CreateAutoMLJobV2 et choisissez unSDK. À titre d'exemple, pour les utilisateurs de Python, consultez la syntaxe complète des demandes de create_auto_ml_job_v2 dans le kit AWS SDK for Python (Boto3).

Vous trouverez ci-dessous un ensemble de paramètres de demande d'entrée obligatoires et facultatifs pour l'CreateAutoMLJobV2APIaction utilisée dans la classification des images.

Paramètres requis

Lorsque vous appelez CreateAutoMLJobV2 pour créer une expérience Autopilot de classification d'image, vous devez fournir les valeurs suivantes :

Tous les autres paramètres sont facultatifs.

Paramètres facultatifs

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre tâche AutoML de classification d'image.

Vous pouvez fournir votre propre jeu de données de validation et un rapport de répartition des données personnalisé, ou laisser Autopilot répartir automatiquement le jeu de données.

Chaque AutoMLJobChannelobjet (voir le paramètre obligatoire A utoMLJobInputDataConfig) possède unChannelType, qui peut être défini sur l'une training ou l'autre des validation valeurs spécifiant la manière dont les données doivent être utilisées lors de la création d'un modèle d'apprentissage automatique.

Au moins une source de données doit être fournie et deux sources de données maximum sont autorisées : une pour les données d'entraînement et l'autre pour les données de validation. Le fractionnement des données en jeux de données d'entraînement et de validation varie selon que vous disposiez d'une ou de deux sources de données.

Le fractionnement des données en jeux de données d'entraînement et de validation varie selon que vous disposiez d'une ou de deux sources de données.

  • Si vous n'avez qu'une source de données, ChannelType est défini sur training par défaut et doit avoir cette valeur.

    • Si la valeur ValidationFraction de AutoMLDataSplitConfig n'est pas définie, 0,2 (20 %) des données de cette source sont utilisées pour la validation par défaut.

    • Si ValidationFraction est défini sur une valeur comprise entre 0 et 1, le jeu de données est divisé en fonction de la valeur spécifiée, où la valeur spécifie la fraction du jeu de données utilisé pour la validation.

  • Si vous disposez de deux sources de données, le ChannelType de l'un des objets AutoMLJobChannel doit être défini sur training (valeur par défaut). Le ChannelType de l'autre source de données doit être défini sur validation. Les deux sources de données doivent avoir le même format, CSV soit Parquet, et le même schéma. Vous ne devez pas définir la valeur de ValidationFraction dans ce cas, car toutes les données de chaque source sont utilisées à des fins d'entraînement ou de validation. La définition de cette valeur provoque une erreur.

Pour activer le déploiement automatique pour le meilleur modèle candidat d'une tâche AutoML, incluez un élément ModelDeployConfig dans la demande de tâche AutoML. Cela permettra de déployer le meilleur modèle sur un SageMaker terminal. Vous trouverez ci-dessous les configurations disponibles pour la personnalisation.