Utilisation d'Amazon SageMaker Feature Store dans la console - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d'Amazon SageMaker Feature Store dans la console

Important

Les IAM politiques personnalisées qui autorisent Amazon SageMaker Studio ou Amazon SageMaker Studio Classic à créer des SageMaker ressources Amazon doivent également accorder des autorisations pour ajouter des balises à ces ressources. L'autorisation d'ajouter des balises aux ressources est requise car Studio et Studio Classic balisent automatiquement toutes les ressources qu'ils créent. Si une IAM politique autorise Studio et Studio Classic à créer des ressources mais n'autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour de plus amples informations, veuillez consulter Fournir des autorisations pour le balisage des ressources SageMaker.

AWS Politiques gérées pour Amazon SageMakerqui donnent des autorisations pour créer des SageMaker ressources incluent déjà des autorisations pour ajouter des balises lors de la création de ces ressources.

Vous pouvez utiliser Amazon SageMaker Feature Store sur la console pour créer, consulter, mettre à jour et surveiller vos groupes de fonctionnalités. La surveillance décrite dans ce guide inclut la visualisation des exécutions du pipeline et de la généalogie de vos groupes de fonctionnalités. Ce guide fournit des instructions sur la manière d'effectuer ces tâches depuis la console.

Pour des exemples de Feature Store et des ressources utilisant Amazon SageMaker APIs AWS SDK for Python (Boto3), consultezRessources Amazon SageMaker Feature Store.

Création d'un groupe de fonctionnalités à partir de la console

Le processus de création d'un groupe de fonctionnalités comporte quatre étapes :

  1. Entrez les informations du groupe de fonctionnalités.

  2. Saisissez les définitions de fonctions.

  3. Entrez les fonctionnalités requises.

  4. Entrez les balises du groupe de fonctionnalités.

Déterminez laquelle des options suivantes correspond à votre cas d'utilisation :

  • Créez un magasin en ligne, un magasin hors connexion ou les deux. Pour plus d'informations sur les différences entre les boutiques en ligne et hors ligne, consultezConcepts liés à Feature Store.

  • Utilisez une AWS Key Management Service clé par défaut ou votre propre KMS clé. La clé par défaut est AWS KMS key (SSE-KMS). Vous pouvez réduire les coûts liés aux AWS KMS demandes en configurant l'utilisation des clés de compartiment Amazon S3 sur le compartiment Amazon S3 du magasin hors ligne. La clé de compartiment Amazon S3 doit être activée avant d'utiliser le compartiment pour vos groupes de fonctionnalités. Pour plus d'informations sur la réduction des coûts en utilisant les clés de compartiment Amazon S3, consultez Réduire le coût de SSE - KMS avec les clés de compartiment Amazon S3.

    Vous pouvez utiliser la même clé pour les magasins en ligne et hors connexion, ou utiliser une clé unique pour chaque magasin. Pour plus d'informations sur AWS KMS, voir AWS Key Management Service.

  • Si vous créez un magasin hors connexion :

    • Décidez si vous souhaitez créer un compartiment Amazon S3 ou en utiliser un existant. Lorsque vous en utilisez un existant, vous devez connaître le nom du compartiment Amazon S3 URL ou le nom du compartiment Amazon S3 et le nom du répertoire du jeu de données, le cas échéant.

    • Choisissez le nom de ressource Amazon (ARN) à utiliser pour spécifier le IAM rôle. Pour plus d'informations sur la façon de trouver votre rôle et les politiques associées, consultezAjouter des politiques à votre IAM rôle.

    • Décidez si vous souhaitez utiliser le AWS Glue (par défaut) ou Apache Iceberg format de tableau. Dans la plupart des cas d'utilisation, vous utilisez le Apache Iceberg format de tableau. Pour plus d'informations sur les formats de tableau, consultezUtiliser Feature Store avec SDK pour Python (Boto3).

Vous pouvez utiliser la console pour afficher la lignée d'un groupe de fonctionnalités. Les instructions d'utilisation du Feature Store sur la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.

  2. Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. Choisissez Create Feature Group (Créer un groupe de fonctions).

  5. Sous Détails des groupes de fonctionnalités, entrez un nom de groupe de fonctionnalités.

  6. (Facultatif) Entrez une description du groupe de fonctionnalités.

  7. Sous Configuration du stockage des groupes de fonctionnalités, choisissez une configuration de stockage dans la liste déroulante. Pour plus d'informations sur les configurations de stockage, consultezConfigurations de stockage Feature Store.

  8. Si vous avez choisi d'activer le stockage en ligne :

    1. Si vous activez uniquement le stockage en ligne, vous pouvez choisir un type de stockage dans la liste déroulante. Pour plus d'informations sur les types de stockage des boutiques en ligne, consultezLe magasin en ligne.

    2. (Facultatif) Appliquez Time to Live (TTL) en activant le commutateur et en spécifiant la valeur et l'unité de durée Time to Live. Cela mettra à jour la TTL durée par défaut pour tous les enregistrements ajoutés au groupe d'entités une fois le groupe d'entités créé. Pour plus d'informations surTTL, voirDurée de vie (TTL) pour les enregistrements.

  9. Si vous avez choisi d'activer le stockage hors ligne :

    1. Sous le nom du compartiment Amazon S3, entrez un nouveau nom de compartiment ou entrez un compartiment URL existant manuellement.

    2. Dans la liste déroulante Format de table, choisissez le format de table. Dans la plupart des cas d'utilisation, vous devez utiliser Apache Iceberg format de tableau. Pour plus d'informations sur les formats de tableau, consultezUtiliser Feature Store avec SDK pour Python (Boto3).

    3. Sous IAMrôle ARN, choisissez le IAM rôle que ARN vous souhaitez associer à ce groupe de fonctionnalités. Pour plus d'informations sur la façon de trouver votre rôle et les politiques associées, consultezAjouter des politiques à votre IAM rôle.

    4. Si vous avez choisi d'activer le format de tableau pour le stockage hors ligne et le format de tableau AWS Glue (par défaut), sous Catalogue de données, vous pouvez choisir l'une des deux options suivantes :

      • Utilisez les valeurs par défaut pour votre AWS Glue Data Catalog.

      • Indiquez le nom de votre catalogue de données, le nom de la table et le nom de la base de données existants pour étendre votre catalogue existant AWS Glue Data Catalog.

  10. Dans la liste déroulante Clé de chiffrement de la boutique en ligne ou Clé de chiffrement de la boutique hors ligne, choisissez l'une des options suivantes :

    • Utilisation AWS gérée AWS KMS key (par défaut)

    • Entrez un AWS KMS key ARN et entrez votre AWS KMS clé ARN sous Clé de chiffrement de la boutique hors ligne ARN. Pour plus d'informations AWS KMS, consultez la section Service de gestion des AWS clés.

  11. Le cas échéant, vous aurez la possibilité de choisir votre mode de débit, ce qui aura une incidence sur le mode de facturation. Sous Mode débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d'écriture lorsqu'elles sont disponibles. Pour plus d'informations sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultezModes de débit.

  12. Une fois que vous avez spécifié toutes les informations requises, le bouton Continuer apparaît disponible. Choisissez Continuer.

  13. Sous Spécifier les définitions de fonctionnalités, vous avez deux options pour fournir un schéma pour vos fonctionnalités : un JSON éditeur ou un éditeur de table.

    • JSONéditeur : dans l'JSONonglet, entrez ou copiez-collez vos définitions de fonctionnalités dans le JSON format.

    • Éditeur de tableau : dans l'onglet Tableau, entrez le nom de la fonction et choisissez le type de données correspondant pour chaque entité de votre groupe d'entités. Choisissez + Ajouter des définitions de fonctionnalités pour inclure d'autres fonctionnalités. Sachez que vous ne pouvez pas supprimer les définitions de fonctions de vos groupes de fonctionnalités. Toutefois, vous pouvez ajouter et mettre à jour des définitions de fonctions une fois le groupe de fonctionnalités créé.

    Un groupe d'entités doit comporter au moins deux entités qui représentent l'identifiant de l'enregistrement et l'heure de l'événement :

    • Le type de fonction d'enregistrement peut être une chaîne, une fraction ou une intégrale.

    • Heure de l'événement Le type de fonction doit être une chaîne ou une fraction. Toutefois, si vous avez choisi Iceberg format de tableau, l'heure de l'événement doit être une chaîne.

  14. Une fois que toutes les fonctionnalités sont incluses, choisissez Continuer.

  15. Sous Sélectionner les fonctionnalités requises, vous devez spécifier l'identifiant de l'enregistrement et les fonctionnalités relatives à l'heure de l'événement. Pour ce faire, choisissez le nom de la fonctionnalité dans les listes déroulantes Nom de la fonctionnalité Identifiant de l'enregistrement et Nom de la fonctionnalité Event time, respectivement.

  16. Après avoir choisi l'identifiant d'enregistrement et les fonctionnalités relatives à l'heure de l'événement, choisissez Continuer.

  17. (Facultatif) Pour ajouter des balises au groupe de fonctionnalités, choisissez Ajouter une nouvelle balise. Entrez ensuite une clé de balise et la valeur correspondante sous Clé et Valeur, respectivement.

  18. Choisissez Continuer.

  19. Sous Vérifier le groupe de fonctionnalités, passez en revue les informations du groupe de fonctionnalités. Pour modifier une étape, cliquez sur le bouton Modifier correspondant à cette étape. Cela vous amène à l'étape de modification correspondante. Pour revenir à l'étape 5, choisissez Continuer jusqu'à ce que vous reveniez à l'étape 5.

  20. Après avoir finalisé la configuration de votre groupe de fonctionnalités, choisissez Create feature group.

    Si un problème survient lors de l'installation, un message d'alerte contextuel apparaît au bas de la page avec des conseils pour le résoudre. Vous pouvez revenir aux étapes précédentes pour résoudre les problèmes en choisissant Modifier pour l'étape présentant des conflits.

    Une fois le groupe de fonctionnalités créé avec succès, un message contextuel vert apparaît au bas de la page. Le nouveau groupe de fonctionnalités apparaît également dans votre catalogue de groupes d'entités.

Afficher les détails des groupes de fonctionnalités depuis la console

Vous pouvez consulter les détails de vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.

Vous pouvez utiliser la console ou l'Amazon SageMaker Feature Store API pour consulter les détails de votre groupe de fonctionnalités. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.

  2. Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.

  5. Sous l'onglet Catalogue de groupes de fonctionnalités, choisissez le nom de votre groupe de fonctionnalités dans la liste. La page du groupe de fonctionnalités s'ouvre.

  6. Dans l'onglet Fonctionnalités, vous trouverez la liste de toutes les fonctionnalités. Utilisez le filtre pour affiner votre liste. Choisissez une fonction pour en afficher les détails.

  7. Sous l'onglet Détails et le sous-onglet Informations, vous pouvez consulter les informations relatives à vos groupes d'entités. Cela inclut la dernière exécution, les paramètres de stockage hors ligne, les paramètres de stockage en ligne, etc.

  8. Dans l'onglet Détails et le sous-onglet Balises, vous pouvez consulter les balises de vos groupes d'entités. Choisissez Ajouter une nouvelle balise pour ajouter une nouvelle balise ou Supprimer pour supprimer une balise.

  9. Dans l'onglet Exécutions de pipelines, vous pouvez afficher les pipelines ou les exécutions de pipeline associés à votre groupe de fonctionnalités.

  10. Dans l'onglet Lineage, vous pouvez afficher le lignage de votre groupe de fonctionnalités.

Mettre à jour un groupe de fonctionnalités depuis la console

Vous pouvez mettre à jour vos groupes de fonctionnalités une fois qu'un groupe de fonctionnalités a été créé avec succès dans le Feature Store.

Vous pouvez utiliser la console ou l'Amazon SageMaker Feature Store API pour mettre à jour un groupe de fonctionnalités. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.

  2. Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.

  5. Sous l'onglet Catalogue de groupes de fonctionnalités, recherchez et choisissez le nom de votre groupe de fonctionnalités dans la liste. La page du groupe de fonctionnalités s'ouvre.

  6. Choisissez Mettre à jour le groupe de fonctionnalités.

  7. (Facultatif) Le cas échéant, vous pouvez modifier votre mode de débit, ce qui a un impact sur le mode de facturation. Sous Mode débit, choisissez un mode dans la liste déroulante et entrez les capacités de lecture et d'écriture lorsqu'elles sont disponibles. Pour plus d'informations sur les modes de débit, par exemple le moment où le mode peut être appliqué et les unités de capacité, consultezModes de débit.

  8. (Facultatif) Si votre groupe de fonctionnalités utilise la boutique en ligne, vous pouvez mettre à jour le Time to Live (TTL) par défaut. Si ce TTL n'est pas le cas pour le groupe de fonctionnalités, basculez le bouton situé sous Time to Live (TTL) sur Activé. Vous pouvez spécifier la TTL valeur et l'unité sous Durée de vie. Cela mettra à jour la TTL durée par défaut pour tous les enregistrements ajoutés au groupe d'entités après la mise à jour du groupe d'entités.

  9. (Facultatif) Vous pouvez ajouter des définitions de fonctionnalités à votre groupe de fonctionnalités, mais sachez que vous ne pouvez pas supprimer les définitions de fonctionnalités de vos groupes de fonctionnalités. Pour ajouter une définition de fonction, choisissez + Ajouter une définition de fonction, puis spécifiez le nouveau nom de définition de fonction dans la colonne Nom et sélectionnez le type de fonction dans la colonne Type de fonction.

  10. Sélectionnez Enregistrer les modifications.

  11. Pour confirmer vos modifications, choisissez Confirmer.

Afficher les exécutions du pipeline depuis la console

Vous pouvez consulter les dernières informations d'exécution du pipeline pour une fonction ou un groupe de fonctionnalités sous Exécutions du pipeline. Vous pouvez également obtenir des liens vers des pipelines, des exécutions, du code et d'autres informations utiles sur l'exécution.

Vous pouvez utiliser la console pour visualiser les exécutions de vos pipelines. Les instructions relatives à l'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.

  2. Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.

  5. Choisissez un groupe de fonctionnalités ou une fonctionnalité pour visualiser leurs exécutions de pipeline.

  6. Choisissez l'onglet Exécutions des pipelines.

  7. Recherchez un pipeline dans la liste déroulante Sélectionner un pipeline.

  8. Vous pouvez consulter les liens relatifs au pipeline, à l'exécution et aux détails du code. Vous pouvez également consulter le propriétaire, le statut, la date et la durée de l'exécution.

Afficher le lignage depuis la console

Vous pouvez afficher la lignée d'un groupe de fonctionnalités. La lignée inclut les informations relatives au code d'exécution de votre flux de travail de fonctionnalisation, aux sources de données utilisées et à la manière dont elles sont ingérées au groupe de fonctionnalités ou à la fonctionnalité.

Vous pouvez utiliser la console pour afficher la lignée d'un groupe de fonctionnalités. Les instructions d'utilisation du Feature Store via la console varient selon que vous l'avez activé Amazon SageMaker Studio ou Amazon SageMaker Studio classique en tant qu'expérience par défaut.

  1. Ouvrez la console Studio en suivant les instructions figurant dansLancez Amazon SageMaker Studio.

  2. Choisissez Data dans le volet de navigation de gauche pour développer la liste déroulante.

  3. Dans la liste déroulante, choisissez Feature Store.

  4. (Facultatif) Pour afficher vos groupes de fonctionnalités, sélectionnez Mon compte. Pour afficher les groupes de fonctionnalités partagés, choisissez Cross account.

  5. Choisissez un groupe d'entités ou une entité pour afficher les détails de sa lignée.

  6. Choisissez l'onglet Lignée.

  7. Choisissez un groupe de fonctionnalités ou un nœud de pipeline pour étendre le nœud. Il contient des informations supplémentaires sur un groupe de fonctionnalités ou un pipeline.

  8. Vous pouvez zoomer, dézoomer ou recentrer le graphe de lignée à l'aide des boutons situés en bas à gauche de l'écran.

  9. Vous pouvez vous déplacer sur la carte de lignage quand vous le souhaitez et faire glisser l'écran. Pour déplacer vos cartes de lignage en utilisant les nœuds comme point focal, vous pouvez appuyer sur Tab ou Shift+Tab pour passer d'un nœud à l'autre.

  10. Le cas échéant, vous pouvez parcourir le lignage en amont (à gauche, plus tôt) ou en aval (à droite, le plus récent). Pour ce faire, choisissez un nœud, puis choisissez Query upstream lineage ou Query downstream lineage.