Utilizzo di Amazon SageMaker Feature Store nella console - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Amazon SageMaker Feature Store nella console

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L'autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic taggano automaticamente tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'aggiunta di tag, si possono verificare errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per SageMaker etichettare le risorse AI.

AWS politiche gestite per Amazon SageMaker AIche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Puoi utilizzare Amazon SageMaker Feature Store sulla console per creare, visualizzare, aggiornare e monitorare i tuoi gruppi di funzionalità. Il monitoraggio in questa guida include la visualizzazione delle esecuzioni della pipeline e della derivazione dei gruppi di funzionalità. Questa guida fornisce istruzioni su come eseguire queste attività dalla console.

Per esempi e risorse sul Feature Store che utilizzano Amazon SageMaker APIs e AWS SDK for Python (Boto3), consultaRisorse SageMaker di Amazon Feature Store.

Crea un gruppo di funzionalità dalla console

Il processo di creazione del gruppo di funzionalità prevede quattro fasi:

  1. Inserisci le informazioni sul gruppo di funzionalità.

  2. Inserisci le definizioni delle funzionalità.

  3. Inserisci le funzionalità richieste.

  4. Inserisci i tag del gruppo di funzionalità.

Considerate quale delle seguenti opzioni è adatta al vostro caso d'uso:

  • Crea un archivio online, un archivio offline o entrambi. Per ulteriori informazioni sulle differenze tra negozi online e offline, consultaConcetti di base sul Feature Store.

  • Usa una AWS Key Management Service chiave predefinita o la tua chiave KMS. La chiave predefinita è la chiave AWS KMS (SSE-KMS). Puoi ridurre i costi delle AWS KMS richieste configurando l'uso di Amazon S3 Bucket Keys nel bucket Amazon S3 dello store offline. La chiave Amazon S3 Bucket deve essere abilitata prima di utilizzarla per i tuoi gruppi di funzionalità. Per ulteriori informazioni sulla riduzione dei costi utilizzando Amazon S3 Bucket Keys, consulta Ridurre il costo di SSE-KMS con Amazon S3 Bucket Keys.

    Puoi utilizzare la stessa chiave per gli archivi online e offline o configurare una chiave univoca per ciascuno di essi. Per ulteriori informazioni su, consulta. AWS KMSAWS Key Management Service

  • Se crei un archivio offline:

    • Decidi se creare un bucket Amazon S3 o utilizzarne uno esistente. Quando ne usi uno esistente, devi conoscere l'URL del bucket Amazon S3 o il nome del bucket Amazon S3 e il nome della directory del set di dati, se applicabile.

    • Scegli quale Amazon Resource Name (ARN) utilizzare per specificare il ruolo IAM. Per ulteriori informazioni su come trovare il tuo ruolo e le politiche associate, consultaAggiunta di policy al ruolo IAM.

    • Decidi se utilizzare AWS Glue (impostazione predefinita) o Apache Iceberg formato di tabella. Nella maggior parte dei casi d'uso, si utilizza il Apache Iceberg formato tabellare. Per ulteriori informazioni sui formati delle tabelle, vedereUtilizzo di Feature Store con SDK per Python (Boto3).

È possibile utilizzare la console per visualizzare la discendenza di un gruppo di funzionalità. Le istruzioni per utilizzare Feature Store sulla console variano a seconda che l'esperienza sia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. Seleziona Crea gruppo di funzionalità.

  5. In Dettagli del gruppo di funzionalità, inserisci un nome per il gruppo di funzionalità.

  6. (Facoltativo) Immetti una descrizione per il gruppo di funzionalità.

  7. In Configurazione dell'archiviazione del gruppo di funzionalità, scegli una configurazione di archiviazione dall'elenco a discesa. Per informazioni sulle configurazioni di archiviazione, consulta. Configurazioni di archiviazione dell'archivio funzionalità

  8. Se hai scelto di abilitare l'archiviazione online:

    1. Se abiliti solo l'archiviazione online, puoi scegliere un tipo di archiviazione dall'elenco a discesa. Per informazioni sui tipi di archiviazione nei negozi online, consultaArchivio online.

    2. (Facoltativo) Applica Time to Live (TTL) posizionando l'interruttore su On e specificando il valore e l'unità di durata di Time to Live. Ciò aggiornerà la durata TTL predefinita per tutti i record aggiunti al gruppo di funzionalità dopo la creazione del gruppo di funzionalità. Per ulteriori informazioni sul TTL, vedere. Durata Time to live (TTL) per i record

  9. Se hai scelto di abilitare l'archiviazione offline:

    1. Sotto il nome del bucket Amazon S3, inserisci un nuovo nome di bucket o inserisci manualmente un URL del bucket esistente.

    2. Dall'elenco a discesa Formato tabella, scegli il formato di tabella. Nella maggior parte dei casi d'uso, è necessario utilizzare Apache Iceberg formato tabellare. Per ulteriori informazioni sui formati delle tabelle, vedereUtilizzo di Feature Store con SDK per Python (Boto3).

    3. In ARN del ruolo IAM, scegli l'ARN del ruolo IAM che desideri collegare a questo gruppo di funzionalità. Per ulteriori informazioni su come trovare il proprio ruolo e le politiche associate, vedereAggiunta di policy al ruolo IAM.

    4. Se hai scelto di abilitare il formato tabella di archiviazione offline e il formato tabella AWS Glue (predefinito), in Catalogo dati puoi scegliere una delle due opzioni seguenti:

      • Usa i valori predefiniti per il tuo AWS Glue Data Catalog.

      • Fornisci il nome del catalogo dati esistente, il nome della tabella e il nome del database per estendere quelli esistenti AWS Glue Data Catalog.

  10. Nell'elenco a discesa Chiave di crittografia del negozio online o Chiave di crittografia del negozio offline, scegli una delle seguenti opzioni:

    • Usa AWS gestito AWS KMS key (impostazione predefinita)

    • Inserisci un AWS KMS key ARN e inserisci la tua chiave AWS KMS ARN nella chiave di crittografia del negozio offline ARN. Per ulteriori informazioni in merito AWS KMS, consulta AWS Key Management Service.

  11. Se applicabile, avrai la possibilità di scegliere la modalità di throughput, che influisce sulla modalità di addebito. In modalità Throughput, scegli una modalità dall'elenco a discesa e inserisci le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di trasmissione, ad esempio quando è possibile applicare la modalità e sulle unità di capacità, consulta. Modalità di velocità di trasmissione effettiva

  12. Dopo aver specificato tutte le informazioni richieste, il pulsante Continua appare disponibile. Scegli Continua.

  13. In Specifica definizioni di funzionalità, sono disponibili due opzioni per fornire uno schema per le funzionalità: un editor JSON o un editor di tabelle.

    • Editor JSON: nella scheda JSON, inserisci o copia e incolla le definizioni delle funzionalità nel formato JSON.

    • Editor di tabelle: nella scheda Tabella, inserisci il nome della funzionalità e scegli il tipo di dati corrispondente per ogni funzionalità del tuo gruppo di funzionalità. Scegli + Aggiungi definizioni di funzionalità per includere altre funzionalità. Tieni presente che non puoi rimuovere le definizioni delle funzionalità dai tuoi gruppi di funzionalità. Tuttavia, potete aggiungere e aggiornare le definizioni delle feature dopo la creazione del gruppo di feature.

    In un gruppo di funzionalità devono essere presenti almeno due feature che rappresentino l'identificatore del record e l'ora dell'evento:

    • Il tipo di feature del record può essere una stringa, un frazionario o un integrale.

    • L'ora dell'evento Il tipo di feature deve essere una stringa o un elemento frazionario. Tuttavia, se hai scelto il Iceberg formato tabella, l'ora dell'evento deve essere una stringa.

  14. Dopo aver incluso tutte le funzionalità, scegli Continua.

  15. In Seleziona le funzionalità richieste, devi specificare l'identificatore del record e le funzioni relative all'ora dell'evento. A tale scopo, scegli il nome della funzione negli elenchi a discesa Record identifier feature name e Event time Feature Name, rispettivamente.

  16. Dopo aver scelto le funzioni dell'identificatore del record e dell'ora dell'evento, scegli Continua.

  17. (Facoltativo) Per aggiungere tag per il gruppo di funzionalità, scegli Aggiungi nuovo tag. Quindi inserite una chiave di tag e il valore corrispondente rispettivamente in Chiave e Valore.

  18. Scegli Continua.

  19. In Rivedi gruppo di funzionalità, rivedi le informazioni sul gruppo di funzionalità. Per modificare qualsiasi passaggio, scegli il pulsante Modifica corrispondente a quel passaggio. Si passa quindi alla fase di modifica corrispondente. Per tornare alla fase 5, scegli Continua fino a tornare alla fase 5.

  20. Dopo aver finalizzato la configurazione per il tuo gruppo di funzionalità, scegli Crea gruppo di funzionalità.

    Se si verifica un problema durante la configurazione, nella parte inferiore della pagina viene visualizzato un messaggio di avviso pop-up con suggerimenti per la risoluzione del problema. Puoi tornare ai passaggi precedenti per risolvere i problemi scegliendo Modifica come passaggio relativo ai conflitti.

    Dopo che il gruppo di funzionalità è stato creato con successo, nella parte inferiore della pagina viene visualizzato un messaggio pop-up verde. Il nuovo gruppo di funzionalità appare anche nel catalogo dei gruppi di funzionalità.

Visualizza i dettagli del gruppo di funzionalità dalla console

Puoi visualizzare i dettagli dei tuoi gruppi di funzionalità dopo che un gruppo di funzionalità è stato creato con successo nel Feature Store.

Puoi utilizzare la console o l'API Amazon SageMaker Feature Store per visualizzare i dettagli del tuo gruppo di funzionalità. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che tu l'abbia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic come esperienza predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Nella scheda Catalogo del Feature Store, scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Nella scheda Funzionalità, puoi trovare un elenco di tutte le funzionalità. Usa il filtro per perfezionare l'elenco. Scegli una funzionalità per visualizzarne i dettagli.

  7. Nella scheda Dettagli e nella sottoscheda Informazioni, puoi rivedere le informazioni sul tuo gruppo di funzionalità. Ciò include l'esecuzione più recente, le impostazioni di archiviazione offline, le impostazioni di archiviazione online e altro ancora.

  8. Nella scheda Dettagli e nella sottoscheda Tag, puoi esaminare i tag del tuo gruppo di funzionalità. Scegli Aggiungi nuovo tag per aggiungere un nuovo tag o Rimuovi per rimuovere un tag.

  9. Nella scheda Pipeline Executions, puoi visualizzare le pipeline associate o le esecuzioni di pipeline per il tuo gruppo di funzionalità.

  10. Nella scheda Lineage, puoi visualizzare la derivazione del tuo gruppo di funzionalità.

Aggiorna un gruppo di funzionalità dalla console

Puoi aggiornare i tuoi gruppi di funzionalità dopo che un gruppo di funzionalità è stato creato correttamente nel Feature Store.

Puoi utilizzare la console o l'API Amazon SageMaker Feature Store per aggiornare un gruppo di funzionalità. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che tu l'abbia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic come esperienza predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Nella scheda Catalogo del gruppo di funzionalità, cerca e scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Seleziona Aggiorna gruppo di funzionalità.

  7. (Facoltativo) Se applicabile, puoi modificare la modalità di throughput, che influisce sulla modalità di addebito. In modalità Throughput, scegliete una modalità dall'elenco a discesa e inserite le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di trasmissione, ad esempio quando è possibile applicare la modalità e sulle unità di capacità, consulta. Modalità di velocità di trasmissione effettiva

  8. (Facoltativo) Se il tuo gruppo di funzionalità utilizza l'archivio online, puoi aggiornare il Time to Live (TTL) predefinito. Se il TTL non è stato abilitato per il gruppo di funzionalità, attiva l’interruttore in Time to Live (TTL) impostandolo su On. Puoi specificare il valore e l'unità TTL in Durata del Time to Live. Ciò aggiornerà la durata TTL predefinita per tutti i record aggiunti al gruppo di funzionalità dopo l'aggiornamento del gruppo di funzionalità.

  9. (Facoltativo) È possibile aggiungere definizioni di funzionalità al proprio gruppo di funzionalità, ma non è possibile rimuovere le definizioni di funzionalità dai gruppi di funzionalità. Per aggiungere una definizione di feature, scegliete + Aggiungi definizione di feature, quindi specificate il nome della nuova definizione di feature nella colonna Nome e selezionate il tipo di feature nella colonna Feature type.

  10. Scegli Save changes (Salva modifiche).

  11. Per confermare le modifiche, scegliete Conferma.

Visualizza le esecuzioni della pipeline dalla console

È possibile visualizzare le informazioni più recenti sull'esecuzione della pipeline per una funzionalità o un gruppo di funzionalità in Pipeline executions. È inoltre possibile ottenere collegamenti a pipeline, esecuzioni, codice e altre informazioni utili sull'esecuzione.

Puoi usare la console per visualizzare le esecuzioni della pipeline. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che l'esperienza sia stata abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate in. Avvia Amazon SageMaker Studio

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Scegli un gruppo di funzionalità o una funzionalità per visualizzare le loro esecuzioni nella pipeline.

  6. Scegli la scheda Esecuzioni pipeline.

  7. Cerca una pipeline dall'elenco a discesa Seleziona pipeline.

  8. È possibile visualizzare i collegamenti per la pipeline, l'esecuzione e i dettagli del codice. È inoltre possibile visualizzare il proprietario, lo stato, la data e la durata dell'esecuzione.

Visualizza la discendenza dalla console

È possibile visualizzare la discendenza di un gruppo di funzionalità. La discendenza include le informazioni sul codice di esecuzione del flusso di lavoro di elaborazione delle funzionalità, sulle fonti di dati utilizzate e sul modo in cui vengono inserite nel gruppo di funzionalità o nella funzionalità.

È possibile utilizzare la console per visualizzare la discendenza di un gruppo di funzionalità. Le istruzioni sull'utilizzo del Feature Store tramite la console dipendono dal fatto che l'esperienza sia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Scegli un gruppo di funzionalità o una funzionalità per visualizzarne i dettagli sulla derivazione.

  6. Scegli la scheda Discendenza.

  7. Scegli un gruppo di funzionalità o un nodo di pipeline per espandere il nodo. Il nodo contiene ulteriori informazioni su un gruppo di funzionalità o una pipeline.

  8. È possibile ingrandire, rimpicciolire o ricentrare il grafico di discendenza utilizzando i pulsanti in basso a sinistra dello schermo.

  9. È possibile spostarsi all'interno della mappa di derivazione selezionando e trascinando lo schermo. Per spostare le mappe di derivazione usando i nodi come punto focale, puoi premere Tab o Shift+Tab per passare da un nodo all'altro.

  10. Se applicabile, puoi navigare nel lignaggio a monte (a sinistra, precedente) o a valle (a destra, più recente). A tale scopo, scegli un nodo e quindi scegli Query upstream lineage o Query downstream lineage.