Trabalhe com ativos (guia do usuário) - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Trabalhe com ativos (guia do usuário)

Use SageMaker Assets para colaborar perfeitamente em projetos de aprendizado de máquina com outras pessoas em sua organização. Com o SageMaker Assets, você e seus colaboradores criam e compartilham modelos e tabelas de dados entre si. Em SageMaker Ativos, esses modelos e tabelas de dados são conhecidos como ativos.

SageMaker Assets é um recurso do Amazon SageMaker Studio. Você ou seu administrador criam um ambiente Studio dentro de um DataZone projeto da Amazon. Para obter mais informações sobre como configurar a Amazon DataZone, consulteConfigurar SageMaker ativos (guia do administrador).

Os ativos são ativos de ML ou ativos de dados. Os ativos de ML são metadados que apontam para o seguinte:

  • Grupos de recursos da Feature Store

  • SageMaker grupos de modelos

Os grupos de modelos e grupos de recursos subjacentes são as fontes de dados. Se você atualizar um grupo de recursos ou grupo de modelos, o ativo do grupo de modelos ou grupo de recursos será atualizado em um dia.

Os ativos de dados são metadados que apontam para o seguinte:

  • Tabelas do Amazon Redshift

  • AWS Glue tabelas

Para ativos de dados, a fonte de dados é o mecanismo que extrai metadados das AWS Glue tabelas e das tabelas do Amazon Redshift para o ativo. Por exemplo, uma fonte de dados extrai os metadados de uma AWS Glue tabela para o ativo dessa tabela.

Você pode tornar um ativo visível para todos em sua organização publicando-o. Os indivíduos podem revisar os metadados no ativo e solicitar acesso. Se você fornecer acesso, eles terão acesso à fonte subjacente de dados ou tabela de aprendizado de máquina.

Seu administrador provavelmente lhe deu acesso aos grupos de recursos, grupos de modelos e tabelas. Caso contrário, consulte as informações Configurar SageMaker ativos (guia do administrador) para ajudar você a começar.

As seções a seguir fornecem informações de referência para grupos de recursos e grupos de modelos.

A Amazon SageMaker Feature Store fornece um local centralizado para ajudar você a armazenar e gerenciar seus recursos. É um repositório de alto desempenho que você pode usar para engenharia de recursos.

Na Feature Store, os recursos são armazenados em um grupo de recursos. Um grupo de recursos é uma coleção de recursos relacionados a um projeto no qual você está trabalhando. Por exemplo, se você estiver trabalhando em um projeto relacionado à previsão de preços de imóveis, um grupo de características pode incluir características como localização ou número de quartos.

Para obter mais informações sobre como você pode usar grupos de recursos para simplificar o processo de engenharia de recursos, consulteCrie, armazene e compartilhe recursos com a Feature Store.

Você pode usar grupos de SageMaker SageMaker modelos no Registro de modelos para organizar e gerenciar diferentes versões de seus modelos. Você pode comparar as diferentes versões dos modelos para ver qual delas tem melhor desempenho para seu caso de uso. Para obter mais informações sobre o SageMaker Model Registry, consulteImplantação de registro de modelo com registro de modelos.

A seguir estão informações básicas sobre o Amazon Redshift e. AWS Glue

O Amazon Redshift é um serviço de armazenamento de dados em grande escala que fornece desempenho rápido de consultas em grandes conjuntos de dados. Para obter mais informações sobre o Amazon Redshift, consulte Amazon Redshift Serverless.

AWS Glue é um serviço de extração, transformação, carregamento (ETL) que você pode usar para simplificar o processo de preparação de dados. Para obter mais informações sobre AWS Glue, consulte O que é AWS Glue?

Você pode usar o SQL editor para conectar AWS Glue bancos de dados do Amazon Redshift e executar consultas. Você pode compartilhar qualquer tabela criada no editor em SageMaker Assets. Para obter mais informações, consulte Prepare dados com SQL o Studio.

Terminologia e conceitos

Antes de começar a usar o SageMaker Assets, é útil se familiarizar com a terminologia e os conceitos a seguir:

  • Ativo — Os metadados que apontam para os modelos ou tabelas de dados que você está compartilhando. Você solicita acesso a um ativo de propriedade de outra pessoa ou compartilha seu ativo com outras pessoas. Você e seus colegas de equipe acessam o ativo e a tabela de dados subjacente ou o modelo associado a ele.

  • Ativos inscritos — Para solicitar acesso a um ativo, você envia uma solicitação de assinatura. Se sua solicitação for aprovada, o ativo aparecerá em seus ativos inscritos.

  • Ativos próprios — Os ativos que você compartilhou com seus colegas de equipe.

  • Catálogo de ativos — os ativos que você compartilhou em toda a sua organização.

Etapa 1: acessar SageMaker ativos

Acesse SageMaker Ativos para visualizar seus ativos e compartilhá-los com outras pessoas. Use as informações a seguir para ajudá-lo a começar a usá-lo.

Você acessa SageMaker os ativos de um projeto dentro de um DataZone domínio da Amazon. Um projeto é uma colaboração entre você e os membros da sua equipe. Dentro do projeto, você e os outros membros do seu projeto têm acesso aos ativos que você e os outros membros da sua equipe criam no catálogo de inventário. Você pode publicar os ativos no catálogo publicado para torná-los visíveis para outras pessoas em sua organização.

Essas pessoas podem solicitar acesso ao seu ativo. Se você fornecer acesso a eles, eles poderão acessar a fonte de dados atualizada. Por exemplo, se uma pessoa se inscrever em uma AWS Glue tabela que você atualiza, ela pode acessar a AWS Glue tabela atualizada em tempo real.

Use o procedimento a seguir para acessar SageMaker os ativos.

Para acessar SageMaker ativos
  1. Abra o DataZone console da Amazon.

  2. Escolha Exibir domínios.

  3. Ao lado do domínio que contém seu projeto, escolha Abrir portal de dados.

  4. Em Ferramentas de análise, escolha SageMakerStudio.

  5. Escolha Abrir Amazon SageMaker.

  6. Escolha Assets (Ativos).

Os ativos que foram compartilhados com você estão em Ativos subscritos. Os ativos que você e os membros do seu projeto criam estão em Ativos próprios. Os ativos que você e os outros membros da sua organização publicaram estão no catálogo de ativos.

Etapa 2: compartilhar ativos e gerenciar o acesso a eles

Depois de criar modelos de aprendizado de máquina, grupos de recursos ou tabelas de dados, você pode torná-los visíveis para as pessoas que colaboram com você em seu projeto ou em sua organização de forma mais ampla. Você pode responder às solicitações de acesso ao ativo. Se você aprovar a solicitação de um indivíduo, ele poderá modificar a fonte de dados subjacente do ativo.

Ao compartilhar um ativo, você tem duas opções:

  • Publicar no catálogo de ativos — Torne o ativo visível para todos em sua organização

  • Publique no inventário — torne o ativo visível para todos que trabalham em seu projeto

Se você publicou seu ativo no catálogo de ativos, as pessoas da sua organização podem encontrá-lo no catálogo de ativos. Eles podem visualizar os metadados do seu ativo e decidir se querem solicitar acesso a eles. Se você aprovar a solicitação, eles terão acesso à fonte de dados subjacente.

Se você publicar no inventário, você e os outros membros do seu projeto poderão acessar o ativo sem nenhuma ação adicional.

Os ativos publicados no inventário só aparecem em Ativos próprios. Os ativos publicados no catálogo aparecem em Ativos próprios e Catálogo de ativos.

Ao publicar uma tabela de dados, você deve criar uma fonte de dados que extraia os metadados da AWS Glue tabela subjacente ou da tabela do Amazon Redshift para o ativo. Use os procedimentos a seguir para publicar uma tabela AWS Glue ou uma tabela do Amazon Redshift.

Publish an AWS Glue table

Para publicar um ativo em uma AWS Glue tabela, você cria uma fonte de dados para ela e a publica. Uma fonte de dados é o mecanismo que extrai os metadados da AWS Glue tabela para o ativo.

Use o procedimento a seguir para publicar uma AWS Glue tabela.

Para publicar uma AWS Glue tabela
  1. Navegue até a página inicial de SageMaker Ativos.

  2. Selecione Ativos próprios.

  3. Escolha Exibir fontes de dados.

  4. Escolha Criar fonte de dados.

  5. Em Nome, especifique um nome para a fonte de dados.

  6. Em Descrição, forneça uma descrição.

  7. Em Tipo, selecione AWS Glue.

  8. Em Seleção de dados, selecione o banco de dados que contém a AWS Glue tabela.

  9. Em Critérios de seleção de tabela, especifique o nome da tabela.

    nota

    Embora você possa especificar mais de uma tabela, sugerimos que forneça somente um nome de tabela.

  10. Escolha Próximo.

    • Em Publicar ativo no catálogo, selecione Sim para publicar no catálogo de ativos.

    • Em Publicar ativo no catálogo, selecione Não para publicar no catálogo de ativos.

  11. Escolha Próximo.

  12. Em Detalhes do ativo, escolha Executar em um cronograma ou Executar sob demanda para determinar como os metadados da AWS Glue tabela são inseridos no ativo.

  13. (Opcional) Se você escolher Executar em um cronograma, especifique o cronograma que extrai os metadados para o ativo.

  14. Escolha Próximo.

  15. Escolha Criar.

  16. (Opcional) Se você não criou um cronograma, escolha Executar para trazer os metadados da AWS Glue tabela para o ativo.

Publish an Amazon Redshift table

Para publicar um ativo para uma tabela do Amazon Redshift, você cria uma fonte de dados para ele e o publica. Uma fonte de dados é o mecanismo que extrai os metadados da tabela do Amazon Redshift para o ativo.

Use o procedimento a seguir para publicar uma tabela do Amazon Redshift.

Para publicar uma tabela do Amazon Redshift
  1. Navegue até a página inicial de SageMaker Ativos.

  2. Selecione Ativos próprios.

  3. Escolha Exibir fontes de dados.

  4. Escolha Criar fonte de dados.

  5. Em Nome, especifique um nome para a fonte de dados.

  6. Em Descrição, forneça uma descrição.

  7. Em Tipo, selecione Amazon Redshift.

    • Selecione o cluster Redshift.

      1. Para o cluster do Redshift, especifique o nome do cluster do Amazon Redshift que contém o banco de dados da tabela.

      2. Em Secret, especifique o nome do AWS Secrets Manager segredo que contém as credenciais do cluster.

    • Selecione Redshift serverless.

      1. Para o grupo de trabalho do Redshift, especifique o nome do grupo de trabalho do Amazon Redshift que contém o banco de dados da tabela.

      2. Em Segredo, especifique o nome do AWS Secrets Manager segredo que contém as credenciais do grupo de trabalho.

  8. Em Seleção da fonte de publicação, selecione o banco de dados que contém a tabela do Amazon Redshift.

  9. Em Critérios de seleção de tabela, especifique o nome da tabela.

    nota

    Embora você possa especificar mais de uma tabela, sugerimos que forneça somente um nome de tabela.

  10. Escolha Próximo.

    • Em Publicar ativo no catálogo, selecione Sim para publicar no catálogo de ativos.

    • Em Publicar ativo no catálogo, selecione Não para publicar no catálogo de ativos.

  11. Escolha Próximo.

  12. Em Detalhes do ativo, escolha Executar de acordo com uma programação ou Executar sob demanda para determinar como os metadados da tabela do Amazon Redshift são inseridos no ativo.

  13. (Opcional) Se você escolher Executar em um cronograma, especifique o cronograma que extrai os metadados para o ativo.

  14. Escolha Próximo.

  15. Escolha Criar.

  16. (Opcional) Se você não criou um cronograma, escolha Executar para trazer os metadados da tabela do Amazon Redshift para o ativo.

Use os procedimentos a seguir para publicar um ativo para um grupo de recursos ou grupo de pacotes de modelos.

Publish a feature group

Use o procedimento a seguir para navegar até um grupo de recursos que você criou e publicá-lo em seus ativos próprios ou no catálogo de ativos.

Para publicar o grupo de recursos em seus ativos ou catálogo de ativos
  1. No Studio, selecione Dados na navegação à esquerda.

  2. Selecione o grupo de recursos que você está publicando.

  3. Escolha o Three dots next to the feature group. ícone.

    • Selecione Publicar no catálogo de ativos para publicar no catálogo de ativos.

    • Selecione Publicar no inventário para publicar nos ativos de propriedade do seu grupo.

Publish a model group

Use o procedimento a seguir para navegar até um grupo de modelos que você criou e publicá-lo em seus ativos próprios ou no catálogo de ativos.

Para publicar o grupo de modelos em seus ativos próprios ou no catálogo de ativos
  1. No Studio, selecione Modelos na navegação à esquerda.

  2. Selecione o grupo de modelos que você está publicando.

  3. Escolha o Three dots next to the model group. ícone.

    • Selecione Publicar no catálogo de ativos para publicar no catálogo de ativos.

    • Selecione Publicar no inventário para publicar nos ativos de propriedade do seu grupo.

Use o procedimento a seguir para publicar um ativo de seus ativos de propriedade no catálogo de ativos.

Para publicar um ativo na página SageMaker Ativos
  1. No Studio, navegue até Assets.

  2. Selecione Ativos próprios.

  3. Especifique o nome do seu ativo na barra de pesquisa.

  4. Escolha o ativo.

  5. Selecione Publish.

Você pode usar o SDK código SageMaker Python a seguir para publicar um grupo de recursos ou um grupo de pacotes de modelos. O código pressupõe que você já tenha criado o grupo de recursos ou o grupo de pacotes de modelos.

from sagemaker.asset import AssetManager publisher = AssetPublisher() publisher.publish_to_catalog(name-of-your-feature-group-or-model-package)

Etapa 3: gerenciar solicitações de acesso

Depois de publicar um ativo, talvez usuários fora do seu projeto queiram acessá-lo. Você pode fornecer, rejeitar ou revogar solicitações de acesso. Você também pode excluir ativos para disponibilizar somente a fonte de dados subjacente para você.

Use o procedimento a seguir para responder às solicitações de assinatura.

Para aprovar solicitações de assinatura
  1. Navegue até a página SageMaker Ativos.

  2. Escolha Gerenciar ativos.

  3. Selecione Solicitações de assinatura recebidas.

    • (Opcional) Escolha Aprovar e forneça o motivo.

    • (Opcional) Escolha Rejeitar.

Você pode revogar o acesso a um ativo que você aprovou anteriormente. Se você optar por revogar o acesso, os usuários perderão o acesso ao ativo e ao ativo subjacente. source. Use o procedimento a seguir para revogar o acesso.

Para revogar o acesso
  1. Navegue até a página SageMaker Ativos.

  2. Escolha Gerenciar ativos.

  3. Selecione Solicitações de assinatura recebidas.

  4. Selecione a guia Aprovado.

  5. Escolha Revogar ao lado do ativo.

Você também pode cancelar a publicação de ativos, fazendo com que eles apareçam apenas como ativos próprios. Os ativos não estarão visíveis no catálogo de recursos, mas as pessoas cujas solicitações de assinatura você aprovou ainda poderão acessá-las.

Para cancelar a publicação de um ativo
  1. Navegue até a página SageMaker Ativos.

  2. Em Ativos próprios, selecione o ativo que você está cancelando a publicação.

  3. Escolha Unpublish (Cancelar publicação).

Você também pode excluir ativos da mesma página em que você cancela a publicação. A exclusão de um ativo não exclui a fonte de dados. A exclusão do ativo só torna o ativo invisível para os outros membros do seu projeto ou organização.

Etapa 4: encontrar ativos e solicitar acesso a eles

Você pode solicitar acesso aos ativos que outros usuários publicaram no catálogo de recursos. Se eles aprovarem a solicitação de assinatura, você terá acesso à fonte de dados subjacente.

Na parte superior da página SageMaker Ativos, você pode especificar uma consulta de pesquisa para encontrar ativos que outros usuários da sua organização publicaram. Você também pode selecionar um tipo de ativo para visualizar todos os ativos publicados desse tipo. Por exemplo, você pode selecionar Glue Table para ver todas as AWS Glue tabelas publicadas.

Você também pode visualizar o tipo de ativo diretamente abaixo do nome do ativo. A seguir estão os nomes disponíveis para os tipos de ativos:

  • Tabela Redshift

  • Tabela Glue

  • Modelos

  • Grupo de recursos

nota

Os grupos de recursos nas seguintes lojas têm o tipo de tabela Glue:

  • Off-line

  • Off-line e online

Para fazer uma solicitação de assinatura
  1. Navegue até a página SageMaker Ativos.

    • Na barra de pesquisa, especifique o nome do ativo e escolha Pesquisar.

    • Em Tipos, selecione o tipo de ativo e encontre um ativo que você está acessando no catálogo de recursos.

  2. Escolha o ativo.

  3. Escolha Assinar.

  4. Forneça um motivo para a solicitação.

  5. Selecione Enviar.

Sua solicitação de assinatura aparece em Solicitações de assinatura de saída, em Gerenciar solicitações de ativos. Se o editor do ativo aprovar sua solicitação, ela aparecerá em Ativos inscritos. Agora você pode usar o Amazon Redshift, a AWS Glue tabela ou a fonte de dados de ML em seus fluxos de trabalho de aprendizado de máquina.

Etapa 5: use um ativo compartilhado em seus fluxos de trabalho de aprendizado de máquina

Se sua solicitação de assinatura de um ativo for aprovada, você poderá usá-la em seus fluxos de trabalho de aprendizado de máquina.

Os grupos de recursos aos quais você recebeu acesso aparecem na sua lista de grupos de recursos no Studio.

Os grupos de modelos aos quais você recebeu acesso aparecem na sua lista de grupos de modelos no Studio. Você pode abrir seu grupo de modelos no registro de modelos em SageMaker Ativos. Use o procedimento a seguir para abrir o grupo de modelos no registro do modelo. Ativos subscritos.

Para abrir um grupo de modelos a partir de SageMaker Ativos
  1. Selecione o grupo de modelos.

  2. Escolha Abrir no Registro de Modelos.

Você pode acessar AWS Glue nossas tabelas do Amazon Redshift no Data Wrangler dentro do Canvas. SageMaker SageMaker O Canvas é um aplicativo que permite realizar análises exploratórias de dados (EDA) e treinar modelos sem código. Para obter mais informações sobre o SageMaker Canvas, consulteAmazon SageMaker Canvas.

Você também pode trazer os dados de suas tabelas AWS Glue ou das tabelas do Amazon Redshift para seus cadernos Jupyter usando a extensão. SQL Você pode converter seus dados em dataframes pandas para seus fluxos de trabalho de aprendizado de máquina. Para obter mais informações, consulte Prepare dados com SQL o Studio.