As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Trabalhe com ativos (guia do usuário)
Use SageMaker Assets para colaborar perfeitamente em projetos de aprendizado de máquina com outras pessoas em sua organização. Com o SageMaker Assets, você e seus colaboradores criam e compartilham modelos e tabelas de dados entre si. Em SageMaker Ativos, esses modelos e tabelas de dados são conhecidos como ativos.
SageMaker Assets é um recurso do Amazon SageMaker Studio. Você ou seu administrador criam um ambiente Studio dentro de um DataZone projeto da Amazon. Para obter mais informações sobre como configurar a Amazon DataZone, consulteConfigurar SageMaker ativos (guia do administrador).
Os ativos são ativos de ML ou ativos de dados. Os ativos de ML são metadados que apontam para o seguinte:
-
Grupos de recursos da Feature Store
-
SageMaker grupos de modelos
Os grupos de modelos e grupos de recursos subjacentes são as fontes de dados. Se você atualizar um grupo de recursos ou grupo de modelos, o ativo do grupo de modelos ou grupo de recursos será atualizado em um dia.
Os ativos de dados são metadados que apontam para o seguinte:
-
Tabelas do Amazon Redshift
-
AWS Glue tabelas
Para ativos de dados, a fonte de dados é o mecanismo que extrai metadados das AWS Glue tabelas e das tabelas do Amazon Redshift para o ativo. Por exemplo, uma fonte de dados extrai os metadados de uma AWS Glue tabela para o ativo dessa tabela.
Você pode tornar um ativo visível para todos em sua organização publicando-o. Os indivíduos podem revisar os metadados no ativo e solicitar acesso. Se você fornecer acesso, eles terão acesso à fonte subjacente de dados ou tabela de aprendizado de máquina.
Seu administrador provavelmente lhe deu acesso aos grupos de recursos, grupos de modelos e tabelas. Caso contrário, consulte as informações Configurar SageMaker ativos (guia do administrador) para ajudar você a começar.
As seções a seguir fornecem informações de referência para grupos de recursos e grupos de modelos.
A Amazon SageMaker Feature Store fornece um local centralizado para ajudar você a armazenar e gerenciar seus recursos. É um repositório de alto desempenho que você pode usar para engenharia de recursos.
Na Feature Store, os recursos são armazenados em um grupo de recursos. Um grupo de recursos é uma coleção de recursos relacionados a um projeto no qual você está trabalhando. Por exemplo, se você estiver trabalhando em um projeto relacionado à previsão de preços de imóveis, um grupo de características pode incluir características como localização ou número de quartos.
Para obter mais informações sobre como você pode usar grupos de recursos para simplificar o processo de engenharia de recursos, consulteCrie, armazene e compartilhe recursos com a Feature Store.
Você pode usar grupos de SageMaker SageMaker modelos no Registro de modelos para organizar e gerenciar diferentes versões de seus modelos. Você pode comparar as diferentes versões dos modelos para ver qual delas tem melhor desempenho para seu caso de uso. Para obter mais informações sobre o SageMaker Model Registry, consulteImplantação de registro de modelo com registro de modelos.
A seguir estão informações básicas sobre o Amazon Redshift e. AWS Glue
O Amazon Redshift é um serviço de armazenamento de dados em grande escala que fornece desempenho rápido de consultas em grandes conjuntos de dados. Para obter mais informações sobre o Amazon Redshift, consulte Amazon Redshift Serverless.
AWS Glue é um serviço de extração, transformação, carregamento (ETL) que você pode usar para simplificar o processo de preparação de dados. Para obter mais informações sobre AWS Glue, consulte O que é AWS Glue?
Você pode usar o SQL editor para conectar AWS Glue bancos de dados do Amazon Redshift e executar consultas. Você pode compartilhar qualquer tabela criada no editor em SageMaker Assets. Para obter mais informações, consulte Prepare dados com SQL o Studio.
Tópicos
Terminologia e conceitos
Antes de começar a usar o SageMaker Assets, é útil se familiarizar com a terminologia e os conceitos a seguir:
-
Ativo — Os metadados que apontam para os modelos ou tabelas de dados que você está compartilhando. Você solicita acesso a um ativo de propriedade de outra pessoa ou compartilha seu ativo com outras pessoas. Você e seus colegas de equipe acessam o ativo e a tabela de dados subjacente ou o modelo associado a ele.
-
Ativos inscritos — Para solicitar acesso a um ativo, você envia uma solicitação de assinatura. Se sua solicitação for aprovada, o ativo aparecerá em seus ativos inscritos.
-
Ativos próprios — Os ativos que você compartilhou com seus colegas de equipe.
-
Catálogo de ativos — os ativos que você compartilhou em toda a sua organização.
Etapa 1: acessar SageMaker ativos
Acesse SageMaker Ativos para visualizar seus ativos e compartilhá-los com outras pessoas. Use as informações a seguir para ajudá-lo a começar a usá-lo.
Você acessa SageMaker os ativos de um projeto dentro de um DataZone domínio da Amazon. Um projeto é uma colaboração entre você e os membros da sua equipe. Dentro do projeto, você e os outros membros do seu projeto têm acesso aos ativos que você e os outros membros da sua equipe criam no catálogo de inventário. Você pode publicar os ativos no catálogo publicado para torná-los visíveis para outras pessoas em sua organização.
Essas pessoas podem solicitar acesso ao seu ativo. Se você fornecer acesso a eles, eles poderão acessar a fonte de dados atualizada. Por exemplo, se uma pessoa se inscrever em uma AWS Glue tabela que você atualiza, ela pode acessar a AWS Glue tabela atualizada em tempo real.
Use o procedimento a seguir para acessar SageMaker os ativos.
Para acessar SageMaker ativos
-
Abra o DataZone console da Amazon
. -
Escolha Exibir domínios.
-
Ao lado do domínio que contém seu projeto, escolha Abrir portal de dados.
-
Em Ferramentas de análise, escolha SageMakerStudio.
-
Escolha Abrir Amazon SageMaker.
-
Escolha Assets (Ativos).
Os ativos que foram compartilhados com você estão em Ativos subscritos. Os ativos que você e os membros do seu projeto criam estão em Ativos próprios. Os ativos que você e os outros membros da sua organização publicaram estão no catálogo de ativos.
Etapa 2: compartilhar ativos e gerenciar o acesso a eles
Depois de criar modelos de aprendizado de máquina, grupos de recursos ou tabelas de dados, você pode torná-los visíveis para as pessoas que colaboram com você em seu projeto ou em sua organização de forma mais ampla. Você pode responder às solicitações de acesso ao ativo. Se você aprovar a solicitação de um indivíduo, ele poderá modificar a fonte de dados subjacente do ativo.
Ao compartilhar um ativo, você tem duas opções:
-
Publicar no catálogo de ativos — Torne o ativo visível para todos em sua organização
-
Publique no inventário — torne o ativo visível para todos que trabalham em seu projeto
Se você publicou seu ativo no catálogo de ativos, as pessoas da sua organização podem encontrá-lo no catálogo de ativos. Eles podem visualizar os metadados do seu ativo e decidir se querem solicitar acesso a eles. Se você aprovar a solicitação, eles terão acesso à fonte de dados subjacente.
Se você publicar no inventário, você e os outros membros do seu projeto poderão acessar o ativo sem nenhuma ação adicional.
Os ativos publicados no inventário só aparecem em Ativos próprios. Os ativos publicados no catálogo aparecem em Ativos próprios e Catálogo de ativos.
Ao publicar uma tabela de dados, você deve criar uma fonte de dados que extraia os metadados da AWS Glue tabela subjacente ou da tabela do Amazon Redshift para o ativo. Use os procedimentos a seguir para publicar uma tabela AWS Glue ou uma tabela do Amazon Redshift.
Use os procedimentos a seguir para publicar um ativo para um grupo de recursos ou grupo de pacotes de modelos.
Use o procedimento a seguir para publicar um ativo de seus ativos de propriedade no catálogo de ativos.
Para publicar um ativo na página SageMaker Ativos
-
No Studio, navegue até Assets.
-
Selecione Ativos próprios.
-
Especifique o nome do seu ativo na barra de pesquisa.
-
Escolha o ativo.
-
Selecione Publish.
Você pode usar o SDK código SageMaker Python a seguir para publicar um grupo de recursos ou um grupo de pacotes de modelos. O código pressupõe que você já tenha criado o grupo de recursos ou o grupo de pacotes de modelos.
from sagemaker.asset import AssetManager publisher = AssetPublisher() publisher.publish_to_catalog(
name-of-your-feature-group-or-model-package
)
Etapa 3: gerenciar solicitações de acesso
Depois de publicar um ativo, talvez usuários fora do seu projeto queiram acessá-lo. Você pode fornecer, rejeitar ou revogar solicitações de acesso. Você também pode excluir ativos para disponibilizar somente a fonte de dados subjacente para você.
Use o procedimento a seguir para responder às solicitações de assinatura.
Para aprovar solicitações de assinatura
-
Navegue até a página SageMaker Ativos.
-
Escolha Gerenciar ativos.
-
Selecione Solicitações de assinatura recebidas.
-
-
(Opcional) Escolha Aprovar e forneça o motivo.
-
(Opcional) Escolha Rejeitar.
-
Você pode revogar o acesso a um ativo que você aprovou anteriormente. Se você optar por revogar o acesso, os usuários perderão o acesso ao ativo e ao ativo subjacente. source. Use o procedimento a seguir para revogar o acesso.
Para revogar o acesso
-
Navegue até a página SageMaker Ativos.
-
Escolha Gerenciar ativos.
-
Selecione Solicitações de assinatura recebidas.
-
Selecione a guia Aprovado.
-
Escolha Revogar ao lado do ativo.
Você também pode cancelar a publicação de ativos, fazendo com que eles apareçam apenas como ativos próprios. Os ativos não estarão visíveis no catálogo de recursos, mas as pessoas cujas solicitações de assinatura você aprovou ainda poderão acessá-las.
Para cancelar a publicação de um ativo
-
Navegue até a página SageMaker Ativos.
-
Em Ativos próprios, selecione o ativo que você está cancelando a publicação.
-
Escolha Unpublish (Cancelar publicação).
Você também pode excluir ativos da mesma página em que você cancela a publicação. A exclusão de um ativo não exclui a fonte de dados. A exclusão do ativo só torna o ativo invisível para os outros membros do seu projeto ou organização.
Etapa 4: encontrar ativos e solicitar acesso a eles
Você pode solicitar acesso aos ativos que outros usuários publicaram no catálogo de recursos. Se eles aprovarem a solicitação de assinatura, você terá acesso à fonte de dados subjacente.
Na parte superior da página SageMaker Ativos, você pode especificar uma consulta de pesquisa para encontrar ativos que outros usuários da sua organização publicaram. Você também pode selecionar um tipo de ativo para visualizar todos os ativos publicados desse tipo. Por exemplo, você pode selecionar Glue Table para ver todas as AWS Glue tabelas publicadas.
Você também pode visualizar o tipo de ativo diretamente abaixo do nome do ativo. A seguir estão os nomes disponíveis para os tipos de ativos:
-
Tabela Redshift
-
Tabela Glue
-
Modelos
-
Grupo de recursos
nota
Os grupos de recursos nas seguintes lojas têm o tipo de tabela Glue:
-
Off-line
-
Off-line e online
Para fazer uma solicitação de assinatura
-
Navegue até a página SageMaker Ativos.
-
-
Na barra de pesquisa, especifique o nome do ativo e escolha Pesquisar.
-
Em Tipos, selecione o tipo de ativo e encontre um ativo que você está acessando no catálogo de recursos.
-
-
Escolha o ativo.
-
Escolha Assinar.
-
Forneça um motivo para a solicitação.
-
Selecione Enviar.
Sua solicitação de assinatura aparece em Solicitações de assinatura de saída, em Gerenciar solicitações de ativos. Se o editor do ativo aprovar sua solicitação, ela aparecerá em Ativos inscritos. Agora você pode usar o Amazon Redshift, a AWS Glue tabela ou a fonte de dados de ML em seus fluxos de trabalho de aprendizado de máquina.
Etapa 5: use um ativo compartilhado em seus fluxos de trabalho de aprendizado de máquina
Se sua solicitação de assinatura de um ativo for aprovada, você poderá usá-la em seus fluxos de trabalho de aprendizado de máquina.
Os grupos de recursos aos quais você recebeu acesso aparecem na sua lista de grupos de recursos no Studio.
Os grupos de modelos aos quais você recebeu acesso aparecem na sua lista de grupos de modelos no Studio. Você pode abrir seu grupo de modelos no registro de modelos em SageMaker Ativos. Use o procedimento a seguir para abrir o grupo de modelos no registro do modelo. Ativos subscritos.
Para abrir um grupo de modelos a partir de SageMaker Ativos
-
Selecione o grupo de modelos.
-
Escolha Abrir no Registro de Modelos.
Você pode acessar AWS Glue nossas tabelas do Amazon Redshift no Data Wrangler dentro do Canvas. SageMaker SageMaker O Canvas é um aplicativo que permite realizar análises exploratórias de dados (EDA) e treinar modelos sem código. Para obter mais informações sobre o SageMaker Canvas, consulteAmazon SageMaker Canvas.
Você também pode trazer os dados de suas tabelas AWS Glue ou das tabelas do Amazon Redshift para seus cadernos Jupyter usando a extensão. SQL Você pode converter seus dados em dataframes pandas para seus fluxos de trabalho de aprendizado de máquina. Para obter mais informações, consulte Prepare dados com SQL o Studio.