As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Use SageMaker Assets para colaborar perfeitamente em projetos de aprendizado de máquina com outras pessoas em sua organização. Com o SageMaker Assets, você e seus colaboradores criam e compartilham modelos e tabelas de dados entre si. Em SageMaker Ativos, esses modelos e tabelas de dados são conhecidos como ativos.
SageMaker Assets é um recurso do Amazon SageMaker Studio. Você ou seu administrador criam um ambiente Studio dentro de um DataZone projeto da Amazon. Para obter mais informações sobre como configurar a Amazon DataZone, consulteConfigurar SageMaker ativos (guia do administrador).
Os ativos são ativos de ML ou ativos de dados. Os ativos de ML são metadados que apontam para o seguinte:
-
Grupos de atributos do arquivo de atributos
-
SageMaker Grupos de modelos de IA
Os grupos de modelos e grupos de atributos subjacentes são as fontes de dados. Se você atualizar um grupo de atributos ou grupo de modelos, o ativo do grupo de modelos ou grupo de atributos será atualizado em um dia.
Os ativos de dados são metadados que apontam para o seguinte:
-
Tabelas do Amazon Redshift
-
AWS Glue tabelas
Para ativos de dados, a fonte de dados é o mecanismo que extrai metadados das tabelas AWS Glue e das tabelas do Amazon Redshift para o ativo. Por exemplo, uma fonte de dados extrai os metadados de uma AWS Glue tabela para o ativo dessa tabela.
Você pode tornar um ativo visível para todos em sua organização publicando-o. Os indivíduos podem revisar os metadados no ativo e solicitar acesso. Se você fornecer acesso, eles terão acesso à fonte subjacente de dados ou tabela de machine learning.
Seu administrador provavelmente lhe deu acesso aos grupos de atributos, grupos de modelos e tabelas. Se ainda não o fizeram, consulte as informações em Configurar SageMaker ativos (guia do administrador) para ajudá-lo a começar.
As seções a seguir fornecem informações de referência para grupos de atributos e grupos de modelos.
A Amazon SageMaker Feature Store fornece um local centralizado para ajudar você a armazenar e gerenciar seus recursos. É um repositório de alto desempenho que você pode usar para engenharia de atributos.
No Feature Store, os atributos são armazenados em um grupo de atributos. Um grupo de atributos é uma coleção de atributos relacionados a um projeto no qual você está trabalhando. Por exemplo, se você estiver trabalhando em um projeto relacionado à previsão de preços de imóveis, um grupo de atributos pode incluir atributos como localização ou número de quartos.
Para obter mais informações sobre como você pode usar grupos de atributos para simplificar o processo de engenharia de atributos, consulte Criar, armazenar e compartilhar atributos com o arquivo de atributos.
Você pode usar grupos de modelos de SageMaker IA no SageMaker Registro de Modelos para organizar e gerenciar diferentes versões dos seus modelos. Você pode comparar as diferentes versões dos modelos para ver qual delas tem melhor desempenho para seu caso de uso. Para obter mais informações sobre o SageMaker Model Registry, consulteImplantação do registro do modelo com o Model Registry.
A seguir, há informações básicas sobre o Amazon Redshift e o AWS Glue.
O Amazon Redshift é um serviço de armazenamento de dados em grande escala que fornece desempenho rápido para consultas em grandes conjuntos de dados. Para obter mais informações sobre o Amazon Redshift, consulte Amazon Redshift sem servidor.
AWS Glue é um serviço de extração, transformação, carregamento (ETL) que você pode usar para simplificar o processo de preparação de dados. Para obter mais informações sobre AWS Glue, consulte O que é AWS Glue?
Você pode usar o editor SQL para conectar AWS Glue bancos de dados do Amazon Redshift e executar consultas. Você pode compartilhar qualquer tabela criada no editor em SageMaker Assets. Para obter mais informações, consulte Preparação de dados com SQL no Studio.
Tópicos
Terminologia e conceitos
Antes de começar a usar o SageMaker Assets, é útil se familiarizar com a terminologia e os conceitos a seguir:
-
Ativo: os metadados que apontam para os modelos ou tabelas de dados que você está compartilhando. Você solicita acesso a um ativo de propriedade de outra pessoa ou compartilha seu ativo com outras pessoas. Você e seus colegas de equipe acessam o ativo e a tabela de dados subjacente ou o modelo associado a ele.
-
Ativos subscritos: para solicitar acesso a um ativo, você envia uma solicitação de inscrição. Se sua solicitação for aprovada, o ativo aparecerá em seus ativos subscritos.
-
Ativos próprios: os ativos que você compartilhou com seus colegas de equipe.
-
Catálogo de ativos: os ativos que você compartilhou com toda a sua organização.
Etapa 1: acessar SageMaker ativos
Acesse SageMaker Ativos para ver seus ativos e compartilhá-los com outras pessoas. Use as seguintes informações para obter ajuda sobre como começar a usá-lo:
Você acessa SageMaker os ativos de um projeto dentro de um DataZone domínio da Amazon. Um projeto é uma colaboração entre você e os membros da sua equipe. Dentro do projeto, você e os outros membros do projeto têm acesso aos ativos que vocês criam no catálogo de inventário. Você pode publicar os ativos no catálogo publicado para torná-los visíveis para outras pessoas em sua organização.
Essas pessoas podem solicitar acesso ao seu ativo. Se você fornecer acesso, eles poderão acessar a fonte de dados atualizada. Por exemplo, se uma pessoa se inscrever em uma AWS Glue tabela que você atualiza, ela pode acessar a AWS Glue tabela atualizada em tempo real.
Use o procedimento a seguir para acessar SageMaker os ativos.
Para acessar SageMaker ativos
-
Abra o DataZone console da Amazon
. -
Selecione Visualizar domínios.
-
Ao lado do domínio que contém seu projeto, escolha Abrir portal de dados.
-
Em Ferramentas de análise, escolha SageMaker AI Studio.
-
Escolha Abrir Amazon SageMaker AI.
-
Escolha Ativos.
Os ativos que foram compartilhados com você estão em Ativos subscritos. Os ativos que você e os membros do seu projeto criam estão em Ativos próprios. Os ativos que você e os outros membros da sua organização publicaram estão no Catálogo de ativos.
Etapa 2: compartilhe ativos e gerencie o acesso a eles
Depois de criar modelos de machine learning, grupos de atributos ou tabelas de dados, você pode torná-los visíveis para as pessoas que colaboram com você no projeto ou sua organização de forma mais ampla. Você pode responder às solicitações de acesso ao ativo. Se você aprovar a solicitação de um indivíduo, ele poderá modificar a fonte de dados subjacente do ativo.
Ao compartilhar um ativo, você tem duas opções:
-
Publicar no catálogo de ativos: tornar o ativo visível para todos em sua organização
-
Publicar no inventário: tornar o ativo visível para todos que trabalham em seu projeto
Se você publicou seu ativo no catálogo de ativos, as pessoas da sua organização poderão encontrá-lo nele. Eles poderão visualizar os metadados do seu ativo e decidir se querem solicitar acesso a eles. Se você aprovar a solicitação, eles terão acesso à fonte de dados subjacente.
Se você publicar no inventário, você e os outros membros do projeto poderão acessar o ativo sem nenhuma ação adicional.
Os ativos publicados no inventário só aparecem em Ativos próprios. Os ativos publicados no catálogo aparecem em Ativos próprios e Catálogo de ativos.
Ao publicar uma tabela de dados, você deve criar uma fonte de dados que extraia os metadados da AWS Glue tabela subjacente ou da tabela do Amazon Redshift para o ativo. Use os procedimentos a seguir para publicar uma tabela AWS Glue ou uma tabela do Amazon Redshift.
Para publicar um ativo em uma AWS Glue tabela, você cria uma fonte de dados para ela e a publica. Uma fonte de dados é o mecanismo que extrai os metadados da AWS Glue tabela para o ativo.
Use o procedimento a seguir para publicar uma AWS Glue tabela.
Para publicar uma AWS Glue tabela
-
Navegue até a página inicial de SageMaker Ativos.
-
Selecione Ativos próprios.
-
Escolha Visualizar fontes de dados.
-
Escolha Criar fonte de dados.
-
Em Nome, especifique um nome para sua fonte de dados.
-
Em Descrição, forneça uma descrição.
-
Em Tipo, selecione AWS Glue.
-
Em Seleção de dados, selecione o banco de dados que contém a AWS Glue tabela.
-
Em Critérios de seleção de tabelas, especifique o nome da tabela.
nota
Embora você possa especificar mais de uma tabela, sugerimos que forneça somente um nome de tabela.
-
Escolha Próximo.
-
-
Em Publicar ativo no catálogo, selecione Sim para publicar no catálogo de ativos.
-
Em Publicar ativo no catálogo, selecione Não para publicar no catálogo de ativos.
-
-
Escolha Próximo.
-
Em Detalhes do ativo, escolha Executar em uma programação ou Executar sob demanda para determinar como os metadados da tabela AWS Glue são inseridos no ativo.
-
(Opcional) Se você escolher Executar em uma programação, especifique o cronograma que extrai os metadados para o ativo.
-
Escolha Próximo.
-
Escolha Criar.
-
(Opcional) Se você não criou um cronograma, escolha Executar para trazer os metadados da tabela AWS Glue para o ativo.
Use os procedimentos a seguir para publicar um ativo para um grupo de atributos ou grupo de pacotes de modelos.
Use o procedimento a seguir para navegar até um grupo de atributos que você criou e publicá-lo em seus ativos próprios ou no catálogo de ativos.
Para publicar o grupo de atributos em seus próprios ativos ou catálogo de ativos
-
No Studio, selecione Dados na navegação à esquerda.
-
Selecione o grupo de atributos que você está publicando.
-
.
-
-
Selecione Publicar no catálogo de ativos para publicar no catálogo de ativos.
-
Selecione Publicar no inventário para publicar nos ativos de propriedade do seu grupo.
-
Use o procedimento a seguir para publicar um ativo de sua propriedade no catálogo de ativos.
Para publicar um ativo na página SageMaker Ativos
-
No Studio, navegue até Ativos.
-
Selecione Ativos próprios.
-
Especifique o nome do seu ativo na barra de pesquisa.
-
Escolha o ativo.
-
Selecione Publish.
Você pode usar o seguinte código do SDK do SageMaker Python para publicar um grupo de recursos ou um grupo de pacotes de modelos. O código pressupõe que você já criou o grupo de atributos ou o grupo de pacotes de modelos.
from sagemaker.asset import AssetManager
publisher = AssetPublisher()
publisher.publish_to_catalog(name-of-your-feature-group-or-model-package
)
Etapa 3: gerencie as solicitações de acesso
Depois de publicar um ativo, talvez os usuários que estão fora do seu projeto queiram acessá-lo. Você pode fornecer, rejeitar ou revogar solicitações de acesso. Você também pode excluir ativos para disponibilizar a fonte de dados subjacente somente para você.
Use o procedimento a seguir para responder às solicitações de assinatura.
Para aprovar uma solicitação de assinatura
-
Navegue até a página SageMaker Ativos.
-
Escolha Gerenciar ativos.
-
Selecione Solicitações de assinatura recebidas.
-
-
(Opcional) Escolha Aprovar e forneça o motivo.
-
(Opcional) Escolha Rejeitar.
-
É possível revogar o acesso a um ativo aprovado anteriormente. Se você optar por revogar o acesso, os usuários perderão o acesso ao ativo e à fonte do ativo subjacente. Use o procedimento a seguir para revogar o acesso.
Para revogar o acesso
-
Navegue até a página SageMaker Ativos.
-
Escolha Gerenciar ativos.
-
Selecione Solicitações de assinatura recebidas.
-
Selecione a guia Aprovado.
-
Escolha Revogar ao lado do ativo.
Você também pode cancelar a publicação de ativos, fazendo com que eles apareçam apenas como ativos próprios. Os ativos não ficarão visíveis no catálogo de recursos, mas as pessoas que tiveram solicitações de assinatura aprovadas por você ainda poderão acessá-los.
Para cancelar a publicação de um ativo
-
Navegue até a página SageMaker Ativos.
-
Em Ativos próprios, escolha o ativo cuja publicação será cancelada.
-
Escolha Cancelar publicação.
Você também pode excluir ativos na mesma página em que cancela a publicação. A exclusão de um ativo não exclui a fonte de dados. A exclusão do ativo só torna o ativo invisível para os outros membros do seu projeto ou organização.
Etapa 4: encontre ativos e solicite acesso a eles
Você pode solicitar acesso aos ativos que outros usuários publicaram no catálogo de recursos. Se eles aprovarem a solicitação de assinatura, você terá acesso à fonte de dados subjacente.
Na parte superior da página SageMaker Ativos, você pode especificar uma consulta de pesquisa para encontrar ativos que outros usuários da sua organização publicaram. Você também pode selecionar um tipo de ativo para visualizar todos os ativos publicados desse tipo. Por exemplo, você pode selecionar Tabela do Glue para ver todas as tabelas AWS Glue publicadas.
Você também pode visualizar o tipo de ativo diretamente abaixo do nome dele. Veja os nomes disponíveis para os tipos de ativo:
-
Tabela do Redshift
-
Tabela Glue
-
Modelos da
-
Grupo de atributos
nota
Os grupos de atributos nos seguintes armazenamentos têm o tipo Tabela do Glue:
-
Off-line
-
Off-line e online
Para fazer uma solicitação de assinatura
-
Navegue até a página SageMaker Ativos.
-
-
Na barra de pesquisa, especifique o nome do ativo e escolha Pesquisar.
-
Em Tipos, selecione o tipo de ativo e encontre um ativo que você está acessando no catálogo de recursos.
-
-
Escolha o ativo.
-
Escolha Assinar.
-
Forneça um motivo para a solicitação.
-
Selecione Enviar.
Sua solicitação de assinatura aparece em Solicitações de assinatura de saída, em Gerenciar solicitações de ativos. Se o publicador do ativo aprovar sua solicitação, ele aparecerá em Ativos subscritos. Agora você pode usar o Amazon Redshift, a AWS Glue tabela ou a fonte de dados de ML em seus fluxos de trabalho de aprendizado de máquina.
Etapa 5: use um ativo compartilhado em seus fluxos de trabalho de machine learning
Se sua solicitação de assinatura de um ativo for aprovada, você poderá usá-lo em seus fluxos de trabalho de machine learning.
Os grupos de atributos aos quais você recebeu acesso aparecem na sua lista de grupos de atributos no Studio.
Os grupos de modelos aos quais você recebeu acesso aparecem na sua lista de grupos de modelos no Studio. Você pode abrir seu grupo de modelos no registro de modelos em SageMaker Ativos. Use o procedimento a seguir para abrir o grupo de modelos no registro do modelo. Ativos subscritos.
Para abrir um grupo de modelos a partir de SageMaker Ativos
-
Selecione o grupo de modelos.
-
Escolha Abrir no registro de modelos.
Você pode acessar AWS Glue nossas tabelas do Amazon Redshift no Data Wrangler dentro do Canvas. SageMaker SageMaker O Canvas é um aplicativo que permite realizar análise exploratória de dados (EDA) e treinar modelos sem código. Para obter mais informações sobre o SageMaker Canvas, consulteAmazon SageMaker Canvas.
Você também pode trazer os dados de suas tabelas AWS Glue ou das tabelas do Amazon Redshift para seus notebooks Jupyter usando a extensão SQL. Você pode converter seus dados em dataframes pandas para seus fluxos de trabalho de machine learning. Para obter mais informações, consulte Preparação de dados com SQL no Studio.