As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Crie uma instância de SageMaker notebook da Amazon
Importante
Políticas personalizadas do IAM que permitem que o Amazon SageMaker SageMaker Studio ou o Amazon Studio Classic criem SageMaker recursos da Amazon também devem conceder permissões para adicionar tags a esses recursos. A permissão para adicionar tags aos recursos é necessária porque o Studio e o Studio Classic marcam automaticamente todos os recursos que eles criam. Se uma política do IAM permitir que o Studio e o Studio Classic criem recursos, mas não permitisse a marcação, erros AccessDenied "" podem ocorrer ao tentar criar recursos. Para obter mais informações, consulte Forneça permissões para marcar recursos de SageMaker IA.
AWS políticas gerenciadas para Amazon SageMaker AIque dão permissões para criar SageMaker recursos já incluem permissões para adicionar tags ao criar esses recursos.
Uma instância de SageMaker notebook da Amazon é uma instância de computação de ML executando o aplicativo Jupyter Notebook. SageMaker A IA gerencia a criação da instância e dos recursos relacionados. Use os cadernos Jupyter em sua instância de caderno para:
-
preparar e processar dados;
-
escrever código para treinar modelos;
-
implante modelos na hospedagem de SageMaker IA
-
Testar ou validar os modelos
Para criar uma instância de notebook, use o console de SageMaker IA ou o CreateNotebookInstance
API.
O tipo de instância de caderno que você escolher depende de como você a usa. Verifique se a instância de caderno não está vinculada à memória, CPU ou IO. Se você planeja carregar um conjunto de dados na memória na instância de caderno para explorar ou pré-processar, recomendamos optar pelo tipo de instância com memória RAM suficiente para o conjunto de dados. Isso exigiria uma instância com pelo menos 16 GB de memória (.xlarge ou superior). Se você planeja usar o caderno para pré-processamento intensivo de computação, recomendamos optar por uma instância otimizada para computação, como c4 ou c5.
Uma prática recomendada ao usar um SageMaker notebook é usar a instância do notebook para orquestrar outros AWS serviços. Por exemplo, você pode usar a instância de caderno para gerenciar o processamento de grandes conjuntos de dados. Para fazer isso, faça chamadas para o AWS Glue for ETL (extrair, transformar e carregar) ou para o Amazon EMR para mapeamento e redução de dados usando o Hadoop. Você pode usar AWS serviços como formas temporárias de computação ou armazenamento para seus dados.
Você pode armazenar e recuperar seus dados de treinamento e teste usando um bucket do Amazon Simple Storage Service. Em seguida, você pode usar a SageMaker IA para treinar e criar seu modelo. Como resultado, o tipo de instância do seu caderno não teria influência na velocidade do treinamento e teste do seu modelo.
Depois de receber a solicitação, a SageMaker IA faz o seguinte:
-
Cria uma interface de rede — se você escolher a configuração opcional de VPC SageMaker , a IA criará a interface de rede em sua VPC. Ele usa o ID da sub-rede que você fornece na solicitação para determinar em qual zona de disponibilidade criar a sub-rede. SageMaker A IA associa o grupo de segurança que você fornece na solicitação à sub-rede. Para obter mais informações, consulte Conectar uma instância de caderno em uma VPC aos recursos externos.
-
Lança uma instância de computação de ML — a SageMaker IA inicia uma instância de computação de ML em uma SageMaker VPC de IA. SageMaker A IA executa as tarefas de configuração que permitem gerenciar sua instância do notebook. Se você especificou sua VPC, a SageMaker IA habilita o tráfego entre sua VPC e a instância do notebook.
-
Instala pacotes e bibliotecas do Anaconda para plataformas comuns de aprendizado profundo — a SageMaker IA instala todos os pacotes do Anaconda incluídos no instalador. Para obter mais informações, consulte a lista de pacotes do Anaconda
. SageMaker A IA também instala as bibliotecas de aprendizado MXNet profundo TensorFlow e do Apache. -
Anexa um volume de armazenamento de ML — a SageMaker AI anexa um volume de armazenamento de ML à instância de computação de ML. Você pode usar o volume como uma área de trabalho para limpar o conjunto de dados de treinamento ou armazenar temporariamente a validação, o teste ou outros dados. Escolha qualquer tamanho entre 5 GB e 16384 GB, em incrementos de 1 GB, para o volume. O padrão é 5 GB. Os volumes de armazenamento de ML são criptografados, então a SageMaker IA não pode determinar a quantidade de espaço livre disponível no volume. Por isso, você pode aumentar o tamanho do volume ao atualizar uma instância do caderno, mas não pode diminuir o tamanho do volume. Se você deseja diminuir o tamanho do volume de armazenamento do ML em uso, crie uma nova instância do caderno com o tamanho desejado.
Somente os arquivos e dados salvos na pasta
/home/ec2-user/SageMaker
persistem entre sessões de instância de caderno. Os arquivos e dados salvos fora desse diretório são sobrescritos quando a instância de caderno é interrompida e reiniciada. Cada diretório /tmp da instância de caderno fornece um mínimo de 10 GB de armazenamento em um armazenamento de instância. Um armazenamento de instância é um armazenamento ao nível do bloco temporário e não persistente. Quando a instância é interrompida ou reiniciada, a SageMaker IA exclui o conteúdo do diretório. Esse armazenamento temporário faz parte do volume raiz da instância de caderno.Se o tipo de instância usado pela instância do notebook tiver NVMe suporte, os clientes poderão usar os volumes de armazenamento de NVMe instâncias disponíveis para esse tipo de instância. Para instâncias com volumes de NVMe armazenamento, todos os volumes de armazenamento de instâncias são automaticamente anexados à instância na inicialização. Para obter mais informações sobre os tipos de instância e seus volumes de NVMe armazenamento associados, consulte os detalhes do tipo de instância do Amazon Elastic Compute Cloud
. Para disponibilizar o volume de NVMe armazenamento anexado para sua instância de notebook, conclua as etapas em Disponibilizar volumes de armazenamento de instâncias em sua instância. Conclua as etapas com acesso root ou usando um script de configuração do ciclo de vida.
nota
NVMe volumes de armazenamento de instâncias não são armazenamento persistente. Esse armazenamento dura pouco com a instância e deve ser reconfigurado sempre que uma instância com esse armazenamento for iniciada.
-
Copia os exemplos de cadernos Jupyter: esses exemplos de código Python ilustram exercícios de hospedagem e treinamento de modelos usando vários algoritmos e conjuntos de dados de treinamento.
Para criar uma instância de notebook de SageMaker IA:
-
Abra o console de SageMaker IA em https://console.aws.amazon.com/sagemaker/
. -
Escolha Instâncias de caderno e Criar instância de caderno.
-
Na página Criar instância de caderno, forneça as seguintes informações:
-
Em Nome da instância de caderno, digite um nome para a sua instância de caderno.
-
Para o tipo de instância do caderno (caderno), escolha um tamanho de instância adequado ao seu caso de uso. Para obter uma lista dos tipos e cotas de instância compatíveis, consulte Amazon SageMaker AI Service Quotas.
Em Identificador da Plataforma, escolha um tipo de plataforma para criar a instância do caderno. Esse tipo de plataforma determina o sistema operacional e a JupyterLab versão com a qual sua instância do notebook é criada. Para obter informações sobre o tipo de identificador de plataforma, consulte Instâncias de caderno do Amazon Linux 2. Para obter mais informações sobre as versões do JupyterLab, consulte JupyterLab versionamento.
-
(Opcional) A Additional configuration (Configuração adicional) permite que os usuários avançados criem um script shell que pode ser executado quando você cria ou inicia a instância. Esse script, chamado de script de configuração do ciclo de vida, pode ser usado para definir o ambiente do caderno ou para executar outras funções. Para ter mais informações, consulte Personalização de uma instância de SageMaker notebook usando um script LCC.
-
(Opcional) A Additional configuration (Configuração adicional) também permite especificar o tamanho, em GB, do volume de armazenamento ML anexado à instância de caderno. Você pode escolher um tamanho entre 5 GB e 16.384 GB, em incrementos de 1 GB. É possível usar o volume para limpar o conjunto de dados de treinamento ou para armazenar temporariamente a validação ou outros dados.
-
(Opcional) Para Versão mínima do IMDS, selecione uma versão na lista suspensa. Se esse valor for definido como v1, as duas versões poderão ser usadas com a instância do caderno. Se a opção v2 for selecionada, ela só IMDSv2 poderá ser usada com a instância do notebook. Para obter informações sobre IMDSv2, consulte Uso IMDSv2.
nota
A partir de 31 de outubro de 2022, a versão mínima padrão do IMDS para instâncias de SageMaker notebook muda de IMDSv1 para IMDSv2.
A partir de 1º de fevereiro de 2023, IMDSv1 não estará mais disponível para a criação de novas instâncias de notebook. Após essa data, você pode criar instâncias de caderno com uma versão mínima do IMDS de 2.
-
Para o papel do IAM, escolha um papel do IAM existente em sua conta com as permissões necessárias para acessar os recursos de SageMaker IA ou crie um novo papel. Se você escolher Criar uma nova função, a SageMaker AI criará uma função do IAM chamada
AmazonSageMaker-ExecutionRole-
. A política AWS gerenciadaYYYYMMDD
THHmmSS
AmazonSageMakerFullAccess
é anexada à função. A função fornece permissões que permitem que a instância do notebook chame a SageMaker IA e o Amazon S3. -
Em Acesso Root, para habilitar o acesso root a todos os usuários da instância do caderno, escolha Habilitar. Para desabilitar o acesso raiz de usuários, escolha Desabilitar. Se você habilitar o acesso raiz, todos os usuários da instância do caderno terão privilégios de administrador e poderão acessar e editar todos os arquivos.
-
(Opcional) A Encryption key (Chave de criptografia) permite criptografar dados no volume de armazenamento ML anexado à instância de caderno usando uma chave do AWS Key Management Service (AWS KMS). Para armazenar informações confidenciais no volume de armazenamento de ML, considere criptografar as informações.
-
(Opcional) A Network (Rede) permite que você coloque sua instância de caderno dentro de uma nuvem privada virtual (VPC). Uma VPC fornece segurança adicional e restringe o acesso a recursos na VPC por origens fora da VPC. Para obter mais informações sobre VPCs, consulte o Guia do usuário da Amazon VPC.
Para adicionar sua instância de caderno a uma VPC:
-
Escolha o VPC e um. SubnetId
-
Em Grupo de segurança, escolha o security group padrão da sua VPC.
-
Se você precisar que sua instância de caderno tenha acesso à Internet, habilite o acesso direto à Internet. Em Acesso direito à internet, escolha Habilitar. O acesso à Internet pode tornar sua instância de caderno menos segura. Para obter mais informações, consulte Conectar uma instância de caderno em uma VPC aos recursos externos.
-
-
(Opcional) Para associar repositórios Git à instâncias de caderno, escolha um repositório padrão e até três repositórios adicionais. Para obter mais informações, consulte Repositórios Git com SageMaker instâncias do AI Notebook.
-
Escolha Criar instância de caderno.
Em alguns minutos, a Amazon SageMaker AI lança uma instância de computação de ML — nesse caso, uma instância de notebook — e anexa um volume de armazenamento de ML a ela. A instância de caderno conta com a pré-configuração de um servidor de cadernos Jupyter e de um conjunto de bibliotecas da Anaconda. Para obter mais informações, consulte a API
CreateNotebookInstance
.
-
-
Quando o status da instância de caderno é
InService
, no console, a instância de caderno está pronta para ser usada. Escolha Open Jupyter (Abrir o Jupyter) ao lado do nome do caderno para abrir o painel clássico do Jupyter.nota
Para aumentar a segurança da sua instância de SageMaker notebook da Amazon, todos os
domínios regionais são registrados na Lista Pública de Sufixos (notebook
.region
.sagemaker.awsPSL) da Internet. Para maior segurança, recomendamos que você use cookies com um __Host-
prefixo para definir cookies confidenciais para os domínios das instâncias do seu SageMaker notebook. Isso ajuda a defender seu domínio contra tentativas de falsificação de solicitação entre sites (CSRF). Para mais informações, consulte a página Set-Cookieno site de documentação do desenvolvedor mozilla.org . Você pode escolher Abrir JupyterLab para abrir o JupyterLab painel. O painel fornece acesso à sua instância de notebook e exemplos de cadernos de SageMaker IA que contêm orientações completas de código. Essas orientações mostram como usar a SageMaker IA para realizar tarefas comuns de aprendizado de máquina. Para obter mais informações, consulte Cadernos de exemplo de acesso. Para obter mais informações, consulte Controle o acesso root a uma instância do SageMaker notebook.
Para obter mais informações sobre cadernos Jupyter, consulte O caderno Jupyter
.