Restrições e considerações - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Restrições e considerações

Analise as restrições a seguir para garantir que os trabalhos do notebook sejam concluídos com êxito. O Studio usa o Papermill para executar notebooks. Talvez seja necessário atualizar os notebooks Jupyter para se alinharem aos requisitos do Papermill. Também há restrições no conteúdo dos LCC scripts e detalhes importantes a serem entendidos em relação à VPC configuração.

JupyterLab versão

JupyterLab as versões 3.0 e superiores são suportadas.

Instalação de pacotes que exigem a reinicialização do kernel

O Papermill não suporta chamadas pip install para instalar pacotes que exijam a reinicialização do kernel. Nessa situação, use pip install em um script de inicialização. Para uma instalação de pacote que não exija a reinicialização do kernel, você ainda pode pip install incluí-la no notebook.

Nomes de kernel e idioma registrados no Jupyter

O Papermill registra um tradutor para kernels e idiomas específicos. Se você trouxer sua própria instância (BYOI), use um nome de kernel padrão, conforme mostrado no seguinte trecho:

papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)

Parâmetros e limites variáveis de ambiente

Parâmetros e limites variáveis de ambiente. Quando você cria seu trabalho de notebook, ele recebe os parâmetros e as variáveis de ambiente que você especifica. É possível passar até 100 parâmetros. Cada nome de parâmetro pode ter até 256 caracteres e o valor associado pode ter até 2500 caracteres. Se você passar variáveis de ambiente, poderá transmitir até 28 variáveis. O nome da variável e o valor associado podem ter até 512 caracteres. Se você precisar de mais de 28 variáveis de ambiente, use variáveis de ambiente adicionais em um script de inicialização que não tenha limite no número de variáveis de ambiente que você pode usar.

Visualizando tarefas e definições de tarefas

Visualizando trabalhos e definições de trabalhos. Se você agendar o trabalho do notebook na interface do Studio no JupyterLab notebook, poderá visualizar os trabalhos do notebook e as definições do trabalho do notebook na interface do usuário do Studio. Se você agendou seu trabalho no notebook com o SageMaker PythonSDK, poderá visualizar somente seus trabalhos — a etapa de trabalho do notebook SageMaker SDK Python não cria definições de trabalho. Para visualizar seus trabalhos, você também precisa fornecer tags adicionais à instância da etapa de trabalho do notebook. Para obter detalhes, consulte Visualize suas tarefas de notebook no painel do Studio UI.

Imagem

Você precisa gerenciar as restrições de imagem, dependendo se você executa trabalhos de notebook no Studio ou a etapa de trabalho de SDK notebook SageMaker Python em um pipeline.

Restrições de imagem para trabalhos de SageMaker notebook (Studio)

Suporte de imagem e kernel. O driver que inicia seu trabalho no notebook pressupõe o seguinte:

  • Um ambiente de execução básico do Python é instalado nas imagens Studio ou bring-your-own (BYO) e é o padrão no shell.

  • O ambiente de execução básico do Python inclui o cliente Jupyter com as especificações do kernel configuradas corretamente.

  • O ambiente de execução básico do Python inclui a função pip para que o trabalho do notebook possa instalar dependências do sistema.

  • Para imagens com vários ambientes, seu script de inicialização deve mudar para o ambiente adequado específico do kernel antes de instalar pacotes específicos do notebook. Você deve voltar para o ambiente de tempo de execução padrão do Python, se for diferente do ambiente de tempo de execução do kernel, depois de configurar o ambiente de tempo de execução do Python do kernel.

O driver que inicia seu trabalho no notebook é um script bash, e o Bash v4 deve estar disponível em /bin/bash.

Privilégios de root em bring-your-own-images (BYOI). Você deve ter privilégios de root em suas próprias imagens do Studio, seja como usuário root ou por meio de sudo acesso. Se você não for um usuário root, mas estiver acessando os privilégios de root por meio de sudo, use 1000/100 como o UID/GID.

Restrições de imagem para trabalhos em notebooks Python SageMaker SDK

A etapa de trabalho do notebook suporta as seguintes imagens:

  • SageMaker Imagens de distribuição listadas em SageMaker Imagens da Amazon disponíveis para uso com o Studio Classic.

  • Uma imagem personalizada com base nas imagens de SageMaker distribuição na lista anterior. Use uma imagem de SageMaker distribuição como base.

  • Uma imagem personalizada (BYOI) pré-instalada com dependências de trabalho do notebook (ou seja,. sagemaker-headless-execution-driver Sua imagem deve atender aos seguintes requisitos:

    • A imagem vem pré-instalada com dependências de trabalho do notebook.

    • Um ambiente de execução básico do Python está instalado e é padrão no ambiente shell.

    • O ambiente de execução básico do Python inclui o cliente Jupyter com as especificações do kernel configuradas corretamente.

    • Você tem privilégios de root, seja como usuário root ou por meio de sudo acesso. Se você não for um usuário root, mas estiver acessando os privilégios de root por meio de sudo, use 1000/100 como o UID/GID.

VPCsub-redes usadas durante a criação de empregos

Se você usa umVPC, o Studio usa suas sub-redes privadas para criar seu trabalho. Especifique de uma a cinco sub-redes privadas (e de 1 a 15 grupos de segurança).

Se você usar um VPC com sub-redes privadas, deverá escolher uma das seguintes opções para garantir que a tarefa do notebook possa se conectar a serviços ou recursos dependentes:

  • Se o trabalho precisar acessar um AWS serviço que ofereça suporte a VPC endpoints de interface, crie um endpoint para se conectar ao serviço. Para obter uma lista de serviços que oferecem suporte a endpoints de interface, consulte AWS serviços que se integram com AWS PrivateLink. Para obter informações sobre como criar um VPC endpoint de interface, consulte Acessar um AWS serviço usando um VPC endpoint de interface. No mínimo, um gateway de VPC endpoint do Amazon S3 deve ser fornecido.

  • Se uma tarefa de notebook precisar acessar um AWS serviço que não ofereça suporte a VPC endpoints de interface ou a um recurso externo AWS, crie um NAT gateway e configure seus grupos de segurança para permitir conexões de saída. Para obter informações sobre como configurar um NAT gateway para vocêVPC, consulte VPCcom sub-redes públicas e privadas (NAT) no Guia do usuário da Amazon Virtual Private Cloud.

Limites do serviço

Como o agendador de tarefas do notebook é criado a partir dos EventBridge serviços Pipelines, SageMaker Training e Amazon, seus trabalhos de notebook estão sujeitos às cotas específicas do serviço. Se você exceder essas cotas, poderá ver mensagens de erro relacionadas a esses serviços. Por exemplo, há limites para quantos pipelines você pode executar ao mesmo tempo e quantas regras você pode configurar para um único barramento de eventos. Para obter mais informações sobre SageMaker cotas, consulte Amazon SageMaker Endpoints and Quotas. Para obter mais informações sobre EventBridge cotas, consulte Amazon EventBridge Quotas.