SageMaker Empregos em notebooks - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker Empregos em notebooks

Você pode usar SageMaker a Amazon para criar, treinar e implantar de forma interativa modelos de aprendizado de máquina a partir do seu notebook Jupyter em qualquer ambiente. JupyterLab No entanto, existem vários cenários nos quais você pode querer executar seu notebook como um trabalho programado e não interativo. Por exemplo, talvez você queira criar relatórios de auditoria regulares que analisem todos os trabalhos de treinamento executados em um determinado período de tempo e analisem o valor comercial da implantação desses modelos na produção. Ou talvez você queira ampliar um trabalho de Feature Engineering depois de testar a lógica de transformação de dados em um pequeno subconjunto de dados. Outros os casos de uso comuns são:

  • Programação de trabalhos para monitoramento de oscilação de modelos

  • Explorando o espaço de parâmetros para modelos melhores

Nesses cenários, você pode usar SageMaker Notebook Jobs para criar um trabalho não interativo (que SageMaker é executado como um trabalho de treinamento subjacente) para ser executado sob demanda ou em um cronograma. SageMaker O Notebook Jobs fornece uma interface de usuário intuitiva para que você possa agendar seus trabalhos diretamente JupyterLab escolhendo o widget Notebook Jobs ( Blue icon of a calendar with a checkmark, representing a scheduled task or event. ) em seu notebook. Você também pode agendar seus trabalhos usando o SageMaker PythonSDK, que oferece a flexibilidade de agendar vários trabalhos de notebook em um fluxo de trabalho de pipeline. Você pode executar vários cadernos em paralelo e parametrizar células em seus cadernos para personalizar os parâmetros de entrada.

Esse recurso aproveita os serviços Amazon EventBridge, SageMaker Training e SageMaker Pipelines e está disponível para uso em seu notebook Jupyter em qualquer um dos seguintes ambientes:

  • Instâncias Studio, Studio Lab, Studio Classic ou Notebook

  • Configuração local, como sua máquina local, onde você executa JupyterLab

Pré-requisitos

Para programar um trabalho no notebook, certifique-se de que os seguintes critérios são atendidos:

  • Certifique-se de que seu notebook Jupyter e quaisquer scripts de inicialização ou inicialização sejam independentes em relação aos pacotes de código e software. Caso contrário, seu trabalho não interativo poderá incorrer em erros.

  • Verifique Restrições e considerações se você configurou corretamente o notebook Jupyter, as configurações de rede e as configurações do contêiner.

  • Garanta que seu notebook possa acessar os recursos externos necessários, como EMR clusters da Amazon.

  • Se você estiver configurando Notebook Jobs em um notebook Jupyter local, conclua a instalação. Para obter instruções, consulte Guia de instalação.

  • Se você se conectar a um EMR cluster da Amazon em seu notebook e quiser parametrizar seu comando de EMR conexão da Amazon, deverá aplicar uma solução alternativa usando variáveis de ambiente para transmitir parâmetros. Para obter detalhes, consulte Conecte-se a um EMR cluster da Amazon a partir do seu notebook.

  • Se você se conectar a um EMR cluster da Amazon usando a autenticação Kerberos ou HTTP Basic Auth, deverá usar o AWS Secrets Manager para passar suas credenciais de segurança para o comando de conexão da Amazon. LDAP EMR Para obter detalhes, consulte Conecte-se a um EMR cluster da Amazon a partir do seu notebook.

  • (opcional) Se você quiser que a interface do usuário pré-carregue um script para ser executado na inicialização do notebook, seu administrador deverá instalá-la com uma configuração de ciclo de vida (). LCC Para obter informações sobre como usar um LCC script, consulte Personalizar uma instância do notebook usando um script de configuração do ciclo de vida.