As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
SageMaker Empregos em notebooks
Você pode usar a Amazon SageMaker AI para criar, treinar e implantar de forma interativa modelos de aprendizado de máquina a partir do seu notebook Jupyter em qualquer ambiente. JupyterLab No entanto, existem vários cenários nos quais você pode querer executar seu caderno como um trabalho programado e não interativo. Por exemplo, talvez você queira criar relatórios de auditoria regulares que analisem todos os trabalhos de treinamento executados em um determinado período de tempo e analisem o valor comercial da implantação desses modelos na produção. Ou talvez você queira ampliar um trabalho de Feature Engineering depois de testar a lógica de transformação de dados em um pequeno subconjunto de dados. Outros os casos de uso comuns são:
-
Programação de trabalhos para monitoramento de oscilação de modelos
-
Explorando o espaço de parâmetros para modelos melhores
Nesses cenários, você pode usar SageMaker Notebook Jobs para criar um trabalho não interativo (que a SageMaker IA executa como um trabalho de treinamento subjacente) para ser executado sob demanda ou em um cronograma. SageMaker O Notebook Jobs fornece uma interface de usuário intuitiva para que você possa agendar seus trabalhos diretamente JupyterLab escolhendo o widget Notebook Jobs (
) em seu notebook. Você também pode agendar seus trabalhos usando o SageMaker AI Python SDK, que oferece a flexibilidade de programar vários trabalhos de notebook em um fluxo de trabalho de pipeline. Você pode executar vários cadernos em paralelo e parametrizar células em seus cadernos para personalizar os parâmetros de entrada.
Esse recurso aproveita os serviços Amazon EventBridge, SageMaker Training e Pipelines e está disponível para uso em seu notebook Jupyter em qualquer um dos seguintes ambientes:
-
Instâncias do Studio, Studio Lab, Studio Classic ou Notebook
-
Configuração local, como sua máquina local, onde você executa JupyterLab
Pré-requisitos
Para programar um trabalho no caderno, certifique-se de que os seguintes critérios são atendidos:
-
Certifique-se de que seu caderno Jupyter e quaisquer scripts de inicialização ou inicialização sejam independentes em relação aos pacotes de código e software. Caso contrário, seu trabalho não interativo poderá incorrer em erros.
-
Verifique Restrições e considerações se você configurou corretamente o caderno Jupyter, as configurações de rede e as configurações do contêiner.
-
Garanta que seu caderno possa acessar os recursos externos necessários, como clusters do Amazon EMR.
-
Se você estiver configurando o Notebook Jobs em um caderno Jupyter local, conclua a instalação. Para obter instruções, consulte Guia de instalação.
-
Se você se conectar a um cluster do Amazon EMR em seu caderno e quiser parametrizar seu comando de conexão do Amazon EMR, deverá aplicar uma solução alternativa usando variáveis de ambiente para transmitir parâmetros. Para obter detalhes, consulte Conectar a um cluster do Amazon EMR a partir de seu caderno.
-
Se você se conectar a um cluster do Amazon EMR usando a autenticação Kerberos, LDAP ou HTTP Basic Auth, deverá usar o para passar suas credenciais de segurança AWS Secrets Manager para o comando de conexão do Amazon EMR. Para obter detalhes, consulte Conectar a um cluster do Amazon EMR a partir de seu caderno.
-
(opcional) Se você quiser que a interface do usuário pré-carregue um script para ser executado na inicialização do caderno, seu administrador deverá instalá-la com uma configuração de ciclo de vida (LCC). Para obter informações sobre como usar um script de LCC, consulte Personalizar uma instância do caderno usando um script de configuração de ciclo de vida.