As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Agende seus fluxos de trabalho de ML
Com a Amazon, SageMaker você pode gerenciar todo o seu fluxo de trabalho de ML ao criar conjuntos de dados, realizar transformações de dados, criar modelos a partir de dados e implantar seus modelos em endpoints para inferência. Se você executar qualquer subconjunto de etapas do seu fluxo de trabalho periodicamente, também poderá optar por executar essas etapas em um cronograma. Por exemplo, você pode querer agendar um trabalho no SageMaker Canvas para executar uma transformação em novos dados a cada hora. Em outro cenário, talvez você queira agendar um trabalho semanal para monitorar o desvio do modelo implantado. Você pode especificar uma programação recorrente de qualquer intervalo de tempo — você pode iterar a cada segundo, minuto, diariamente, semanalmente, mensalmente ou na 3ª sexta-feira de cada mês às 15h.
Os cenários a seguir resumem as opções disponíveis para você, dependendo do seu caso de uso.
Caso de uso 1: crie e agende seu fluxo de trabalho de ML em um ambiente sem código. Para iniciantes ou iniciantes SageMaker, você pode usar o Amazon SageMaker Canvas para criar seu fluxo de trabalho de ML e criar execuções programadas usando o agendador baseado na interface do usuário do Canvas.
Caso de uso 2: Crie seu fluxo de trabalho em um único notebook Jupyter e use um agendador sem código. Profissionais experientes de ML podem usar código para criar seu fluxo de trabalho de ML em um notebook Jupyter e usar a opção de agendamento sem código disponível com o widget Notebook Jobs. Se seu fluxo de trabalho de ML consistir em vários notebooks Jupyter, você poderá usar o recurso de agendamento no SDK Python do Pipelines descrito no caso de uso 3.
Caso de uso 3: crie e agende seu fluxo de trabalho de ML usando Pipelines. Usuários avançados podem usar as opções de EventBridge agendamento do Amazon SageMaker Python
ou SDK da Amazon disponíveis com o Pipelines. Você pode criar um fluxo de trabalho de ML composto por etapas que incluem operações com vários SageMaker recursos e AWS serviços, como a AmazonEMR.
Caso de uso 1 | Caso de uso 2 | Caso de uso 3 | |
---|---|---|---|
SageMaker recurso | Processamento de dados do Amazon SageMaker Canvas e agendamento de fluxo de trabalho de ML | Widget de agendamento de trabalhos do Notebook (UI) | Opções de agendamento do SDK Python do Pipelines |
Descrição | Com o Amazon SageMaker Canvas, você pode programar execuções automáticas das etapas de processamento de dados e, em um procedimento separado, atualizações automáticas do conjunto de dados. Você também pode programar indiretamente todo o fluxo de trabalho de ML definindo uma configuração que executa uma previsão em lote sempre que um conjunto de dados específico for atualizado. Tanto para processamento automatizado de dados quanto para atualizações de conjuntos de dados, o SageMaker Canvas fornece um formulário básico em que você seleciona uma hora e data de início e um intervalo de tempo entre as execuções (ou uma expressão cron se você agendar uma etapa de processamento de dados). Para obter mais informações sobre como programar etapas de processamento de dados, consulteCrie um cronograma para processar automaticamente novos dados. Para obter mais informações sobre como agendar atualizações de predição de conjuntos de dados e lotes, consulteComo gerenciar automações. | Se você criou seu processamento de dados e fluxo de trabalho de pipeline em um único notebook Jupyter, você pode usar o widget Notebook Jobs para executar seu notebook sob demanda ou de acordo com um cronograma. O widget Notebook Jobs exibe um formulário básico em que você especifica o tipo de computação, o cronograma de execução e as configurações personalizadas opcionais. Você define sua programação de execução selecionando um intervalo com base no tempo ou inserindo uma expressão cron. O widget é instalado automaticamente no Studio, ou você pode realizar uma instalação adicional para usar esse recurso em seu JupyterLab ambiente local. Para obter mais informações sobre trabalhos do Notebook, consulteSageMaker Empregos em notebooks. | Você pode usar os recursos de agendamento no SageMaker SDK se tiver implementado seu fluxo de trabalho de ML com Pipelines. Seu pipeline pode incluir etapas como ajuste fino, processamento de dados e implantação. O Pipelines oferece suporte a duas maneiras de programar seu funil. Você pode criar uma EventBridge regra da Amazon ou usar o SageMaker SDK PipelineSchedule |
Otimizado para | Fornece uma opção de agendamento para um fluxo de trabalho do SageMaker Canvas ML | Fornece uma opção de agendamento baseada em interface de usuário para fluxos de trabalho de ML baseados em notebooks Jupyter | Fornece uma opção de EventBridge agendamento SageMaker SDK ou para fluxos de trabalho de ML |
Considerações | Você pode agendar seu fluxo de trabalho com a estrutura sem código do Canvas, mas as atualizações do conjunto de dados e as atualizações de transformação em lote podem lidar com até 5 GB de dados. | Você pode agendar um caderno usando o formulário de agendamento baseado em interface de usuário, mas não vários cadernos, no mesmo trabalho. Para programar vários notebooks, use a solução SDK baseada em código do Pipelines descrita no caso de uso 3. | Você pode usar os recursos de agendamento mais avançados (SDKbaseados) fornecidos pelo Pipelines, mas precisa consultar a API documentação para especificar as opções corretas, em vez de selecionar em um menu de opções baseado em UI. |
Ambiente recomendado | Amazon SageMaker Canvas | Estúdio, JupyterLab ambiente local | Estúdio, JupyterLab ambiente local, qualquer editor de código |
Recursos adicionais
SageMaker oferece as seguintes opções adicionais para agendar seus fluxos de trabalho.
O que é o Amazon EventBridge Scheduler? . As opções de agendamento discutidas nesta seção incluem opções pré-criadas disponíveis no SageMaker Canvas, Studio e Python SageMaker. SDK Todas as opções ampliam os recursos da Amazon EventBridge, e você também pode criar sua própria solução de agendamento personalizada com EventBridge.
Execuções programadas e baseadas em eventos para pipelines do Processador de atributos. Com o processamento de SageMaker recursos da Amazon Feature Store, você pode configurar seus pipelines de processamento de recursos para serem executados de acordo com uma programação ou como resultado de outro evento de AWS serviço.