Trabalhos de rotulagem de streaming do Ground Truth - Amazon SageMaker

Trabalhos de rotulagem de streaming do Ground Truth

Se você quiser enviar permanentemente novos objetos de dados para o Amazon SageMaker Ground Truth para serem rotulados, use uma tarefa de rotulagem de streaming. Os trabalhos de etiquetagem de streaming permitem que você:

  • Envie novos objetos do conjunto de dados aos operadores em tempo real usando um trabalho de rotulagem em execução permanente. Os operadores recebem continuamente novos objetos de dados para rotular, desde que a tarefa de rotulagem esteja ativa e novos objetos estejam sendo enviados a ela.

  • Obtenha visibilidade do número de objetos que foram colocados na fila e aguardam para serem rotulados. Use essas informações para controlar o fluxo de objetos de dados enviados para sua tarefa de etiquetagem.

  • Receba dados de etiquetas para objetos de dados individuais em tempo real à medida que os operadores terminarem de rotulá-los.

As trabalhos de etiquetagem de streaming da Ground Truth permanecem ativas até serem interrompidas manualmente ou ficarem ociosas por mais de 10 dias. Você pode enviar intermitentemente novos objetos de dados aos operadores enquanto a tarefa de rotulagem está ativa.

Se você for um novo usuário dos trabalhos de rotulagem de streaming da Ground Truth, é recomendável que você analise Como funciona.

Use Criar um trabalho de rotulagem de streaming para aprender a criar um trabalho de rotulagem de streaming.

nota

Os trabalhos de rotulagem de streaming da Ground Truth são compatíveis somente com a API do SageMaker.

Como funciona

Quando você cria uma tarefa de rotulagem de streaming do Ground Truth, a tarefa permanece ativa até ser interrompida manualmente, permanece ociosa por mais de 10 dias ou não consegue acessar as fontes de dados de entrada. Você pode enviar intermitentemente novos objetos de dados aos operadores enquanto eles estão ativos. Um operador pode continuar recebendo novos objetos de dados em tempo real, desde que o número total de tarefas atualmente disponíveis para o operador seja menor que o valor em MaxConcurrentTaskCount. Caso contrário, o objeto de dados é enviado para uma fila que a Ground Truth cria em seu nome no Amazon Simple Queue Service (Amazon SQS) para processamento posterior. Essas tarefas são enviadas aos operadores assim que o número total de tarefas atualmente disponíveis para um operador ficar abaixo de MaxConcurrentTaskCount. Se um objeto de dados não for enviado a um operador após 14 dias, ele expirará. Você pode visualizar o número de tarefas pendentes na fila e ajustar o número de objetos enviados para o trabalho de etiquetagem. Por exemplo, você pode diminuir a velocidade com que envia objetos para a tarefa de etiquetagem se a lista de pendências de objetos pendentes ultrapassar um limite.