Use o Amazon SageMaker Ground Truth Plus para rotular dados - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use o Amazon SageMaker Ground Truth Plus para rotular dados

O Amazon SageMaker Ground Truth Plus é um serviço de etiquetagem de dados pronto para uso que usa uma força de trabalho especializada para fornecer anotações de alta qualidade com rapidez e reduzir custos em até 40%. Usando o SageMaker Ground Truth Plus, cientistas de dados e gerentes de negócios, como gerentes de operações de dados e gerentes de programas, podem criar conjuntos de dados de treinamento de alta qualidade sem precisar criar aplicativos de etiquetagem e gerenciar as forças de trabalho de etiquetagem por conta própria. Você pode começar a usar o Amazon SageMaker Ground Truth Plus fazendo o upload de dados junto com os requisitos de rotulagem no Amazon S3.

Por que usar o SageMaker Ground Truth Plus?

Para treinar um modelo de machine learning (ML), os cientistas de dados precisam de conjuntos de dados grandes, de alta qualidade e rotulados. À medida que a adoção do ML cresce, as necessidades de rotulagem aumentam. Isso força os cientistas de dados a passarem semanas criando fluxos de trabalho de rotulagem de dados e gerenciando uma força de trabalho de rotulagem de dados. Infelizmente, isso retarda a inovação e aumenta os custos. Para garantir que os cientistas de dados possam dedicar o seu tempo criando, treinando e implantando modelos de ML, os cientistas de dados normalmente encarregam outras equipes internas, compostas por gerentes de operações de dados e gerentes de programas, de produzir conjuntos de dados de treinamento de alta qualidade. No entanto, essas equipes normalmente não têm acesso às habilidades necessárias para fornecer conjuntos de dados de treinamento de alta qualidade, o que afeta os resultados de ML. Assim sendo, você procura um parceiro de rotulagem de dados que possa ajudá-los a criar conjuntos de dados de treinamento de alta qualidade em grande escala sem consumir seus recursos internos.

Quando você carrega os dados, o SageMaker Ground Truth Plus configura os fluxos de trabalho de rotulagem de dados e os opera em seu nome. A partir daí, uma força de trabalho especializada treinada em uma variedade de tarefas de aprendizado de máquina (ML) executa a rotulagem de dados. SageMaker Atualmente, o Ground Truth Plus oferece dois tipos de mão de obra especializada: uma força de trabalho empregada pela Amazon e uma lista selecionada de fornecedores terceirizados. SageMaker O Ground Truth Plus oferece a flexibilidade de escolher a força de trabalho de etiquetagem. AWS os especialistas selecionam a melhor força de trabalho em etiquetagem com base nos requisitos do seu projeto. Por exemplo, se você precisar de pessoas proficientes em rotular arquivos de áudio, especifique isso nas diretrizes fornecidas ao SageMaker Ground Truth Plus, e o serviço selecionará automaticamente os rotuladores com essas habilidades.

Importante

SageMaker O Ground Truth Plus não suporta dados certificados PHI, PCI ou FedRAMP, e você não deve fornecer esses dados ao Ground Truth Plus. SageMaker

Como funciona o SageMaker Ground Truth Plus?

Há cinco componentes principais em um fluxo de trabalho.

  • Solicitar um projeto

  • Criar uma equipe de projeto

  • Acessando o portal do projeto para monitorar o progresso dos conjuntos de dados de treinamento e revisar os dados rotulados

  • Criação de um lote

  • Recebendo os dados rotulados

Como faço para usar o SageMaker Ground Truth Plus?

Se você é um usuário iniciante do SageMaker Ground Truth Plus, use o Conceitos básicos do Amazon SageMaker Ground Truth Plus. get start. Para acessar o SageMaker Ground Truth Plus usando o console de SageMaker IA, você deve estar no Leste dos EUA (Norte da Virgínia) (us-east-1).