Criar um trabalho de classificação de imagem (Rótulo único) - Amazon SageMaker

Criar um trabalho de classificação de imagem (Rótulo único)

Use uma tarefa de rotulagem de classificação de imagem do Amazon SageMaker Ground Truth quando precisar que os operadores classifiquem as imagens usando rótulos predefinidos especificados. Imagens são exibidas aos operadores, e eles são solicitados a escolher um rótulo para cada uma. Você pode criar um trabalho de rotulagem de classificação de imagem usando a seção do Ground Truth no console do Amazon SageMaker ou a operação CreateLabelingJob.

Importante

Para esse tipo de tarefa, se você criar seu próprio arquivo de manifesto, use "source-ref" para identificar o local de cada arquivo de imagem no Amazon S3 que deseja rotular. Para obter mais informações, consulte Dados de entrada.

Criar um trabalho de rotulagem de classificação de imagem (console)

Você pode seguir as instruções de Criar um trabalho de rotulagem (console) para saber como criar um trabalho de rotulagem de classificação de imagem no console do SageMaker. Na Etapa 10, escolha Imagem no menu suspenso Categoria de tarefa e Classificação de imagem (único rótulo) como o tipo de tarefa.

O Ground Truth fornece uma interface de usuário do operador que se parece com a seguinte para tarefas de rotulagem: Ao criar o trabalho de rotulagem com o console, você especifica instruções para ajudar os operadores a concluírem o trabalho e os rótulos que eles podem escolher.

Exemplo de interface de usuário do operador para rotular tarefas, fornecido pelo Ground Truth.

Criar um trabalho de rotulagem de classificação de imagem (API)

Para criar um trabalho de rotulagem de classificação de imagem, use a operação de CreateLabelingJob de API do SageMaker. Essa API define essa operação para todos os SDKs AWS. Para ver uma lista de SDKs específicos de linguagem compatíveis com essa operação, consulte a seção Veja também do CreateLabelingJob.

Siga as instruções em Criar um trabalho de rotulagem (API) e faça o seguinte enquanto você configura a solicitação:

  • As funções do Lambda de pré-anotação para esse tipo de tarefa terminam com PRE-ImageMultiClass. Para encontrar o ARN do Lambda de pré-anotação de sua região, consulte PreHumanTaskLambdaArn.

  • As funções do Lambda de consolidação de anotações para esse tipo de tarefa terminam com ACS-ImageMultiClass. Para localizar o ARN de consolidação de anotações do ARN do Lambda de sua região, consulte AnnotationConsolidationLambdaArn.

Veja a seguir um exemplo de uma solicitação do SDK Python (Boto3) da AWS para criar um trabalho de rotulagem de dados automatizada na região Leste dos EUA (Norte da Virgínia). Todos os parâmetros em vermelho devem ser substituídos por suas especificações e recursos.

response = client.create_labeling_job( LabelingJobName='example-image-classification-labeling-job', LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string' }, RoleArn='arn:aws:iam::*:role/*, LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', StoppingConditions={ 'MaxHumanLabeledObjectCount': 123, 'MaxPercentageOfInputDatasetLabeled': 123 }, HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-ImageMultiClass, 'TaskKeywords': [ Image classification', ], 'TaskTitle': Image classification task', 'TaskDescription': 'Carefully inspect the image and classify it by selecting one label from the categories provided.', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-ImageMultiClass' }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )

Fornecer um modelo para trabalhos de rotulagem de classificação de imagem

Se você criar um trabalho de rotulagem usando a API, será necessário fornecer um modelo de tarefas de operador em UiTemplateS3Uri. Copie e modifique o modelo a seguir. Modifique somente short-instructions, full-instructions e header.

Faça upload deste modelo para o S3 e forneça o URI do S3 para este arquivo em UiTemplateS3Uri.

<script src="https://assets.crowd.aws/crowd-html-elements.js"></script> <crowd-form> <crowd-image-classifier name="crowd-image-classifier" src="{{ task.input.taskObject | grant_read_access }}" header="please classify" categories="{{ task.input.labels | to_json | escape }}" > <full-instructions header="Image classification instructions"> <ol><li><strong>Read</strong> the task carefully and inspect the image.</li> <li><strong>Read</strong> the options and review the examples provided to understand more about the labels.</li> <li><strong>Choose</strong> the appropriate label that best suits the image.</li></ol> </full-instructions> <short-instructions> <h3><span style="color: rgb(0, 138, 0);">Good example</span></h3> <p>Enter description to explain the correct label to the workers</p> <h3><span style="color: rgb(230, 0, 0);">Bad example</span></h3><p>Enter description of an incorrect label</p> </short-instructions> </crowd-image-classifier> </crowd-form>

Dados de saída de classificação de imagens

Depois de criar um trabalho de rotulagem de classificação de imagem, seus dados de saída serão localizados no bucket do Amazon S3 especificado no parâmetro S3OutputPath ao usar a API ou no campo Local do conjunto de dados de saída da seção Visão geral do trabalho do console.

Para saber mais sobre o arquivo manifesto de saída gerado pelo Ground Truth, e sobre a estrutura do arquivo que o Ground Truth usa para armazenar os dados de saída, consulte Rotulando dados de saída do trabalho.

Para ver um exemplo de arquivo manifesto de saída de um trabalho de rotulagem de classificação de imagem, consulte Saída do trabalho de classificação.