Criação da função de consolidação de anotações - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação da função de consolidação de anotações

É possível optar por usar sua própria função de consolidação de anotações para determinar os rótulos finais dos objetos rotulados. Existem muitas abordagens possíveis para escrever uma função e a abordagem que você usar dependerá da natureza das anotações a serem consolidadas. Em termos gerais, as funções de consolidação examinam as anotações dos trabalhadores, medem a similaridade entre elas e usam algum tipo de julgamento probabilístico para determinar qual deve ser o rótulo mais provável.

Se quiser usar outros algoritmos para criar funções de consolidação de anotações, você poderá encontrar as respostas do trabalhador na pasta [project-name]/annotations/worker-response do bucket do para o qual você direciona a saída do trabalho.

Avalie a semelhança

Para avaliar a similaridade entre os marcadores, use uma das seguintes estratégias ou use uma que atenda às suas necessidades de rotulagem de dados:

  • Para espaços de rótulo que consistem em categorias discretas e mutuamente exclusivas, como classificação de várias classes, avaliar a similaridade pode ser um processo simples. Os rótulos separados correspondem ou não.

  • Para espaços de rótulo que não possuem valores separados, como anotações de caixa delimitadora, encontre uma ampla medida de similaridade. No caso de caixas delimitadoras, uma dessas medidas é o índice de Jaccard. Ele mede a relação entre a interseção de duas caixas com a união das caixas para avaliar como elas são semelhantes. Por exemplo, se houver três anotações, poderá haver uma função que determine quais anotações representam o mesmo objeto e que devem ser consolidadas.

Avalie o rótulo mais provável

Com uma das estratégias acima em mente, faça algum tipo de julgamento probabilístico sobre o rótulo consolidado. No caso de categorias discretas e mutuamente exclusivas, isso pode ser simples. Uma das maneiras mais comuns de fazer isso é obter os resultados de uma votação majoritária entre as anotações. Isso pondera as anotações igualmente.

Algumas abordagens tentam estimar a precisão de diferentes anotadores e pesam suas anotações em proporção à probabilidade de correção. Um exemplo disso é o método Maximização de Expectativas, que é usado na função de consolidação padrão do Ground Truth para anotações de várias classes.

Para obter mais informações sobre como criar uma função de consolidação de anotações, consulte Processando com AWS Lambda.