Como depurar um treinamento de modelo em falha - Rekognition

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como depurar um treinamento de modelo em falha

É possível encontrar erros durante o treinamento do modelo. O Amazon Rekognition Custom Labels relata erros de treinamento no console e na resposta do. DescribeProjectVersions

Os erros são terminais (o treinamento não pode continuar) ou não terminais (o treinamento pode continuar). Para erros relacionados ao conteúdo dos conjuntos de dados de treinamento e teste, é possível baixar os resultados da validação (um resumo do manifesto e manifestos de validação de treinamento e teste). Use os códigos de erro nos resultados da validação para encontrar mais informações nesta seção. Esta seção também fornece informações sobre erros do arquivo de manifesto (erros terminais que ocorrem antes da validação do conteúdo do arquivo de manifesto).

nota

Um manifesto é o arquivo usado para armazenar o conteúdo de um conjunto de dados.

É possível corrigir alguns erros usando o console do Amazon Rekognition Custom Labels. Outros erros podem exigir que você atualize os arquivos de manifesto de treinamento ou teste. Talvez seja necessário fazer outras alterações, como IAM permissões. Para obter mais informações, consulte a documentação de erros individuais.

Erros terminais

Os erros terminais interrompem o treinamento de um modelo. Há três categorias de erros terminais de treinamento: erros de serviço, erros de arquivo de manifesto e erros de conteúdo manifesto.

No console, o Amazon Rekognition Custom Labels mostra erros terminais para um modelo na coluna Mensagem de status da página de projetos. O painel de gerenciamento de projetos mostrando a lista de projetos com nome, versões, data de criação, desempenho do modelo e mensagem de status indicando o estado do modelo, como treinamento concluído ou reprovado

Uma captura de tela do painel de gerenciamento de projetos.

Se você estiver usando o AWS SDK, poderá descobrir se ocorreu um erro no arquivo de manifesto do terminal ou no conteúdo do manifesto do terminal verificando a resposta de DescribeProjectVersions. Neste caso, o valor Status é TRAINING_FAILED e o campo StatusMessage contém o erro.

Erros de serviço

Os erros terminais do serviço ocorrem quando o Amazon Rekognition enfrenta um problema de serviço e não consegue continuar o treinamento. Por exemplo, a falha de outro serviço do qual o Amazon Rekognition Custom Labels depende. O Amazon Rekognition Custom Labels relata erros de serviço no console quando o Amazon Rekognition teve um problema de serviço. Se você usar o AWS SDK, os erros de serviço que ocorrem durante o treinamento são gerados como uma InternalServerError exceção por CreateProjectVersionDescribeProjectVersionse.

Se ocorrer um erro de serviço, tente novamente treinar o modelo. Se o treinamento continuar falhando, entre em contato com o AWSSupport e inclua todas as informações de erro relatadas com o erro de serviço.

Lista de erros do arquivo manifesto do terminal

Os erros do arquivo de manifesto são erros terminais, nos conjuntos de dados de treinamento e teste, que ocorrem no nível do arquivo ou em vários arquivos. Os erros do arquivo de manifesto são detectados antes que o conteúdo dos conjuntos de dados de treinamento e teste seja validado. Os erros do arquivo de manifesto impedem o relatório de erros não terminais de validação. Por exemplo, um arquivo de manifesto de treinamento vazio gera um erro O arquivo de manifesto está vazio. Como o arquivo está vazio, nenhum erro de validação de JSON linha não terminal pode ser relatado. O resumo do manifesto também não foi criado.

Você deve corrigir os erros do arquivo de manifesto antes de treinar seu modelo.

A seguir, são listados os erros do arquivo de manifesto.

Lista de erros de conteúdo do manifesto do terminal

Erros de conteúdo manifesto são erros terminais relacionados ao conteúdo em um manifesto. Por exemplo, se você receber o erro O arquivo de manifesto contém imagens rotuladas insuficientes por rótulo para realizar a divisão automática, o treinamento não poderá ser concluído, pois não há imagens rotuladas suficientes no conjunto de dados de treinamento para criar um conjunto de dados de teste.

Além de ser relatado no console e na resposta do DescribeProjectVersions, o erro é relatado no resumo do manifesto junto com quaisquer outros erros terminais de conteúdo do manifesto. Para obter mais informações, consulte Noções básicas sobre o resumo do manifesto.

Erros de JSON linha não terminal também são relatados em manifestos separados de resultados de validação de treinamento e teste. Os erros de JSON linha não terminais encontrados pelos rótulos personalizados do Amazon Rekognition não estão necessariamente relacionados aos erros de conteúdo manifesto que interrompem o treinamento. Para obter mais informações, consulte Noções básicas sobre treinar e testar manifestos de resultados de validação.

Os erros do arquivo de manifesto devem ser corrigidos antes de treinar seu modelo.

A seguir estão as mensagens de erro para erros de conteúdo manifesto.

Lista de erros de validação de JSON linha não terminal

JSONOs erros de validação de linha não são erros terminais que não exigem que as etiquetas personalizadas do Amazon Rekognition parem de treinar um modelo.

JSONOs erros de validação de linha não são mostrados no console.

Nos conjuntos de dados de treinamento e teste, uma JSON linha representa as informações de treinamento ou teste de uma única imagem. Erros de validação em uma JSON linha, como uma imagem inválida, são relatados nos manifestos de validação de treinamento e teste. O Amazon Rekognition Custom Labels conclui o treinamento usando as outras linhas válidas que estão no manifesto. JSON Para obter mais informações, consulte Noções básicas sobre treinar e testar manifestos de resultados de validação. Para obter informações sobre as regras de validação, consulte Regras de validação para arquivos de manifesto.

nota

O treinamento falha se houver muitos erros JSON de linha.

Recomendamos que você também corrija erros de JSON linha não terminais, pois eles podem causar erros futuros ou afetar o treinamento do modelo.

As etiquetas personalizadas do Amazon Rekognition podem gerar os seguintes erros de validação de linha não terminal. JSON