Criar um conjunto de dados - Amazon Lookout for Vision

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um conjunto de dados

Um conjunto de dados contém as imagens e os rótulos atribuídos que você usa para treinar e testar um modelo. Você cria o conjunto de dados do seu projeto com o console Amazon Lookout for Vision ou com CreateDataseta operação. As imagens do conjunto de dados devem ser rotuladas de acordo com o tipo de modelo que você deseja criar (classificação de imagem ou segmentação de imagem).

Preparando imagens para um conjunto de dados

Você precisa de uma coleção de imagens para criar um conjunto de dados. Suas imagens devem ser arquivos PNG ou JPEG formatar. O número e o tipo de imagens de que você precisa dependem se seu projeto tem um único conjunto de dados ou conjuntos de dados de treinamento e teste separados.

Exclui um conjunto de dados

Para criar um modelo de classificação de imagens, você precisa do seguinte para começar o treinamento:

  • Pelo menos 20 imagens de objetos normais.

  • Pelo menos 10 imagens de objetos anômalos.

Para criar um modelo de segmentação de imagens, você precisa do seguinte para começar o treinamento:

  • Pelo menos 20 imagens de cada tipo de anomalia.

  • Cada imagem anômala (imagem com tipos de anomalia presentes) deve ter somente um tipo de anomalia.

  • Pelo menos 20 imagens de objetos normais.

Projeto separado de conjunto de dados de treinamento e teste

Para criar um modelo de classificação de imagens, você precisa do seguinte:

  • Pelo menos 10 imagens de objetos normais no conjunto de dados de treinamento.

  • Pelo menos 10 imagens de objetos normais no conjunto de dados de teste.

  • Pelo menos 10 imagens de objetos anômalos no conjunto de dados de teste.

Para criar um modelo de segmentação de imagens, você precisa do seguinte:

  • Cada conjunto de dados precisa de pelo menos 10 imagens de cada tipo de anomalia.

  • Cada imagem anômala (imagem com tipos de anomalia presentes) deve conter somente um tipo de anomalia.

  • Cada conjunto de dados deve ter pelo menos 10 imagens de objetos normais.

Para criar um modelo de maior qualidade, use mais do que o número mínimo de imagens. Se você estiver criando um modelo de segmentação, recomendamos incluir imagens com vários tipos de anomalia, mas elas não são o mínimo que o Lookout for Vision precisa para iniciar o treinamento.

Suas imagens devem ser de um único tipo de objeto. Além disso, você deve ter condições de captura de imagem consistentes, como posicionamento da câmera, iluminação e pose do objeto.

Todas as imagens nos conjuntos de dados de treinamento e teste devem ter as mesmas dimensões. Posteriormente, as imagens que você analisa com seu modelo treinado devem ter as mesmas dimensões das imagens do conjunto de dados de treinamento e teste. Para obter mais informações, consulte Detectar as anomalias de uma imagem.

Todas as imagens de treinamento e teste devem ser imagens exclusivas, preferencialmente de objetos exclusivos. Imagens normais devem capturar as variações normais do objeto que está sendo analisado. Imagens anômalas devem capturar uma amostra diversificada de anomalias.

O Amazon Lookout for Vision oferece exemplos de imagens que você pode usar. Para obter mais informações, consulte Conjunto de dados de classificação de imagens.

Para ver os limites de imagem, consulte Cotas na Amazônia em busca de visão.

Criando o conjuntos de dados

Ao criar o conjunto de dados para seu projeto, você escolhe a configuração inicial do conjunto de dados do seu projeto. Você também escolhe de onde o Lookout for Vision importa as imagens.

Escolha de uma configuração de conjunto de dados para seu projeto

Ao criar o primeiro conjunto de dados em seu projeto, escolha uma das seguintes configurações de conjunto de dados:

  • Conjunto de dados único: um único projeto de conjunto de dados usa um único conjunto de dados para treinar e testar o modelo. O uso de um único conjunto de dados simplifica o treinamento, permitindo que o Amazon Lookout for Vision escolha as imagens de treinamento e teste. Durante o treinamento, o Amazon Lookout for Vision divide internamente o conjunto de dados em um conjunto de dados de treinamento e um conjunto de dados de teste. Você não tem acesso aos conjuntos de dados divididos. Recomendamos usar um único projeto de conjunto de dados para a maioria dos cenários.

  • Conjuntos de dados de treinamento e teste separados: se você quiser um controle mais preciso sobre treinamento, teste e ajuste de desempenho, você pode configurar seu projeto para ter conjuntos de dados de treinamento e teste separados. Use um conjunto de dados de teste separado se quiser controlar as imagens usadas para o teste ou se já tiver um conjunto de imagens de referência que deseja usar.

Você pode adicionar um conjunto de dados de teste a um projeto de conjunto de dados único existente. O único conjunto de dados então se torna o conjunto de dados de treinamento. Se você remover o conjunto de dados de teste de um projeto com conjuntos de dados de treinamento e teste separados, o projeto se tornará um projeto de conjunto de dados único. Para obter mais informações, consulte Excluir um conjunto de dados.

Importar imagens

Ao criar um conjunto de dados, você escolhe de onde importar as imagens. Dependendo de como você importa as imagens, elas podem já estar rotuladas. Se as imagens não forem rotuladas após a criação do conjunto de dados, consulte Rotulagem de imagens.

Você cria um conjunto de dados e importa suas imagens de uma das seguintes maneiras:

  • Importe imagens do computador local. As imagens não estão rotuladas. Você adiciona ou rotula usando o console Lookout for Vision.

  • Importe imagens de um bucket do S3. O Amazon Lookout for Vision pode classificar imagens usando os nomes das pastas para rotular as imagens. Use normal para imagens normais. Use anomaly para imagens anômalas. Você não pode atribuir rótulos de segmentação automaticamente.

  • Importe um arquivo de manifesto do Amazon SageMaker Ground Truth, que inclui imagens rotuladas. Você pode criar e importar seu próprio arquivo de manifesto. Se você tiver muitas imagens, considere usar o serviço de rotulagem SageMaker Ground Truth. Em seguida, você importa o arquivo de manifesto de saída do trabalho do Amazon SageMaker Ground Truth. Se necessário, é possível usar o console Lookout for Vision para adicionar ou alterar rótulos.

Se você estiver usando o AWS SDK, você cria um conjunto de dados com um arquivo de manifesto do Amazon SageMaker Ground Truth. Para obter mais informações, consulte Criação de um conjunto de dados usando um arquivo de manifesto Amazon SageMaker Ground Truth.

Se, depois de criar seu conjunto de dados, suas imagens forem rotuladas, você poderá treinar o modelo. Se as imagens não estiverem rotuladas, adicione as etiquetas de acordo com o tipo de modelo que você deseja criar. Para obter mais informações, consulte Rotulagem de imagens.

Você pode adicionar mais imagens a um conjunto de dados existente. Para obter mais informações, consulte Adicionar imagens ao seu conjunto de dados.