Escolha arquivos de vídeo ou quadros de vídeo para dados de entrada - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Escolha arquivos de vídeo ou quadros de vídeo para dados de entrada

Ao criar um trabalho de detecção de objetos de quadro de vídeo ou rotulagem de rastreamento de objetos, você pode fornecer uma sequência de quadros de vídeo (imagens) ou usar o SageMaker console da Amazon para que o Ground Truth extraia automaticamente os quadros de vídeo dos seus arquivos de vídeo. Use as seguintes seções para saber mais sobre essas opções.

Fornecer quadros de vídeo

Os quadros de vídeo são sequências de imagens extraídas de um arquivo de vídeo. É possível criar um trabalho de rotulagem do Ground Truth para que os operadores rotulem várias sequências de quadros de vídeo. Cada sequência é composta por imagens extraídas de um único vídeo.

Para criar um trabalho de rotulagem usando sequências de quadros de vídeo, você deve armazenar cada sequência usando um prefixo de nome de chave exclusivo no Amazon S3. No console do Amazon S3, os prefixos do nome principais são pastas. Portanto, no console do Amazon S3, cada sequência de quadros de vídeo deve estar localizada em sua própria pasta no Amazon S3.

Por exemplo, se você tiver duas sequências de quadros de vídeo, poderá usar os prefixos do nome da chave sequence1/ e sequence2/ identificar suas sequências. Neste exemplo, as sequências podem estar localizadas em s3://amzn-s3-demo-bucket/video-frames/sequence1/ e s3://amzn-s3-demo-bucket/video-frames/sequence2/.

Se você estiver usando o console do Ground Truth para criar um arquivo manifesto de entrada, todos os prefixos de nome de chave de sequência devem estar no mesmo local no Amazon S3. Por exemplo, no console do Amazon S3, cada sequência pode estar em uma pasta em s3://amzn-s3-demo-bucket/video-frames/. Neste exemplo, a primeira sequência de quadros de vídeo (imagens) pode estar localizada em s3://amzn-s3-demo-bucket/video-frames/sequence1/ e a segunda sequência pode estar localizada em s3://amzn-s3-demo-bucket/video-frames/sequence2/.

Importante

Mesmo que você tenha apenas uma única sequência de quadros de vídeo que deseja que os operadores rotulem, essa sequência deve ter um prefixo do nome de chave no Amazon S3. Se você estiver usando o console Amazon S3, isso significa que a sequência está localizada em uma pasta. Ela não pode estar localizada na raiz do bucket do S3.

Ao criar tarefas de trabalho usando sequências de quadros de vídeo, o Ground Truth usa uma sequência por tarefa. Em cada tarefa, Ground Truth ordena seus quadros de vídeo usando a ordem binária UTF-8.

Por exemplo, os quadros de vídeo podem estar na seguinte ordem no Amazon S3:

[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]

Eles são organizados na mesma ordem na tarefa do operador: 0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg.

Os quadros também podem ser ordenados usando uma convenção de nomenclatura como a seguinte:

[frame1.jpg, frame2.jpg, ..., frame11.jpg]

Nesse caso, frame10.jpg e frame11.jpg vêm antes de frame2.jpg na tarefa do operador. O operador vê os quadros de vídeo na seguinte ordem: frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg.

Fornecer arquivos de vídeo

Você pode usar o recurso de divisão de quadros do Ground Truth ao criar uma nova tarefa de rotulagem no console para extrair quadros de vídeo de arquivos de vídeo (MP4arquivos). Uma série de quadros de vídeo extraídos de um único arquivo de vídeo é chamada de sequência de quadros de vídeo.

É possível fazer com que o Ground Truth extraia automaticamente todos os quadros, até 2.000, do vídeo ou pode especificar uma frequência para a extração de quadros. Por exemplo, você pode fazer com que o Ground Truth faça a extração a cada 10 quadros de vídeos.

É possível fornecer até 50 vídeos ao usar a configuração automatizada de dados para extrair quadros. No entanto, o arquivo manifesto de entrada não pode fazer referência a mais de 10 arquivos de sequência de quadros de vídeo ao criar um trabalho de rastreamento de objetos de quadro de vídeo e rotulagem de detecção de objetos de quadro de vídeo. Se você usar a ferramenta do console de configuração automatizada de dados para extrair quadros de vídeo de mais de 10 arquivos de vídeo, precisará modificar o arquivo manifesto gerado pela ferramenta ou criar um novo para incluir 10 arquivos de sequência de quadros de vídeo ou menos. Para saber mais sobre essas cotas, consulte Nuvem de pontos 3D e cotas de trabalho para etiquetagem de quadros de vídeo.

Para usar a ferramenta de extração de quadros de vídeo, consulte Configurar dados de entrada automatizada de quadros de vídeo.

Quando todos os quadros de vídeo tiverem sido extraídos com sucesso dos vídeos, você verá o seguinte no local de entrada do conjunto de dados do S3:

  • Um prefixo do nome da chave (uma pasta no console do Amazon S3) com o nome de cada vídeo. Cada um desses prefixos leva a:

    • Uma sequência de quadros de vídeo extraída do vídeo usada para nomear esse prefixo.

    • Um arquivo de sequência usado para identificar todas as imagens que compõem essa sequência.

  • Um arquivo manifesto de entrada com uma extensão .manifest. Isso identifica todos os arquivos de sequência que serão usados para criar o trabalho de rotulagem.

Todos os quadros extraídos de um único arquivo de vídeo são usados para uma tarefa de rotulagem. Se você extrair quadros de vídeo de vários arquivos de vídeo, várias tarefas serão criadas para o trabalho de rotulagem, uma para cada sequência de quadros de vídeo.

O Ground Truth armazena cada sequência de quadros de vídeo que ele extrai no local do Amazon S3 para conjuntos de dados de entrada usando um prefixo de nome de chave exclusivo. No console do Amazon S3, os prefixos do nome principais são pastas.