Configuração manual de dados de entrada - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configuração manual de dados de entrada

Escolha a opção de configuração manual de dados se você tiver criado arquivos de sequência para cada uma das sequências de quadros de vídeo e um arquivo manifesto listando referências a esses arquivos de sequências.

Criar um arquivo manifesto de entrada de quadros de vídeo

O Ground Truth usa o arquivo manifesto de entrada para identificar a localização do conjunto de dados de entrada ao criar tarefas de rotulagem. Para trabalhos de detecção de objetos de quadro de vídeo e rotulagem de rastreamento de objetos, cada linha no arquivo manifesto de entrada identifica a localização de um arquivo de sequência de quadros de vídeo. Cada arquivo de sequência identifica as imagens incluídas em uma única sequência de quadros de vídeo.

Use esta página para aprender como criar um arquivo de sequência de quadros de vídeo e um arquivo manifesto de entrada para trabalhos de rastreamento de objetos de quadro de vídeo e rotulagem de detecção de objetos.

Se você quiser que o Ground Truth gere automaticamente os arquivos de sequência e arquivo manifesto de entrada, consulte Configuração automatizada de dados de entrada do quadro de vídeo.

Criar um manifesto de entrada de sequência de quadros de vídeo

No arquivo de manifesto de entrada da sequência de quadros de vídeo, cada linha no manifesto é um JSON objeto, com uma "source-ref" chave que faz referência a um arquivo de sequência. Cada arquivo de sequência identifica a localização de uma sequência de quadros de vídeo. Essa é a formatação do arquivo manifesto necessária para todos os trabalhos de rotulagem de quadros de vídeo.

O exemplo a seguir demonstra a sintaxe usada para um arquivo manifesto de entrada.

{"source-ref": "s3://amzn-s3-demo-bucket/example-folder/seq1.json"} {"source-ref": "s3://amzn-s3-demo-bucket/example-folder/seq2.json"}

Criar um arquivo de sequência de quadros de vídeo

Os dados de cada sequência de quadros de vídeo precisam ser armazenados em um objeto JSON de dados. Veja a seguir um exemplo do formato utilizado para um arquivo de sequência. As informações sobre cada quadro são incluídas como um JSON objeto e listadas na frames lista. O seguinte JSON foi expandido para facilitar a leitura.

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

A tabela a seguir fornece detalhes sobre os parâmetros mostrados no exemplo desse código.

Parâmetro

Obrigatório

Valores aceitos

Descrição

seq-no

Sim

Inteiro

O número ordenado da sequência.

prefix

Sim

String

Valores aceitos:

s3://<bucket-name>/<prefix>/

O local do Amazon S3 onde os arquivos de sequência estão localizados.

O prefixo deve terminar com uma barra: /.

number-of-frames

Sim

Inteiro

O número total de quadros incluídos no arquivo de sequência. Esse número deve corresponder ao número total de quadros listados no parâmetro frames na próxima linha.

frames

Sim

Lista de JSON objetos

Obrigatório:

frame-no, frame

Opcional:

unix-timestamp

Uma lista de dados de quadros. O comprimento da lista deve ser igual ao number-of-frames. Na interface do usuário do trabalhador, os quadros em uma sequência são ordenados em ordem binária UTF-8. Para saber mais sobre essa ordem, consulte Fornecer quadros de vídeo.

frame-no

Sim

Inteiro

O número do pedido do quadro. Isso determinará a ordem de um quadro na sequência.

unix-timestamp

Não

Inteiro

O carimbo de data/hora de unix de um quadro. O número de segundos desde 1º de janeiro de 1970 até o UTC momento em que o quadro foi capturado.

frame

Sim

String

O nome de um arquivo de imagem de quadro de vídeo.