Detectar rótulos personalizados em vídeos - Rekognition

Detectar rótulos personalizados em vídeos

O exemplo a seguir mostra como é possível usar DetectCustomLabels com quadros extraídos de um vídeo. O código foi testado com arquivos de vídeo nos formatos mov e mp4.

Como usar DetectCustomLabels com quadros capturados
  1. Se ainda não tiver feito isso, instale e configure a AWS CLI e os AWS SDKs. Para ter mais informações, consulte Etapa 4: configure a AWS CLI e os AWS SDKs.

  2. Certifique-se de que você tem as permissões rekognition:DetectCustomLabels e AmazonS3ReadOnlyAccess. Para ter mais informações, consulte Etapa 4: configure a AWS CLI e os AWS SDKs.

  3. Considere o código de exemplo a seguir. Altere o valor de videoFile para o nome de arquivo de vídeo. Altere o valor de projectVersionArn para o nome do recurso da Amazon (ARN) do seu modelo do Amazon Rekognition Custom Labels.

    # Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved. # SPDX-License-Identifier: Apache-2.0 """ Purpose Shows how to analyze a local video with an Amazon Rekognition Custom Labels model. """ import argparse import logging import json import math import cv2 import boto3 from botocore.exceptions import ClientError logger = logging.getLogger(__name__) def analyze_video(rek_client, project_version_arn, video_file): """ Analyzes a local video file with an Amazon Rekognition Custom Labels model. Creates a results JSON file based on the name of the supplied video file. :param rek_client: A Boto3 Amazon Rekognition client. :param project_version_arn: The ARN of the Custom Labels model that you want to use. :param video_file: The video file that you want to analyze. """ custom_labels = [] cap = cv2.VideoCapture(video_file) frame_rate = cap.get(5) # Frame rate. while cap.isOpened(): frame_id = cap.get(1) # Current frame number. print(f"Processing frame id: {frame_id}") ret, frame = cap.read() if ret is not True: break if frame_id % math.floor(frame_rate) == 0: has_frame, image_bytes = cv2.imencode(".jpg", frame) if has_frame: response = rek_client.detect_custom_labels( Image={ 'Bytes': image_bytes.tobytes(), }, ProjectVersionArn=project_version_arn ) for elabel in response["CustomLabels"]: elabel["Timestamp"] = (frame_id/frame_rate)*1000 custom_labels.append(elabel) print(custom_labels) with open(video_file + ".json", "w", encoding="utf-8") as f: f.write(json.dumps(custom_labels)) cap.release() def add_arguments(parser): """ Adds command line arguments to the parser. :param parser: The command line parser. """ parser.add_argument( "project_version_arn", help="The ARN of the model that you want to use." ) parser.add_argument( "video_file", help="The local path to the video that you want to analyze." ) def main(): logging.basicConfig(level=logging.INFO, format="%(levelname)s: %(message)s") try: # Get command line arguments. parser = argparse.ArgumentParser(usage=argparse.SUPPRESS) add_arguments(parser) args = parser.parse_args() session = boto3.Session(profile_name='custom-labels-access') rekognition_client = session.client("rekognition") analyze_video(rekognition_client, args.project_version_arn, args.video_file) except ClientError as err: print(f"Couldn't analyze video: {err}") if __name__ == "__main__": main()