비디오

포커스 모드

비디오 - Amazon Bedrock

전체 비디오 요약 챕터 요약 IAB 분류 전체 오디오 트랜스크립트 비디오의 텍스트 로고 감지 콘텐츠 조정 비디오 표준 출력

BDA는 비디오에 대한 인사이트를 처리하고 생성할 수 있는 표준 출력 세트를 제공합니다. 다음은 각 작업 유형에 대한 자세한 설명입니다.

전체 비디오 요약

전체 비디오 요약은 전체 비디오의 전체 요약을 생성합니다. 비디오 전체에 표시되는 주요 주제, 이벤트 및 정보를 간결한 요약으로 추출합니다. 전체 비디오 요약은 제품 개요, 교육, 뉴스 캐스트, 회화 쇼, 다큐멘터리와 같은 설명 대화가 포함된 콘텐츠에 최적화되어 있습니다. BDA는 전체 비디오 요약 및 장면 요약에서 오디오 신호(예: 화자가 직접 소개) 또는 시각적 신호(예: 프레젠테이션 슬라이드에 화자의 이름이 표시됨)를 기반으로 각 고유한 화자의 이름을 제공하려고 시도합니다. 고유한 화자의 이름이 확인되지 않으면 고유한 번호(예: speaker_0)로 표시됩니다.

챕터 요약

비디오 장 요약은 비디오 내의 개별 장면에 대한 설명 요약을 제공합니다. 비디오 장은 비디오 내에서 일관된 작업 단위 또는 서술을 구성하는 일련의 샷입니다. 이 기능은 시각적 신호와 가청 신호에 따라 비디오를 의미 있는 세그먼트로 나누고, 해당 세그먼트에 대한 타임스탬프를 제공하고, 각각을 요약합니다.

IAB 분류

대화형 광고국(IAB) 분류는 표준 광고 분류를 적용하여 시각적 및 오디오 요소를 기반으로 비디오 장면을 분류합니다. 미리 보기의 경우 BDA는 24개의 최상위(L1) 범주와 85개의 두 번째(L2) 범주를 지원합니다. BDA에서 지원하는 IAB 범주 목록을 다운로드하려면 여기를 클릭하세요.

전체 오디오 트랜스크립트

전체 오디오 트랜스크립트 기능은 오디오 파일의 모든 음성에 대한 전체 텍스트 표현을 제공합니다. 고급 음성 인식 기술을 사용하여 대화, 내레이션 및 기타 오디오 요소를 정확하게 트랜스크립션합니다. 트랜스크립션에는 화자 식별이 포함되어 있으므로 화자를 기반으로 오디오 콘텐츠를 쉽게 탐색하고 검색할 수 있습니다.

비디오의 텍스트

이 기능은 비디오에 시각적으로 표시되는 텍스트를 감지하고 추출합니다. 정적 텍스트(예: 제목 또는 캡션)와 동적 텍스트(예: 그래픽으로 텍스트 이동)를 모두 식별할 수 있습니다. 이미지 텍스트 감지와 마찬가지로 감지된 각 텍스트 요소에 대한 경계 상자 정보를 제공하므로 비디오 프레임 내에서 정확한 현지화를 수행할 수 있습니다.

로고 감지

이 기능은 비디오에서 로고를 식별하고 비디오 프레임 내에서 감지된 각 로고의 좌표와 신뢰도 점수를 나타내는 경계 상자 정보를 제공합니다. 이 기능은 기본적으로 활성화되어 있지 않습니다.

콘텐츠 조정

콘텐츠 조정은 비디오에서 부적절하거나 원치 않거나 불쾌감을 주는 콘텐츠를 감지합니다. BDA는 7가지 조절 범주를 지원합니다. 즉, 협박 부분의 명시적, 비명시적 누드와 키스, 수영복 또는 속옷, 폭력, 마약 및 담배, 알코올, 증오 기호입니다. 비디오의 명시적 텍스트에는 플래그가 지정되지 않습니다.

텍스트 감지와 같은 관련 기능에 대해 경계 상자 및 관련 신뢰도 점수를 활성화하거나 비활성화하여 비디오 파일에 위치 좌표와 타임스탬프를 제공할 수 있습니다. 기본적으로 전체 비디오 요약, 장면 요약 및 비디오 텍스트 감지가 활성화됩니다.

참고

비디오당 하나의 오디오 트랙만 지원됩니다. 자막 파일 형식(예: SRT, VTT 등)은 지원되지 않습니다.

비디오 표준 출력

다음은 BDA를 통해 처리된 비디오의 표준 출력 예제입니다.


{
"metadata": {
    "id": "video_123",
    "semantic_modality": "VIDEO",
    "s3_bucket": "my-video-bucket",
    "s3_prefix": "videos/",
    "format": "MP4",
    "frame_rate": 24.0,
    "codec": "h264",
    "duration_millis": 120000,
    "frame_width": 1920,
    "frame_height": 1080
},
"video": {
    "summary": "A tech conference presentation discussing AI advancements and their impact on various industries.",
    "transcript": {
        "representation": {
            "text": "This is a sample video transcript. The video discusses various topics including technology, innovation, and the future of our society."
        }
    }
},
"chapter": [
    {
        "chapter_index": 0,
        "start_timecode_SMPTE": "00:00:00:00",
        "end_timecode_SMPTE": "00:00:30:00",
        "start_timestamp_millis": 0,
        "end_timestamp_millis": 30000,
        "start_frame_index": 0,
        "end_frame_index": 720,
        "duration_smpte": "00:00:30:00",
        "duration_millis": 30000,
        "duration_frames": 720,
        "shot_indices": [0, 1],
        "summary": "This scene introduces the main topic of the video and provides an overview of the key themes.",
        "transcript": {
            "representation": {
                "text": "Welcome to this video on the future of technology. In this presentation, we will explore the latest advancements in various fields, including artificial intelligence, renewable energy, and smart city initiatives."
            }
        },
        "iab_categories": [
            {
                "id": "iab_12345",
                "type": "IAB",
                "category": "Technology & Computing",
                "confidence": 0.9,
                "parent_name": "Business & Industrial",
                "taxonomy_level": 2
            },
            {
                "id": "iab_67890",
                "type": "IAB",
                "category": "Renewable Energy",
                "confidence": 0.8,
                "parent_name": "Energy & Utilities",
                "taxonomy_level": 2
            }
        ],
        "content_moderation": [
            {
                "id": "mod_12345",
                "type": "CONTENT_MODERATION",
                "confidence": 0.1,
                "start_timestamp_millis": 0,
                "end_timestamp_millis": 30000,
                "moderation_categories": [
                    {
                        "category": "profanity",
                        "confidence": 0.2
                    }
                ]
            }
        ],
        "audio_segments": [
            {
                "start_timestamp_millis": 0,
                "end_timestamp_millis": 30000,
                "id": "audio_segment_1",
                "type": "TRANSCRIPT",
                "text": "Welcome to this video on the future of technology. In this presentation, we will explore the latest advancements in various fields, including artificial intelligence, renewable energy, and smart city initiatives.",
                "speaker": {
                    "speaker_id": "SPK_001"
                }
            }
        ],
        "frames": [
            {
                "timecode_SMPTE": "00:00:05:00",
                "timestamp_millis": 5000,
                "index": 120,
                "features": {
                    "content_moderation": [
                        {
                            "id": "mod_67890",
                            "type": "MODERATION",
                            "category": "Adult",
                            "confidence": 0.2,
                            "parent_name": "Sensitive",
                            "taxonomy_level": 2
                        }
                    ],
                    "text_words": [
                        {
                            "id": "word_1",
                            "text": "technology",
                            "confidence": 0.9,
                            "line_id": "line_1",
                            "locations": [
                                {
                                    "bounding_box": {
                                        "left": 0.1,
                                        "top": 0.2,
                                        "width": 0.2,
                                        "height": 0.1
                                    },
                                    "polygon": [
                                        {"x": 0.1, "y": 0.2},
                                        {"x": 0.3, "y": 0.2},
                                        {"x": 0.3, "y": 0.3},
                                        {"x": 0.1, "y": 0.3}
                                    ]
                                }
                            ]
                        }
                    ],
                    "text_lines": [
                        
                        {
                            "id": "line_1",
                            "text": "The future of technology",
                            "confidence": 0.85,
                            "locations": [
                                {
                                    "bounding_box": {
                                        "left": 0.05,
                                        "top": 0.1,
                                        "width": 0.4,
                                        "height": 0.2
                                    },
                                    "polygon": [
                                        {"x": 0.05, "y": 0.1},
                                        {"x": 0.45, "y": 0.1},
                                        {"x": 0.45, "y": 0.3},
                                        {"x": 0.05, "y": 0.3}
                                    ]
                                }
                            ]
                        }
                    ]
                }
            }
        ]
    }
],
"statistics": {
    "entity_count": 20,
    "shot_count": 4,
    "chapter_count": 2,
    "speaker_count": 1
}

}

이 예제에서는 BDA 출력의 포괄적인 특성을 보여 주며, 추가 분석 또는 처리를 위해 다양한 애플리케이션에 쉽게 통합할 수 있는 풍부하고 구조화된 데이터를 제공합니다.

BDA 비디오 처리 제한

BDA는 MP4, H.264, VP8 및 VP9를 사용하는 MOV 파일 형식의 비디오를 지원합니다. 비디오 파일의 최대 길이는 120분이고 최대 크기는 10,240MB입니다. 비디오의 너비와 높이는 224보다 크고 7680보다 작아야 합니다. 오디오 파일에 여러 오디오 스트림이 있는 경우 첫 번째 스트림만 처리합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Documents

이미지

이 페이지에서

쿠키 기본 설정 선택

쿠키 기본 설정 사용자 지정

필수

성능

기능

광고

쿠키 기본 설정을 저장할 수 없음

비디오

전체 비디오 요약

챕터 요약

IAB 분류

전체 오디오 트랜스크립트

비디오의 텍스트

로고 감지

콘텐츠 조정

참고

비디오 표준 출력

BDA 비디오 처리 제한

이 페이지에서

Related resources

페이지 내용이 도움이 되었습니까?

Related resources

다음 주제:

이전 주제:

도움이 필요하십니까?