Ringkasan Gambar Taksonomi IAB Deteksi Logo Deteksi Teks Gambar Moderasi Konten Output Standar Gambar

Citra

Fitur Otomasi Amazon Bedrock Data (BDA) menawarkan serangkaian output standar yang komprehensif untuk pemrosesan gambar untuk menghasilkan wawasan dari gambar Anda. Anda dapat menggunakan wawasan ini untuk mengaktifkan berbagai aplikasi dan kasus penggunaan, seperti penemuan konten, penempatan iklan kontekstual, dan keamanan merek. Berikut adalah ikhtisar dari setiap jenis operasi yang tersedia sebagai bagian dari output standar untuk gambar:

Ringkasan Gambar

Ringkasan gambar menghasilkan keterangan deskriptif untuk sebuah gambar. Fitur ini diaktifkan dalam konfigurasi output standar secara default.

Taksonomi IAB

Klasifikasi Interactive Advertising Bureau (IAB) menerapkan taksonomi iklan standar untuk mengklasifikasikan konten gambar. Untuk Pratinjau, BDA akan mendukung 24 kategori tingkat atas (L1) dan 85 kategori tingkat kedua (L2). Untuk mengunduh daftar kategori IAB yang didukung oleh BDA, klik di sini.

Deteksi Logo

Fitur ini mengidentifikasi logo dalam gambar dan memberikan informasi kotak pembatas, menunjukkan koordinat setiap logo yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini tidak diaktifkan secara default.

Deteksi Teks Gambar

Fitur ini mendeteksi dan mengekstrak teks yang muncul secara visual dalam gambar dan menyediakan informasi kotak pembatas, menunjukkan koordinat setiap elemen teks yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini diaktifkan dalam konfigurasi output standar secara default.

Moderasi Konten

Moderasi konten mendeteksi konten yang tidak pantas, tidak diinginkan, atau menyinggung dalam gambar. Untuk Pratinjau, BDA akan mendukung 7 kategori moderasi: Eksplisit, Ketelanjangan Non-Eksplisit dari bagian Intim dan Ciuman, Pakaian Renang atau Pakaian Dalam, Kekerasan, Narkoba & Tembakau, Alkohol, simbol Kebencian. Teks eksplisit dalam gambar tidak ditandai.

Kotak pembatas dan skor kepercayaan terkait dapat diaktifkan atau dinonaktifkan untuk fitur yang relevan seperti deteksi teks untuk menyediakan koordinat lokasi dalam gambar. Secara default, ringkasan gambar dan deteksi teks gambar diaktifkan.

Output Standar Gambar

Berikut ini adalah contoh output standar untuk gambar yang diproses melalui BDA:


{
"metadata": {
    "id": "image_123",
    "semantic_modality": "IMAGE",
    "s3_bucket": "my-s3-bucket",
    "s3_prefix": "images/",
    "image_width_pixels": 1920,
    "image_height_pixels": 1080,
    "color_depth": 24,
    "image_encoding": "JPEG"
},
"image": {
    "summary": "Lively party scene with decorations and supplies",
    "iab_categories": [
        {
            "id": "iab_12345",
            "type": "IAB",
            "category": "Party Supplies",
            "confidence": 0.9,
            "parent_name": "Events & Attractions",
            "taxonomy_level": 2
        },
        {
            "id": "iab_67890",
            "type": "IAB",
            "category": "Decorations",
            "confidence": 0.8,
            "parent_name": "Events & Attractions",
            "taxonomy_level": 1
        }
    ],
    "content_moderation": [
        {
            "id": "mod_12345",
            "type": "MODERATION",
            "category": "Drugs & Tobacco Paraphernalia & Use",
            "confidence": 0.7,
            "parent_name": "Drugs & Tobacco",
            "taxonomy_level": 2
        }
    ],
    "text_words": [
        {
            "id": "word_1",
            "text": "lively",
            "confidence": 0.9,
            "line_id": "line_1",
            "locations": [
                {
                    "bounding_box": {
                        "left": 100,
                        "top": 200,
                        "width": 50,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 100, "y": 200},
                        {"x": 150, "y": 200},
                        {"x": 150, "y": 220},
                        {"x": 100, "y": 220}
                    ]
                }
            ]
        },
        {
            "id": "word_2",
            "text": "party",
            "confidence": 0.85,
            "line_id": "line_1",
            "locations": [
                {
                    "bounding_box": {
                        "left": 160,
                        "top": 200,
                        "width": 70,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 160, "y": 200},
                        {"x": 230, "y": 200},
                        {"x": 230, "y": 220},
                        {"x": 160, "y": 220}
                    ]
                }
            ]
        }
    ],
    "text_lines": [
        {
            "id": "line_1",
            "text": "lively party",
            "confidence": 0.9,
            "locations": [
                {
                    "bounding_box": {
                        "left": 100,
                        "top": 200,
                        "width": 200,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 100, "y": 200},
                        {"x": 300, "y": 200},
                        {"x": 300, "y": 220},
                        {"x": 100, "y": 220}
                    ]
                }
            ]
        }
    ]
},
"statistics": {
    "entity_count": 7,
    "object_count": 3,
    "line_count": 2,
    "word_count": 9
}
}

Output ini meliputi:

Metadata gambar
Ringkasan gambar
Kategorisasi IAB
Hasil moderasi konten
Teks yang terdeteksi dengan informasi tingkat kata dan baris
Kotak pembatas dan poligon untuk lokasi teks
Statistik tentang konten yang dianalisis

Pembatasan Pemrosesan Gambar BDA

BDA mendukung gambar dalam format file JPEG, dan PNG. Ukuran file maksimum gambar adalah 5 MB dan resolusi maksimum adalah 8k.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Video

Audio