Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Citra
Fitur Otomasi Amazon Bedrock Data (BDA) menawarkan serangkaian output standar yang komprehensif untuk pemrosesan gambar untuk menghasilkan wawasan dari gambar Anda. Anda dapat menggunakan wawasan ini untuk mengaktifkan berbagai aplikasi dan kasus penggunaan, seperti penemuan konten, penempatan iklan kontekstual, dan keamanan merek. Berikut adalah ikhtisar dari setiap jenis operasi yang tersedia sebagai bagian dari output standar untuk gambar:
Ringkasan Gambar
Ringkasan gambar menghasilkan keterangan deskriptif untuk sebuah gambar. Fitur ini diaktifkan dalam konfigurasi output standar secara default.
Taksonomi IAB
Klasifikasi Interactive Advertising Bureau (IAB) menerapkan taksonomi iklan standar untuk mengklasifikasikan konten gambar. Untuk Pratinjau, BDA akan mendukung 24 kategori tingkat atas (L1) dan 85 kategori tingkat kedua (L2). Untuk mengunduh daftar kategori IAB yang didukung oleh BDA, klik di sini.
Deteksi Logo
Fitur ini mengidentifikasi logo dalam gambar dan memberikan informasi kotak pembatas, menunjukkan koordinat setiap logo yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini tidak diaktifkan secara default.
Deteksi Teks Gambar
Fitur ini mendeteksi dan mengekstrak teks yang muncul secara visual dalam gambar dan menyediakan informasi kotak pembatas, menunjukkan koordinat setiap elemen teks yang terdeteksi dalam gambar, dan skor kepercayaan. Fitur ini diaktifkan dalam konfigurasi output standar secara default.
Moderasi Konten
Moderasi konten mendeteksi konten yang tidak pantas, tidak diinginkan, atau menyinggung dalam gambar. Untuk Pratinjau, BDA akan mendukung 7 kategori moderasi: Eksplisit, Ketelanjangan Non-Eksplisit dari bagian Intim dan Ciuman, Pakaian Renang atau Pakaian Dalam, Kekerasan, Narkoba & Tembakau, Alkohol, simbol Kebencian. Teks eksplisit dalam gambar tidak ditandai.
Kotak pembatas dan skor kepercayaan terkait dapat diaktifkan atau dinonaktifkan untuk fitur yang relevan seperti deteksi teks untuk menyediakan koordinat lokasi dalam gambar. Secara default, ringkasan gambar dan deteksi teks gambar diaktifkan.
Output Standar Gambar
Berikut ini adalah contoh output standar untuk gambar yang diproses melalui BDA:
{ "metadata": { "id": "image_123", "semantic_modality": "IMAGE", "s3_bucket": "my-s3-bucket", "s3_prefix": "images/", "image_width_pixels": 1920, "image_height_pixels": 1080, "color_depth": 24, "image_encoding": "JPEG" }, "image": { "summary": "Lively party scene with decorations and supplies", "iab_categories": [ { "id": "iab_12345", "type": "IAB", "category": "Party Supplies", "confidence": 0.9, "parent_name": "Events & Attractions", "taxonomy_level": 2 }, { "id": "iab_67890", "type": "IAB", "category": "Decorations", "confidence": 0.8, "parent_name": "Events & Attractions", "taxonomy_level": 1 } ], "content_moderation": [ { "id": "mod_12345", "type": "MODERATION", "category": "Drugs & Tobacco Paraphernalia & Use", "confidence": 0.7, "parent_name": "Drugs & Tobacco", "taxonomy_level": 2 } ], "text_words": [ { "id": "word_1", "text": "lively", "confidence": 0.9, "line_id": "line_1", "locations": [ { "bounding_box": { "left": 100, "top": 200, "width": 50, "height": 20 }, "polygon": [ {"x": 100, "y": 200}, {"x": 150, "y": 200}, {"x": 150, "y": 220}, {"x": 100, "y": 220} ] } ] }, { "id": "word_2", "text": "party", "confidence": 0.85, "line_id": "line_1", "locations": [ { "bounding_box": { "left": 160, "top": 200, "width": 70, "height": 20 }, "polygon": [ {"x": 160, "y": 200}, {"x": 230, "y": 200}, {"x": 230, "y": 220}, {"x": 160, "y": 220} ] } ] } ], "text_lines": [ { "id": "line_1", "text": "lively party", "confidence": 0.9, "locations": [ { "bounding_box": { "left": 100, "top": 200, "width": 200, "height": 20 }, "polygon": [ {"x": 100, "y": 200}, {"x": 300, "y": 200}, {"x": 300, "y": 220}, {"x": 100, "y": 220} ] } ] } ] }, "statistics": { "entity_count": 7, "object_count": 3, "line_count": 2, "word_count": 9 } }
Output ini meliputi:
Metadata gambar
Ringkasan gambar
Kategorisasi IAB
Hasil moderasi konten
Teks yang terdeteksi dengan informasi tingkat kata dan baris
Kotak pembatas dan poligon untuk lokasi teks
Statistik tentang konten yang dianalisis
Pembatasan Pemrosesan Gambar BDA
BDA mendukung gambar dalam format file JPEG, dan PNG. Ukuran file maksimum gambar adalah 5 MB dan resolusi maksimum adalah 8k.