イメージ

フォーカスモード

イメージ - Amazon Bedrock

イメージの概要 IAB 分類ロゴ検出イメージテキストの検出コンテンツのモデレーションイメージ標準出力

Amazon Bedrock データ自動化 (BDA) 機能は、画像からインサイトを生成するための画像処理用の包括的な標準出力のセットを提供します。これらのインサイトを使用して、コンテンツ検出、コンテキストに応じた広告配置、ブランドの安全性など、幅広いアプリケーションやユースケースを実現できます。イメージの標準出力の一部として使用できる各オペレーションタイプの概要を次に示します。

イメージの概要

イメージ概要は、イメージの説明字幕を生成します。この機能は、デフォルトで標準出力設定内で有効になっています。

IAB 分類

インタラクティブ広告局 (IAB) 分類は、標準の広告分類を適用して画像コンテンツを分類します。プレビューでは、BDA は 24 のトップレベル (L1) カテゴリと 85 のセカンドレベル (L2) カテゴリをサポートします。BDA でサポートされている IAB カテゴリのリストをダウンロードするには、ここをクリックします。

ロゴ検出

この機能は、イメージ内のロゴを識別し、イメージ内で検出された各ロゴの座標と信頼スコアを示す境界ボックス情報を提供します。この機能はデフォルトでは有効になっていません。

イメージテキストの検出

この機能は、イメージに視覚的に表示されるテキストを検出して抽出し、イメージ内で検出された各テキスト要素の座標と信頼スコアを示す境界ボックス情報を提供します。この機能は、デフォルトで標準出力設定内で有効になっています。

コンテンツのモデレーション

コンテンツモデレーションは、イメージ内の不適切、望ましくない、または不快なコンテンツを検出します。プレビューの場合、BDA は 7 つのモデレーションカテゴリをサポートします。明示的、非明示的な結合部分、キスシング、水着またはアンダーウェア、暴力、凡惨なタバコ、アルコール、ヘイトシンボルです。イメージ内の明示的なテキストにはフラグが付けられません。

境界ボックスと関連する信頼スコアは、テキスト検出などの関連機能に対して有効または無効にして、画像内の位置座標を提供できます。デフォルトでは、画像の概要と画像テキストの検出が有効になっています。

イメージ標準出力

BDA で処理されたイメージの標準出力の例を次に示します。


{
"metadata": {
    "id": "image_123",
    "semantic_modality": "IMAGE",
    "s3_bucket": "my-s3-bucket",
    "s3_prefix": "images/",
    "image_width_pixels": 1920,
    "image_height_pixels": 1080,
    "color_depth": 24,
    "image_encoding": "JPEG"
},
"image": {
    "summary": "Lively party scene with decorations and supplies",
    "iab_categories": [
        {
            "id": "iab_12345",
            "type": "IAB",
            "category": "Party Supplies",
            "confidence": 0.9,
            "parent_name": "Events & Attractions",
            "taxonomy_level": 2
        },
        {
            "id": "iab_67890",
            "type": "IAB",
            "category": "Decorations",
            "confidence": 0.8,
            "parent_name": "Events & Attractions",
            "taxonomy_level": 1
        }
    ],
    "content_moderation": [
        {
            "id": "mod_12345",
            "type": "MODERATION",
            "category": "Drugs & Tobacco Paraphernalia & Use",
            "confidence": 0.7,
            "parent_name": "Drugs & Tobacco",
            "taxonomy_level": 2
        }
    ],
    "text_words": [
        {
            "id": "word_1",
            "text": "lively",
            "confidence": 0.9,
            "line_id": "line_1",
            "locations": [
                {
                    "bounding_box": {
                        "left": 100,
                        "top": 200,
                        "width": 50,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 100, "y": 200},
                        {"x": 150, "y": 200},
                        {"x": 150, "y": 220},
                        {"x": 100, "y": 220}
                    ]
                }
            ]
        },
        {
            "id": "word_2",
            "text": "party",
            "confidence": 0.85,
            "line_id": "line_1",
            "locations": [
                {
                    "bounding_box": {
                        "left": 160,
                        "top": 200,
                        "width": 70,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 160, "y": 200},
                        {"x": 230, "y": 200},
                        {"x": 230, "y": 220},
                        {"x": 160, "y": 220}
                    ]
                }
            ]
        }
    ],
    "text_lines": [
        {
            "id": "line_1",
            "text": "lively party",
            "confidence": 0.9,
            "locations": [
                {
                    "bounding_box": {
                        "left": 100,
                        "top": 200,
                        "width": 200,
                        "height": 20
                    },
                    "polygon": [
                        {"x": 100, "y": 200},
                        {"x": 300, "y": 200},
                        {"x": 300, "y": 220},
                        {"x": 100, "y": 220}
                    ]
                }
            ]
        }
    ]
},
"statistics": {
    "entity_count": 7,
    "object_count": 3,
    "line_count": 2,
    "word_count": 9
}
}

この出力には以下が含まれます。

イメージメタデータ
イメージの概要
IAB の分類
コンテンツモデレーションの結果
単語と行レベルの情報を含むテキストが検出されました
テキスト位置の境界ボックスとポリゴン
分析されたコンテンツに関する統計

BDA イメージ処理の制限

BDA は、JPEG および PNG 形式のイメージをサポートしています。イメージの最大ファイルサイズは 5 MB、最大解像度は 8k です。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

動画

音声

このページの内容

Cookie の設定を選択する

Cookie の設定をカスタマイズする

Essential

Performance

Functional

Advertising

Cookie の設定を保存できません

イメージ

イメージの概要

IAB 分類

ロゴ検出

イメージテキストの検出

コンテンツのモデレーション

イメージ標準出力

BDA イメージ処理の制限

このページの内容

Related resources

このページは役に立ちましたか?

Related resources

次のトピック

前のトピック:

ヘルプが必要ですか?