カスタム分類のリアルタイム分析 (API)

Amazon Comprehend API を使用して、カスタム分類モデルでリアルタイム分析を実行できます。まずリアルタイム分析を実行するエンドポイントを作成します。エンドポイントを作成したら、リアルタイム分類を実行します。

このセクションの例では、UNIX、Linux、macOS 用のコマンド形式を使用しています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。

エンドポイントのスループットのプロビジョニングとそれに関連するコストについては、「Amazon Comprehend エンドポイントの使用法」を参照してください。

カスタム分類用のエンドポイントの作成

次の例は、 AWS CLIを使用した CreateEndpoint API 演算機能を示しています。


aws comprehend create-endpoint \
    --desired-inference-units number of inference units \
    --endpoint-name endpoint name \
    --model-arn arn:aws:comprehend:region:account-id:model/example \
    --tags Key=My1stTag,Value=Value1

Amazon Comprehend は次のように応答します。


{
   "EndpointArn": "Arn"
}

リアルタイムカスタム分類の実行

カスタム分類モデル用のエンドポイントを作成したなら、そのエンドポイントを使用して ClassifyDocument API 演算を実行します。text または bytes パラメータを使用してテキストを提供できます。その他の種類の入力には、bytes パラメータを利用します。

画像ファイルや PDF ファイルの場合は、DocumentReaderConfig パラメーターを使用してデフォルトのテキスト抽出アクションをオーバーライドできます。詳細については、「テキスト抽出オプションの設定」を参照してください。

最良の結果を得るには、入力タイプを分類子モデルのタイプと一致させてください。ネイティブ文書をプレーンテキストモデルに送信したり、プレーンテキストファイルをネイティブ文書モデルに送信したりすると、API 応答に警告が含まれます。詳細については、「調教分類モデル」を参照してください。

の使用 AWS Command Line Interface

以下の例は、classify-document CLI コマンドの使用方法を示しています。

を使用してテキストを分類する AWS CLI

次の例では、テキストブロックに対してリアルタイム分類を実行します。


aws comprehend classify-document \
     --endpoint-arn arn:aws:comprehend:region:account-id:endpoint/endpoint name \
     --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, 
     the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late 
     on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, 
     and several liners were near enough to catch and respond to the call.'

Amazon Comprehend は次のように応答します。


{
    "Classes": [ 
       { 
          "Name": "string",
          "Score": 0.9793661236763
       }
    ]
 }

を使用して半構造化ドキュメントを分類する AWS CLI

PDF、Word、画像ファイルのカスタム分類を分析するには、bytes パラメーターに入力ファイルを指定して classify-document コマンドを実行します。

次の例では、画像を入力ファイルとして使用します。fileb オプションを使用して画像ファイルのバイトを Base-64 でエンコードします。詳細については、「 AWS Command Line Interface ユーザーガイド」の「バイナリラージオブジェクト」を参照してください。

この例では、テキスト抽出オプションを設定するために config.json という名前の JSON ファイルも渡しています。


$ aws comprehend classify-document \
> --endpoint-arn arn \
> --language-code en \
> --bytes fileb://image1.jpg   \
> --document-reader-config file://config.json

config.json ファイルには次のコンテンツが含まれます。



 {
    "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION",
    "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT"    
 }

Amazon Comprehend は次のように応答します。


{
    "Classes": [ 
       { 
          "Name": "string",
          "Score": 0.9793661236763
       }
    ]
 }

詳細については、「Amazon Comprehend API リファレンス」の「ClassifyDocument」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

リアルタイム分析 (コンソール)

リアルタイム分析の出力