翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Comprehend API を使用して、カスタム分類モデルでリアルタイム分析を実行できます。まずリアルタイム分析を実行するエンドポイントを作成します。エンドポイントを作成したら、リアルタイム分類を実行します。
このセクションの例では、UNIX、Linux、macOS 用のコマンド形式を使用しています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。
エンドポイントのスループットのプロビジョニングとそれに関連するコストについては、「Amazon Comprehend エンドポイントの使用法」を参照してください。
カスタム分類用のエンドポイントの作成
次の例は、 AWS CLIを使用した CreateEndpoint API 演算機能を示しています。
aws comprehend create-endpoint \ --desired-inference-units
number of inference units
\ --endpoint-nameendpoint name
\ --model-arn arn:aws:comprehend:region
:account-id
:model/example
\ --tags Key=My1stTag
,Value=Value1
Amazon Comprehend は次のように応答します。
{ "EndpointArn": "
Arn
" }
リアルタイムカスタム分類の実行
カスタム分類モデル用のエンドポイントを作成したなら、そのエンドポイントを使用して ClassifyDocument API 演算を実行します。text
または bytes
パラメータを使用してテキストを提供できます。その他の種類の入力には、bytes
パラメータを利用します。
画像ファイルや PDF ファイルの場合は、DocumentReaderConfig
パラメーターを使用してデフォルトのテキスト抽出アクションをオーバーライドできます。詳細については、「テキスト抽出オプションの設定」を参照してください。
最良の結果を得るには、入力タイプを分類子モデルのタイプと一致させてください。ネイティブ文書をプレーンテキストモデルに送信したり、プレーンテキストファイルをネイティブ文書モデルに送信したりすると、API 応答に警告が含まれます。詳細については、「調教分類モデル」を参照してください。
の使用 AWS Command Line Interface
以下の例は、classify-document CLI コマンドの使用方法を示しています。
を使用してテキストを分類する AWS CLI
次の例では、テキストブロックに対してリアルタイム分類を実行します。
aws comprehend classify-document \ --endpoint-arn arn:aws:comprehend:
region
:account-id
:endpoint/endpoint name
\ --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.'
Amazon Comprehend は次のように応答します。
{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }
を使用して半構造化ドキュメントを分類する AWS CLI
PDF、Word、画像ファイルのカスタム分類を分析するには、bytes
パラメーターに入力ファイルを指定して classify-document
コマンドを実行します。
次の例では、画像を入力ファイルとして使用します。fileb
オプションを使用して画像ファイルのバイトを Base-64 でエンコードします。詳細については、「 AWS Command Line Interface ユーザーガイド」の「バイナリラージオブジェクト」を参照してください。
この例では、テキスト抽出オプションを設定するために config.json
という名前の JSON ファイルも渡しています。
$
aws comprehend classify-document \
>
--endpoint-arn
arn
\
>
--language-code
en
\
>
--bytes
fileb://image1.jpg\
>
--document-reader-config file://config.json
config.json ファイルには次のコンテンツが含まれます。
{
"DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION",
"DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT"
}
Amazon Comprehend は次のように応答します。
{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }
詳細については、「Amazon Comprehend API リファレンス」の「ClassifyDocument」を参照してください。