カスタム分類のリアルタイム分析 (API) - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタム分類のリアルタイム分析 (API)

Amazon Comprehend を使用してAPI、カスタムモデルでリアルタイム分類を実行できます。まずリアルタイム分析を実行するエンドポイントを作成します。エンドポイントを作成したら、リアルタイム分類を実行します。

このセクションの例では、UNIX、Linux、macOS 用のコマンド形式を使用しています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。

エンドポイントのスループットのプロビジョニングとそれに関連するコストについては、「Amazon Comprehend エンドポイントの使用法」を参照してください。

カスタム分類用のエンドポイントの作成

次の例は、 を使用した CreateEndpoint API オペレーションを示しています AWS CLI。

aws comprehend create-endpoint \ --desired-inference-units number of inference units \ --endpoint-name endpoint name \ --model-arn arn:aws:comprehend:region:account-id:model/example \ --tags Key=My1stTag,Value=Value1

Amazon Comprehend は次のように応答します。

{ "EndpointArn": "Arn" }

リアルタイムカスタム分類の実行

カスタム分類モデルのエンドポイントを作成したら、そのエンドポイントを使用してClassifyDocumentAPIオペレーションを実行します。text または bytes パラメータを使用してテキストを提供できます。その他の種類の入力には、bytes パラメータを利用します。

イメージファイルとPDFファイルの場合、 DocumentReaderConfigパラメータを使用してデフォルトのテキスト抽出アクションを上書きできます。詳細については、「テキスト抽出オプションの設定」を参照してください。

最良の結果を得るには、入力タイプを分類子モデルのタイプと一致させてください。API レスポンスには、ネイティブドキュメントをプレーンテキストモデルに送信する場合、またはプレーンテキストファイルをネイティブドキュメントモデルに送信する場合の警告が含まれます。詳細については、「調教分類モデル」を参照してください。

の使用 AWS Command Line Interface

次の例は、classify-document CLI コマンドを使用する方法を示しています。

を使用してテキストを分類する AWS CLI

次の例では、テキストブロックに対してリアルタイム分類を実行します。

aws comprehend classify-document \ --endpoint-arn arn:aws:comprehend:region:account-id:endpoint/endpoint name \ --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.'

Amazon Comprehend は次のように応答します。

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

を使用して半構造化ドキュメントを分類する AWS CLI

PDF、Word、またはイメージファイルのカスタム分類を分析するには、 bytesパラメータの入力ファイルを使用して classify-document コマンドを実行します。

次の例では、画像を入力ファイルとして使用します。fileb オプションを使用して画像ファイルのバイトを Base-64 でエンコードします。詳細については、 AWS Command Line Interface 「 ユーザーガイド」の「バイナリラージオブジェクト」を参照してください。

この例は、 という名前のJSONファイルも渡config.jsonしてテキスト抽出オプションを設定します。

$ aws comprehend classify-document \ > --endpoint-arn arn \ > --language-code en \ > --bytes fileb://image1.jpg \ > --document-reader-config file://config.json

config.json ファイルには次のコンテンツが含まれます。

{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }

Amazon Comprehend は次のように応答します。

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

詳細については、Amazon Comprehend APIリファレンスClassifyDocument」の「」を参照してください。