翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
表形式データに対するエンドポイントレスポンス
SageMaker Clarify 処理ジョブが推論エンドポイント呼び出しのレスポンスを受信すると、レスポンスペイロードがデシリアル化され、そこから予測が抽出されます。分析設定 accept_type
パラメーターを使用して、レスポンスペイロードのデータ形式を指定します。が指定されaccept_type
ていない場合、 SageMaker Clarify 処理ジョブは content_type パラメータの値をモデル出力形式として使用します。accept_type
の詳細については、「分析設定ファイル」を参照してください。
予測は、バイアス分析の予測ラベル、または特徴量重要度分析の確率値 (スコア) のいずれかで構成されます。predictor
分析設定では、次の 3 つのパラメータを使用して予測を引き出します。
-
パラメータ
probability
は、エンドポイントレスポンスの確率値 (スコア) を特定するために使用されます。 -
パラメータ
label
は、エンドポイントレスポンス内の予測ラベルを特定するために使用されます。 -
(オプション) パラメータ
label_headers
は、多クラスモデルの予測ラベルを指定します。
以下のガイドラインはCSV、、JSON行、JSONおよび形式のエンドポイントレスポンスに関連しています。
Endpoint Response は CSV形式です
レスポンスペイロードがCSV形式 (MIMEタイプ: text/csv
) の場合、 SageMaker Clarify 処理ジョブは各行のシリアル化を解除します。次に、分析設定で提供される列インデックスを使用して、逆シリアル化されたデータから予測を引き出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。
次の表は、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
以下のセクションでは、エンドポイントレスポンスの例を CSV 形式で示します。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード。 |
'0.6' |
2 つのレコード (結果は 1 行で、カンマで区切られます)。 |
'0.6,0.3' |
2 つのレコード (結果は 2 行になります)。 |
'0.6\n0.3' |
前の例では、エンドポイントは予測ラベルの単一の確率値 (スコア) を出力します。インデックスを使用して確率を抽出し、それを特徴量重要度分析に使用するには、分析設定パラメータ probability
を column index 0
に設定します。これらの確率は、probability_threshold
パラメータを使用してバイナリ値に変換すれば、バイアス分析にも使用できます。probability_threshold
の詳細については、「分析設定ファイル」を参照してください。
次の表は、多クラス問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
多クラスモデル (3 つのクラス) の 1 つのレコード。 |
'0.1,0.6,0.3' |
多クラスモデルの 2 つのレコード (3 つのクラス)。 |
'0.1,0.6,0.3\n0.2,0.5,0.3' |
前の例では、エンドポイントは確率 (スコア) のリストを出力します。インデックスが指定されていない場合は、すべての値が抽出され、特徴量重要度分析に使用されます。分析析設定 label_headers
パラメータが指定されます。次に、 SageMaker Clarify 処理ジョブは、最大確率のラベルヘッダーを予測ラベルとして選択でき、バイアス分析に使用できます。label_headers
の詳細については、「分析設定ファイル」を参照してください。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード。 |
'1' |
2 つのレコード (結果は 1 行で、カンマで区切られます) |
'1,0' |
2 つのレコード (結果は 2 行になります) |
'1\n0' |
前の例では、エンドポイントは確率ではなく予測ラベルを出力します。predictor
設定の label
パラメータを column index 0
に設定して、インデックスを使用して予測ラベルを抽出し、バイアス分析に使用できるようにします。
次の表は、リグレッション問題と二項分類問題に対するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'1,0.6' |
2 つのレコード |
'1,0.6\ n 0,0.3' |
前の例では、エンドポイントは確率ではなく予測ラベルとその確率を出力します。predictor
設定の label
パラメータを column index 0
に設定し、probability
を column index 1
に設定して両方のパラメータ値を抽出します。
Amazon SageMaker Autopilot でトレーニングされた多クラスモデルは、予測ラベルと確率のリストの文字列表現を出力するように設定できます。次の表の例は、predicted_label
、probability
、labels
、probabilities
を出力するように設定されたモデルからのエンドポイントレスポンスの例を示しています。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"' |
2 つのレコード |
'"dog",0.6,"[\'cat\', \'dog\', \'fish\']","[0.1, 0.6, 0.3]"\n""cat",0.7,[\'cat\', \'dog\', \'fish\']","[0.7, 0.2, 0.1]"' |
前の例では、 SageMaker Clarify 処理ジョブを次の方法で設定して、予測を抽出できます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
predictor
設定のlabel
パラメータを0
に設定して、予測ラベルを抽出します。 -
パラメータを
2
に設定して予測ラベルを抽出し、probability
を3
に設定すると対応する確率を抽出します。 SageMaker Clarify 処理ジョブは、最も高い確率値を持つラベルを特定することで、予測ラベルを自動的に決定できます。前述の単一のレコードの例を参照すると、モデルはcat
、dog
、fish
の 3 つのラベルを対応する確率の0.1
、0.6
、0.3
で予測します。これらの確率に基づいて予測ラベルはdog
です。これが最も高い確率値の0.6
を持つラベルだからです。 -
probability
を3
に設定して確率を抽出します。label_headers
が指定されている場合、 SageMaker Clarify 処理ジョブは、最も高い確率値を持つラベルヘッダーを特定することで、予測されたラベルを自動的に決定できます。
特徴量重要度分析では、前の例を以下のように設定できます。
-
probability
を3
に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。顧客がlabel_headers
を指定しない場合、予測ラベルは分析レポートのラベルヘッダーとして使用されます。
Endpoint Response は JSON Lines 形式です
レスポンスペイロードが JSON Lines 形式 (MIMEタイプ: application/jsonlines
) の場合、 SageMaker Clarify 処理ジョブは各行を として逆シリアル化しますJSON。次に、分析設定で提供されるJMESPath式を使用して、デシリアル化されたデータから予測を抽出します。レスポンスペイロードの行は、リクエストペイロードのレコードと一致する必要があります。次の表は、さまざまな形式のレスポンスデータの例を示しています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
以下のセクションでは、エンドポイントレスポンスの例を JSON Lines 形式で示します。
次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"score":0.6}' |
2 つのレコード |
'{"score":0.6}\n{"score":0.3}' |
前の例では、分析設定パラメータprobability
をJMESPath式「スコア」に設定して値を抽出します。
次の表は、予測ラベルのみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"prediction":1}' |
2 つのレコード |
'{"prediction":1}\n{"prediction":0}' |
前の例では、予測子設定の label
パラメータをJMESPath式 に設定しますprediction
。次に、 SageMaker Clarify 処理ジョブはバイアス分析用に予測ラベルを抽出できます。詳細については、「分析設定ファイル」を参照してください。
次の表は、予測ラベルとそのスコアを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"prediction":1,"score":0.6}' |
2 つのレコード |
'{"prediction":1,"score":0.6}\n{"prediction":0,"score":0.3}' |
前の例では、 predictor
設定の label
パラメータをJMESPath式「予測」に設定して、予測ラベルを抽出します。確率を抽出するには、JMESPath式「スコアprobability
」に設定します。詳細については、「分析設定ファイル」を参照してください。
次の表は、以下を出力する多クラスモデルからのエンドポイントレスポンスの例です。
-
予測ラベルのリスト。
-
確率、選択した予測ラベルとその確率。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}' |
2 つのレコード |
'{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}\n{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}' |
前の例では、 SageMaker Clarify 処理ジョブをいくつかの方法で設定して、予測を抽出できます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
予測ラベルを抽出するには、
predictor
設定のlabel
パラメータを JMESPath expression「predicted_label」に設定します。 -
予測ラベルを抽出するには、 パラメータを JMESPath expression「predicted_labels」に設定します。をJMESPath「確率」式
probability
に設定して、確率を抽出します。 SageMaker Clarify ジョブは、最も高い確率値を持つラベルを特定することで、予測されたラベルを自動的に決定します。 -
「確率JMESPath」式
probability
に設定して、確率を抽出します。label_headers
が指定されている場合、 SageMaker Clarify 処理ジョブは、最も高い確率値を持つラベルを特定することで、予測されたラベルを自動的に決定できます。
特徴量重要度分析を行うには、次の操作を行います。
-
JMESPath 式「確率
probability
」に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。
Endpoint Response は JSON形式です
レスポンスペイロードがJSON形式 (MIMEタイプ: application/json
) の場合、 SageMaker Clarify 処理ジョブはペイロード全体を として逆シリアル化しますJSON。次に、分析設定で指定されたJMESPath式を使用して、デシリアライズされたデータから予測を抽出します。レスポンスペイロードのレコードは、リクエストペイロードのレコードと一致する必要があります。
以下のセクションでは、エンドポイントレスポンスの例を JSON 形式で示します。このセクションには、さまざまな形式とさまざまな問題タイプのレスポンスデータの例を示す表が含まれています。分析設定に従って予測を引き出せれば、データはこれらの例と異なっていても問題ありません。
次の表は、確率値 (スコア) のみを出力するエンドポイントレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'[0.6]' |
2 つのレコード |
'[0.6,0.3]' |
前の例では、レスポンスペイロードに改行はありません。代わりに、1 つのJSONオブジェクトにスコアのリストが含まれ、リクエスト内のレコードごとに 1 つずつ含まれます。値を抽出するには、分析設定パラメータprobability
を JMESPath expression「[*]」に設定します。
次の表は、予測ラベルのみを出力するエンドポイントからのレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predicted_labels":[1]}' |
2 つのレコード |
'{"predicted_labels":[1,0]}' |
predictor
設定の label
パラメータを JMESPath expression「predicted_labels」に設定すると、 SageMaker Clarify 処理ジョブはバイアス分析用に予測ラベルを抽出できます。
次の表は、予測ラベルとそのスコアを出力するエンドポイントからのレスポンスの例です。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'{"predictions":[{"ラベル":1,"スコア":0.6}' |
2 つのレコード |
‘{"predictions":[{"ラベル":1,"スコア":0.6},{"ラベル":0,"スコア":0.3}]}' |
前の例では、 predictor
設定の label
パラメータをJMESPath式「predictions[*].label」に設定して、予測ラベルを抽出します。確率を抽出するにはJMESPath、式「予測」[*].scoreprobability
」に設定します。
次の表は、以下を出力する多クラスモデルのエンドポイントからのレスポンスの例です。
-
予測ラベルのリスト。
-
確率、選択した予測ラベルとその確率。
エンドポイントリクエストペイロード | エンドポイントレスポンスペイロード (文字列表現) |
---|---|
単一レコード |
'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]}]' |
2 つのレコード |
'[{"predicted_label":"dog","probability":0.6,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.1,0.6,0.3]},{"predicted_label":"cat","probability":0.7,"predicted_labels":["ネコ","イヌ","サカナ"],"probabilities":[0.7,0.2,0.1]}]' |
SageMaker Clarify 処理ジョブは、予測を抽出するためにいくつかの方法で設定できます。
バイアス分析では、前の例を以下のいずれかに設定できます。
-
予測ラベルを抽出するには、
predictor
設定のlabel
パラメータを JMESPath expression「[*].predicted_label」に設定します。 -
予測ラベルを抽出するには、 パラメータを JMESPath expression「[*].predicted_labels」に設定します。JMESPath 式「[*].probabilities
probability
」に設定して、その確率を抽出します。 SageMaker Clarify 処理ジョブは、最も高い近接値を持つラベルを識別することで、予測されたラベルを自動的に決定できます。 -
JMESPath 式「[*].probabilities
probability
」に設定して、その確率を抽出します。label_headers
が指定されている場合、 SageMaker Clarify 処理ジョブは、最も高い確率値を持つラベルを特定することで、予測されたラベルを自動的に決定できます。
特徴量重要度分析では、JMESPath式「[*].probabilitiesprobability
」に設定して、すべての予測ラベルの確率を抽出します。すると、すべてのラベルの特徴量属性が計算されます。