Endpunktreaktion für tabellarische Daten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Endpunktreaktion für tabellarische Daten

Nachdem der SageMaker Clarify-Verarbeitungsjob die Antwort eines Inferenzendpunkt-Aufrufs empfangen hat, deserialisiert er die Antwort-Nutzlast und extrahiert daraus Vorhersagen. Verwenden Sie den accept_type Analyse-Konfigurationsparameter, um das Datenformat der Antwort-Payload anzugeben. Falls nicht accept_type angegeben, verwendet der SageMaker Clarify-Verarbeitungsauftrag den Wert des Parameters content_type als Modellausgabeformat. Mehr über accept_type erfahren Sie unter Konfigurationsdateien für die Analyse.

Die Vorhersagen könnten entweder aus vorhergesagten Bezeichnungen für die Bias-Analyse oder aus Wahrscheinlichkeitswerten (Scores) für die Analyse der Featureswichtigkeit bestehen. In der predictor Analysekonfiguration extrahieren die folgenden drei Parameter die Vorhersagen.

  • Der Parameter probability wird verwendet, um die Wahrscheinlichkeitswerte (Scores) in der Endpunktreaktion zu ermitteln.

  • Der Parameter label wird verwendet, um die vorhergesagten Kennzeichnungen in der Endpunktreaktion zu lokalisieren.

  • (Optional) Der Parameter label_headers stellt die vorhergesagten Bezeichnungen für ein Mehrklassenmodell bereit.

Die folgenden Richtlinien beziehen sich auf Endpunktantworten in den FormatenCSV, JSON Linien und Formaten. JSON

Endpoint Response ist im Format CSV

Wenn die Antwort-Payload im CSV Format (MIMEtype:text/csv) vorliegt, deserialisiert der SageMaker Clarificy-Verarbeitungsjob jede Zeile. Anschließend werden die Vorhersagen anhand der in der Analysekonfiguration bereitgestellten Spaltenindizes aus den deserialisierten Daten extrahiert. Die Zeilen in der Antwortnutzlast müssen mit den Datensätzen in der Anforderungsnutzlast übereinstimmen.

Die folgenden Tabellen enthalten Beispiele für Antwortdaten in verschiedenen Formaten und für verschiedene Problemtypen. Ihre Daten können von diesen Beispielen abweichen, sofern die Vorhersagen entsprechend der Analysekonfiguration extrahiert werden können.

In den folgenden Abschnitten werden Beispielantworten von Endpunkten in Formaten gezeigt. CSV

Die folgende Tabelle enthält ein Beispiel für eine Endpunktreaktion für Regressions- und binäre Klassifikationsprobleme.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz.

'0,6'

Zwei Datensätze (Ergebnisse in einer Zeile, getrennt durch Komma).

'0,6,0,3'

Zwei Datensätze (Ergebnisse in zwei Zeilen).

'0,6\n0,3'

Im vorherigen Beispiel gibt der Endpunkt einen einzigen Wahrscheinlichkeitswert (Score) für die vorhergesagte Beschriftung aus. Um Wahrscheinlichkeiten mithilfe des Index zu extrahieren und sie für die Analyse der Merkmalswichtigkeit zu verwenden, legen Sie den Konfigurationsparameter für die Analyse probability auf Spaltenindex 0 fest. Diese Wahrscheinlichkeiten können auch für die systematische Analyse verwendet werden, wenn sie mithilfe des probability_threshold Parameters in einen Binärwert umgewandelt werden. Mehr über probability_threshold erfahren Sie unter Konfigurationsdateien für die Analyse.

Die folgende Tabelle enthält ein Beispiel für eine Endpunktreaktion für ein Problem mit mehreren Klassen.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz eines Mehrklassenmodells (drei Klassen).

'0,1,0.6,0,3'

Zwei Datensätze eines Mehrklassenmodells (drei Klassen).

'0,1,0.6,0,3\n0.2,0,5,0,3'

Im vorherigen Beispiel gibt der Endpunkt eine Liste von Wahrscheinlichkeiten (Punktzahlen) aus. Wenn kein Index angegeben wird, werden alle Werte extrahiert und für die Analyse der Featureswichtigkeit verwendet. Wenn der Konfigurationsparameter label_headers für die Analyse bereitgestellt wird. Anschließend kann der Verarbeitungsauftrag SageMaker Clarify den Label-Header mit der maximalen Wahrscheinlichkeit als vorhergesagtes Label auswählen, das für die Verzerrungsanalyse verwendet werden kann. Mehr über label_headers erfahren Sie unter Konfigurationsdateien für die Analyse.

Die folgende Tabelle enthält ein Beispiel für eine Endpunktreaktion für Regressions- und binäre Klassifikationsprobleme.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'1'

Zwei Datensätze (Ergebnisse in einer Zeile, getrennt durch Komma)

'1,0'

Zwei Datensätze (Ergebnisse in zwei Zeilen)

'1\n0'

Im vorherigen Beispiel gibt der Endpunkt die vorhergesagte Beschriftung statt der Wahrscheinlichkeit aus. Stellen Sie den label Parameter der predictor Konfiguration auf den Spaltenindex 0 ein, sodass die vorhergesagten Beschriftungen anhand des Index extrahiert und für die Verzerrungsanalyse verwendet werden können.

Die folgende Tabelle enthält ein Beispiel für eine Endpunktreaktion für Regressions- und binäre Klassifikationsprobleme.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'1,0.6'

Zwei Datensätze

'1,0.6\n0,0.3'

Im vorherigen Beispiel gibt der Endpunkt die vorhergesagte Beschriftung gefolgt von seiner Wahrscheinlichkeit aus. Stellen Sie den label Parameter der predictor Konfiguration auf Spaltenindex 0 und probability auf Spaltenindex 1 ein, um beide Parameterwerte zu extrahieren.

Ein von Amazon SageMaker Autopilot trainiertes Mehrklassenmodell kann so konfiguriert werden, dass es die Zeichenkettendarstellung der Liste der vorhergesagten Labels und Wahrscheinlichkeiten ausgibt. Die folgende Beispieltabelle zeigt ein Beispiel für eine Endpunktantwort eines Modells, das für die Ausgabe von predicted_label, probability, labels, und probabilities konfiguriert ist.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'"Hund“ ,0.6, "[\ 'Katze\ ',\ 'Hund\',\ 'Fisch\ ']“, "[0.1, 0.6, 0.3]"'

Zwei Datensätze

'"Hund“ ,0.6, "[\ 'Katze\ ',\ 'Hund\',\ 'Fisch\ ']“, "[0.1, 0.6, 0.3]“\n„Katze“ ,0.7, [\ 'Katze\',\ 'Hund\ ',\ 'Fisch\']“, "[0.7, 0.2, 0.1]" '

Im vorherigen Beispiel kann der SageMaker Clarify-Verarbeitungsauftrag auf folgende Weise konfiguriert werden, um die Vorhersagen zu extrahieren.

Für die Bias-Analyse kann das vorherige Beispiel wie folgt konfiguriert werden.

  • Stellen Sie den label Parameter der predictor Konfiguration auf ein, 0 um die vorhergesagte Beschriftung zu extrahieren.

  • Stellen Sie den Parameter auf ein, 2 um die vorhergesagten Beschriftungen zu extrahieren, und legen Sie probability auf 3 fest, um die entsprechenden Wahrscheinlichkeiten zu extrahieren. Der Verarbeitungsauftrag SageMaker Clarify kann das vorhergesagte Label automatisch ermitteln, indem das Label mit dem höchsten Wahrscheinlichkeitswert identifiziert wird. Unter Bezugnahme auf das vorherige Beispiel eines einzelnen Datensatzes prognostiziert das Modell drei Labels: cat, dog, und fish, mit entsprechenden Wahrscheinlichkeiten von 0.1, 0.6, und 0.3. Basierend auf diesen Wahrscheinlichkeiten ist dog vorhergesagt Beschriftung, da es den höchsten Wahrscheinlichkeitswert von 0.6 hat.

  • probability auf 3 setzen, um die Wahrscheinlichkeiten zu extrahieren. Falls label_headers angegeben, kann der SageMaker Clarife-Verarbeitungsjob das vorhergesagte Label automatisch ermitteln, indem er den Label-Header mit dem höchsten Wahrscheinlichkeitswert identifiziert.

Für die Analyse der Wichtigkeit von Features kann das vorherige Beispiel wie folgt konfiguriert werden.

  • probability legt auf 3 fest, dass die Wahrscheinlichkeiten aller vorhergesagten Beschriftungen extrahiert werden. Anschließend werden die Feature-Attributionen für alle Beschriftung berechnet. Wenn der Kunde label_headers nicht angibt, werden die vorhergesagten Beschriftungen als Beschriftung-Header im Analysebericht verwendet.

Endpoint Response ist im JSON Zeilenformat

Wenn die Antwort-Payload im JSON Lines-Format (MIMETyp:application/jsonlines) vorliegt, deserialisiert der SageMaker Clarify-Verarbeitungsjob jede Zeile als. JSON Anschließend werden mithilfe von Ausdrücken, die in der Analysekonfiguration bereitgestellt werden, Vorhersagen aus den deserialisierten Daten extrahiertJMESPath. Die Zeilen in der Antwortnutzlast müssen mit den Datensätzen in der Anforderungsnutzlast übereinstimmen. Die folgenden Tabellen zeigen Beispiele für Antwortdaten in verschiedenen Formaten. Ihre Daten können von diesen Beispielen abweichen, sofern die Vorhersagen entsprechend der Analysekonfiguration extrahiert werden können.

In den folgenden Abschnitten werden beispielhafte Endpunktreaktionen im JSON Linienformat gezeigt.

Die folgende Tabelle ist ein Beispiel für eine Endpunktantwort, die nur den Wahrscheinlichkeitswert (Score) ausgibt.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"score":0.6}'

Zwei Datensätze

'{"score":0.6}\n{"score":0.3}'

Legen Sie für das vorherige Beispiel den Analyse-Konfigurationsparameter probability auf den JMESPath Ausdruck „score“ fest, um seinen Wert zu extrahieren.

Die folgende Tabelle ist ein Beispiel für eine Endpunktantwort, bei der nur die vorhergesagte Beschriftung ausgegeben wird.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"Prognose“ :1}'

Zwei Datensätze

'{"Vorhersage“ :1}\n{"Vorhersage“ :0}'

Setzen Sie für das vorherige Beispiel den label Parameter der Prädiktorkonfiguration auf JMESPath Ausdruckprediction. Anschließend kann der Verarbeitungsjob SageMaker Clarify die vorhergesagten Labels für die Bias-Analyse extrahieren. Weitere Informationen finden Sie unter Konfigurationsdateien für die Analyse.

Die folgende Tabelle ist ein Beispiel für eine Endpunktreaktion, bei der die vorhergesagte Beschriftung und sein Ergebnis ausgegeben werden.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"Prognose“ :1, "Ergebnis“ :0,6}'

Zwei Datensätze

'{"Vorhersage“ :1, "Ergebnis“ :0,6}\n{"Vorhersage“ :0, "Ergebnis“ :0,3}'

Legen Sie für das vorherige Beispiel den label Parameter der predictor Konfiguration auf den JMESPath Ausdruck „Prognose“ fest, um die vorhergesagten Kennzeichnungen zu extrahieren. Stellen Sie probability den JMESPath Ausdruck „Score“ ein, um die Wahrscheinlichkeit zu extrahieren. Weitere Informationen finden Sie unter Konfigurationsdateien für die Analyse.

Die folgende Tabelle ist ein Beispiel für eine Endpunktantwort aus einem Mehrklassenmodell, das Folgendes ausgibt:

  • Eine Liste der vorhergesagten Beschriftungen.

  • Wahrscheinlichkeiten und das ausgewählte vorhergesagte Label und seine Wahrscheinlichkeit.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"predicted_label“ :"dog“, "probability“ :0.6, "predicted_labels“: ["cat“, "dog“, "fish "], "wahrscheinlichkeiten“: [0.1,0.6,0.3]}'

Zwei Datensätze

'{"predicted_label“ :"dog“, "probability“ :0.6, "predicted_labels“: ["cat“, "dog“, "fish "], "wahrscheinlichkeiten“: [0.1,0.6,0.3]}\n{"predicted_label“ :"cat“, "probability“ :0.7, "predicted_labels“: ["cat“, "dog“, "fish "], "Wahrscheinlichkeiten“: [0.7,0.2,0.1]}'

Im vorherigen Beispiel kann der Verarbeitungsauftrag SageMaker Clarify auf verschiedene Arten konfiguriert werden, um die Vorhersagen zu extrahieren.

Für die Bias-Analyse kann das vorherige Beispiel wie Folgendes konfiguriert werden.

  • Setzen Sie den label Parameter der predictor Konfiguration auf den JMESPath Ausdruck „predicted_label“, um das vorhergesagte Label zu extrahieren.

  • Setzen Sie den Parameter auf den JMESPath Ausdruck „predicted_labels“, um die vorhergesagten Labels zu extrahieren. Stellen Sie probability den JMESPath Ausdruck „Wahrscheinlichkeiten“ ein, um ihre Wahrscheinlichkeiten zu extrahieren. Der SageMaker Clarify-Job bestimmt automatisch das vorhergesagte Label, indem es das Label mit dem höchsten Wahrscheinlichkeitswert identifiziert.

  • Geben Sie probability den JMESPath Ausdruck „Wahrscheinlichkeiten“ ein, um deren Wahrscheinlichkeiten zu extrahieren. Wenn label_headers angegeben, kann der SageMaker Clarify-Verarbeitungsjob automatisch das vorhergesagte Label ermitteln, indem das Label mit dem höchsten Wahrscheinlichkeitswert identifiziert wird.

Gehen Sie zur Analyse der Featuresbedeutung wie folgt vor.

  • Geben Sie probability den JMESPath Ausdruck „Wahrscheinlichkeiten“ ein, um deren Wahrscheinlichkeiten für alle vorhergesagten Kennzeichnungen zu extrahieren. Anschließend werden die Feature-Attributionen für alle Beschriftung berechnet.

Endpoint Response hat das Format JSON

Wenn die Antwort-Payload im JSON Format (MIMEtype:application/json) vorliegt, deserialisiert der SageMaker Clarificy-Verarbeitungsjob die gesamte Payload als. JSON Anschließend werden mithilfe von Ausdrücken, die in der Analysekonfiguration bereitgestellt werden, Vorhersagen aus den deserialisierten Daten extrahiertJMESPath. Die Datensätze in der Antwortnutzlast müssen mit den Datensätzen in der Anforderungsnutzlast übereinstimmen.

Die folgenden Abschnitte zeigen Beispiele für Endpunktantworten in JSON Formaten. Die Abschnitte enthalten Tabellen mit Beispielen für Antwortdaten in verschiedenen Formaten und für verschiedene Problemtypen. Ihre Daten können von diesen Beispielen abweichen, sofern die Vorhersagen entsprechend der Analysekonfiguration extrahiert werden können.

Die folgende Tabelle ist ein Beispiel für eine Antwort von einem Endpunkt, die nur den Wahrscheinlichkeitswert (Score) ausgibt.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'[0.6]'

Zwei Datensätze

'0.6,0.3'

Im vorherigen Beispiel gibt es keinen Zeilenumbruch in der Antwortnutzlast. Stattdessen enthält ein einzelnes JSON Objekt eine Liste von Ergebnissen, eine für jeden Datensatz in der Anfrage. Setzen Sie den Analyse-Konfigurationsparameter probability auf den JMESPath Ausdruck „[*]“, um den Wert zu extrahieren.

Die folgende Tabelle ist eine Beispielantwort von einem Endpunkts, die nur das vorhergesagte Label ausgibt.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"predicted_labels“: [1]}'

Zwei Datensätze

'{"predicted_labels“: [1,0]}'

Setzen Sie den label Parameter der predictor Konfiguration auf den JMESPath Ausdruck „predicted_labels“. Anschließend kann der Clarify-Verarbeitungsjob die SageMaker vorhergesagten Labels für die Bias-Analyse extrahieren.

Die folgende Tabelle ist ein Beispiel für eine Antwort von einem Endpunkt, die das vorhergesagte Label und seinen Score ausgibt.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'{"Vorhersagen“: [{"label“ :1, "Ergebnis“ :0.6}'

Zwei Datensätze

'{"Vorhersagen“: [{"label“ :1, "score“ :0.6}, {"label“ :0, "score“ :0.3}]}'

Setzen Sie für das vorherige Beispiel den label Parameter der predictor Konfiguration auf den JMESPath Ausdruck „predictions [*] .label“, um die vorhergesagten Labels zu extrahieren. Stellen Sie probability den JMESPath Ausdruck „predictions [*] .score“ ein, um die Wahrscheinlichkeit zu extrahieren.

Die folgende Tabelle ist ein Beispiel für eine Antwort von einem Endpunkt aus einem Mehrklassenmodell, das Folgendes ausgibt:

  • Eine Liste der vorhergesagten Labels.

  • Wahrscheinlichkeiten und das ausgewählte vorhergesagte Label und seine Wahrscheinlichkeit.

Nutzlast der Endpunktanforderung Nutzlast der Endpunktantwort (Zeichenkettendarstellung)

Einzelner Datensatz

'[{"predicted_label“ :"dog“, "probability“ :0.6, "predicted_labels“: ["cat“, "dog“, "fish "], "wahrscheinlichkeiten“: [0.1,0.6,0.3]}]'

Zwei Datensätze

'[{"predicted_label“ :"dog“, "probability“ :0.6, "predicted_labels“: ["cat“, "dog“, "fish "], "probilities“: [0.1,0.6,0.3]}, {"predicted_label“ :"cat“, "probability“ :0.7, "predicted_labels“: ["cat“, "dog“, "fish "], "Wahrscheinlichkeiten“: [0.7,0.2,0.1]}]'

Der Verarbeitungsjob SageMaker Clarify kann auf verschiedene Arten konfiguriert werden, um die Vorhersagen zu extrahieren.

Für die Bias-Analyse kann das vorherige Beispiel wie Folgendes konfiguriert werden.

  • Setzen Sie den label Parameter der predictor Konfiguration auf den JMESPath Ausdruck „[*] .predicted_label“, um das vorhergesagte Label zu extrahieren.

  • Setzen Sie den Parameter auf den JMESPath Ausdruck „[*] .predicted_labels“, um die vorhergesagten Labels zu extrahieren. Stellen Sie probability den JMESPath Ausdruck „[*] .probabilities“ ein, um ihre Wahrscheinlichkeiten zu extrahieren. Der Verarbeitungsauftrag SageMaker Clarify kann das vorhergesagte Label automatisch ermitteln, indem das Label mit dem höchsten Näherungswert identifiziert wird.

  • Geben Sie probability den JMESPath Ausdruck „[*] .probabilities“ ein, um ihre Wahrscheinlichkeiten zu extrahieren. Wenn label_headers angegeben, kann der Verarbeitungsjob SageMaker Clarify automatisch das vorhergesagte Label ermitteln, indem das Label mit dem höchsten Wahrscheinlichkeitswert identifiziert wird.

Legen Sie für die Analyse der JMESPath Merkmalsbedeutung probability den Ausdruck „[*] .probabilities“ fest, um deren Wahrscheinlichkeiten für alle vorhergesagten Labels zu extrahieren. Anschließend werden die Feature-Attributionen für alle Beschriftung berechnet.