Endpunktanforderungen für Tabellendaten

Fokusmodus

Endpunktanforderungen für Tabellendaten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Um Modellvorhersagen für die Verzerrungsanalyse nach dem Training und die Analyse der Merkmalswichtigkeit zu erhalten, serialisieren SageMaker Clarify-Verarbeitungsaufträge die Tabellendaten in Byte und senden diese als Anforderungs-Payload an einen Inferenzendpunkt. Diese tabellarischen Daten stammen entweder aus dem Eingabedatensatz oder sie werden generiert. Handelt es sich um synthetische Daten, werden sie vom Erklärer für die SHAP- oder PDP-Analyse generiert.

Das Datenformat der Anforderungs-Payload sollte durch den Analyse- content_type Konfigurationsparameter angegeben werden. Wenn der Parameter nicht angegeben wird, verwendet der SageMaker Clarif-Verarbeitungsauftrag den Wert des dataset_type Parameters als Inhaltstyp. Weitere Informationen zu content_type oder finden dataset_type Sie unterKonfigurationsdateien für die Analyse.

Die folgenden Abschnitte zeigen Beispiele für Endpunktanforderungen in den Formaten CSV und JSON Lines.

Der Verarbeitungsauftrag SageMaker Clarify kann Daten in das CSV-Format (MIME-Typ:text/csv) serialisieren. In der folgenden Tabelle werden Beispiele für serialisierte Anforderungs-Payloads dargestellt.

Payload für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare
'1,2,3,4'	Einzelner Datensatz (vier numerische Features).
'1,2,3,4\n5,6,7,8'	Zwei Datensätze, getrennt durch einen Zeilenumbruch '\n'.
'"Das ist ein gutes Produkt“ ,5'	Einzelner Datensatz (ein Textfeature und ein numerisches Feature).
'"Das ist ein gutes Produkt“ ,5\n„Schlechtes Einkaufserlebnis“ ,1'	Zwei Datensätze.

Endpunkt-Anfrage im CSV-Format

Payload für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare
'1,2,3,4'	Einzelner Datensatz (vier numerische Features).
'1,2,3,4\n5,6,7,8'	Zwei Datensätze, getrennt durch einen Zeilenumbruch '\n'.
'"Das ist ein gutes Produkt“ ,5'	Einzelner Datensatz (ein Textfeature und ein numerisches Feature).
'"Das ist ein gutes Produkt“ ,5\n„Schlechtes Einkaufserlebnis“ ,1'	Zwei Datensätze.

Der Verarbeitungsjob SageMaker Clarify kann Daten in das dichte Format SageMaker AI JSON Lines (MIME-Typ:application/jsonlines) serialisieren. Weitere Informationen zu JSON-Zeilen finden Sie unter JSONLINES-Anforderungsformat.

Um Tabellendaten in JSON-Daten umzuwandeln, geben Sie eine Vorlagenzeichenfolge für den content_template Analyse-Konfigurationsparameter an. Weitere Informationen zu content_template finden Sie unter Konfigurationsdateien für die Analyse. Die folgende Tabelle zeigt Beispiele für serialisierte JSON-Lines-Anforderungs-Payloads.

Nutzlast für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare
'{"data“: {"Funktionen“: [1,2,3,4]}}'	Einzelner Datensatz. In diesem Fall sieht die Vorlage wie die Liste der Funktionen aus `'{"data":{"features":$features}}'` und `$features` wird durch `[1,2,3,4]` diese ersetzt.
'{"Daten“: {"Funktionen“: [1,2,3,4]}}\n{"Daten“: {"Funktionen“: [5,6,7,8]}}'	Zwei Datensätze.
'{"features“: ["Das ist ein gutes Produkt“ ,5]}'	Einzelner Datensatz. In diesem Fall sieht die Vorlage so `'{"features":$features}'` aus und $features wird durch die Liste der `["This is a good product",5]` Funktionen ersetzt.
'{"features“: ["Das ist ein gutes Produkt“ ,5]}\n{"features“: ["Schlechtes Einkaufserlebnis“ ,1]}'	Zwei Datensätze.

Die Endpunktanforderung ist im Format JSON Lines

Nutzlast für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare
'{"data“: {"Funktionen“: [1,2,3,4]}}'	Einzelner Datensatz. In diesem Fall sieht die Vorlage wie die Liste der Funktionen aus `'{"data":{"features":$features}}'` und `$features` wird durch `[1,2,3,4]` diese ersetzt.
'{"Daten“: {"Funktionen“: [1,2,3,4]}}\n{"Daten“: {"Funktionen“: [5,6,7,8]}}'	Zwei Datensätze.
'{"features“: ["Das ist ein gutes Produkt“ ,5]}'	Einzelner Datensatz. In diesem Fall sieht die Vorlage so `'{"features":$features}'` aus und $features wird durch die Liste der `["This is a good product",5]` Funktionen ersetzt.
'{"features“: ["Das ist ein gutes Produkt“ ,5]}\n{"features“: ["Schlechtes Einkaufserlebnis“ ,1]}'	Zwei Datensätze.

Ein SageMaker Clarif-Verarbeitungsjob kann Daten in beliebige JSON-Strukturen (MIME-Typ:application/json) serialisieren. Dazu müssen Sie eine Vorlagenzeichenfolge für den content_template Analyse-Konfigurationsparameter angeben. Dies wird vom SageMaker Clarif-Verarbeitungsjob verwendet, um die äußere JSON-Struktur zu erstellen. Sie müssen auch eine Vorlagenzeichenfolge für record_template angeben, die verwendet wird, um die JSON-Struktur für jeden Datensatz zu erstellen. Weitere Informationen zu content_template und record_template finden Sie unter Konfigurationsdateien für die Analyse.

Anmerkung

Da es sich bei content_template und record_template um Zeichenkettenparameter handelt, sollten alle doppelten Anführungszeichen ("), die Teil der serialisierten JSON-Struktur sind, in Ihrer Konfiguration als Escape-Zeichen vermerkt werden. Wenn Sie beispielsweise ein doppeltes Anführungszeichen in Python umgehen möchten, könnten Sie Folgendes für content_template eingeben.


"{\"data\":{\"features\":$record}}}"

Die folgende Tabelle zeigt Beispiele für serialisierte JSON-Anforderungs-Payloads und die entsprechenden content_template und record_template N-Parameter, die zu ihrer Erstellung erforderlich sind.

Nutzlast für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare	content_template	Datensatzvorlage
'{"data“: {"Funktionen“: [1,2,3,4]}}'	Einzelner Datensatz auf einmal.	'{"Daten“: {"Funktionen“ :$record}}}'	“$features”
'{"Instances“: [[0, 1], [3, 4]], „Funktionsnamen“: ["A“, „B"]}'	Mehrere Datensätze mit Feature-Namen.	'{"Instances“ :$records, „Feature-Namen“ :$feature_names}'	“$features"
'[{"A“: 0, „B“: 1}, {"A“: 3, „B“: 4}]'	Mehrfachdatensätze und Schlüssel-Wert-Paare.	“$records"	„$features_kvp“
'{"A“: 0, „B“: 1}'	Einzelner Datensatz auf einmal und Schlüssel-Wert-Paare.	"$record"	„$features_kvp“
'{"A“: 0, „verschachtelt“: {"B“: 1}}'	Verwenden Sie alternativ das vollständig ausführliche record_template für beliebige Strukturen.	"$record"	'{"A“: „$ {A}“, „verschachtelt“: {"B“: „$ {B}"}}'

Die Endpunkt-Anfrage verwendet das JSON-Format

Anmerkung


"{\"data\":{\"features\":$record}}}"

Nutzlast für Endpunktanfragen (Zeichenkettendarstellung)	Kommentare	content_template	Datensatzvorlage
'{"data“: {"Funktionen“: [1,2,3,4]}}'	Einzelner Datensatz auf einmal.	'{"Daten“: {"Funktionen“ :$record}}}'	“$features”
'{"Instances“: [[0, 1], [3, 4]], „Funktionsnamen“: ["A“, „B"]}'	Mehrere Datensätze mit Feature-Namen.	'{"Instances“ :$records, „Feature-Namen“ :$feature_names}'	“$features"
'[{"A“: 0, „B“: 1}, {"A“: 3, „B“: 4}]'	Mehrfachdatensätze und Schlüssel-Wert-Paare.	“$records"	„$features_kvp“
'{"A“: 0, „B“: 1}'	Einzelner Datensatz auf einmal und Schlüssel-Wert-Paare.	"$record"	„$features_kvp“
'{"A“: 0, „verschachtelt“: {"B“: 1}}'	Verwenden Sie alternativ das vollständig ausführliche record_template für beliebige Strukturen.	"$record"	'{"A“: „$ {A}“, „verschachtelt“: {"B“: „$ {B}"}}'