Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Um Modellvorhersagen für die Verzerrungsanalyse nach dem Training und die Analyse der Merkmalswichtigkeit zu erhalten, serialisieren SageMaker Clarify-Verarbeitungsaufträge die Tabellendaten in Byte und senden diese als Anforderungs-Payload an einen Inferenzendpunkt. Diese tabellarischen Daten stammen entweder aus dem Eingabedatensatz oder sie werden generiert. Handelt es sich um synthetische Daten, werden sie vom Erklärer für die SHAP- oder PDP-Analyse generiert.
Das Datenformat der Anforderungs-Payload sollte durch den Analyse- content_type
Konfigurationsparameter angegeben werden. Wenn der Parameter nicht angegeben wird, verwendet der SageMaker Clarif-Verarbeitungsauftrag den Wert des dataset_type
Parameters als Inhaltstyp. Weitere Informationen zu content_type
oder finden dataset_type
Sie unterKonfigurationsdateien für die Analyse.
Die folgenden Abschnitte zeigen Beispiele für Endpunktanforderungen in den Formaten CSV und JSON Lines.
Der Verarbeitungsauftrag SageMaker Clarify kann Daten in das CSV-Format (MIME-Typ:text/csv
) serialisieren. In der folgenden Tabelle werden Beispiele für serialisierte Anforderungs-Payloads dargestellt.
Payload für Endpunktanfragen (Zeichenkettendarstellung) | Kommentare |
---|---|
'1,2,3,4' |
Einzelner Datensatz (vier numerische Features). |
'1,2,3,4\n5,6,7,8' |
Zwei Datensätze, getrennt durch einen Zeilenumbruch '\n'. |
'"Das ist ein gutes Produkt“ ,5' |
Einzelner Datensatz (ein Textfeature und ein numerisches Feature). |
'"Das ist ein gutes Produkt“ ,5\n„Schlechtes Einkaufserlebnis“ ,1' |
Zwei Datensätze. |
Der Verarbeitungsjob SageMaker Clarify kann Daten in das dichte Format SageMaker AI JSON Lines (MIME-Typ:application/jsonlines
) serialisieren. Weitere Informationen zu JSON-Zeilen finden Sie unter JSONLINES-Anforderungsformat.
Um Tabellendaten in JSON-Daten umzuwandeln, geben Sie eine Vorlagenzeichenfolge für den content_template
Analyse-Konfigurationsparameter an. Weitere Informationen zu content_template
finden Sie unter Konfigurationsdateien für die Analyse. Die folgende Tabelle zeigt Beispiele für serialisierte JSON-Lines-Anforderungs-Payloads.
Nutzlast für Endpunktanfragen (Zeichenkettendarstellung) | Kommentare |
---|---|
'{"data“: {"Funktionen“: [1,2,3,4]}}' |
Einzelner Datensatz. In diesem Fall sieht die Vorlage wie die Liste der Funktionen aus |
'{"Daten“: {"Funktionen“: [1,2,3,4]}}\n{"Daten“: {"Funktionen“: [5,6,7,8]}}' |
Zwei Datensätze. |
'{"features“: ["Das ist ein gutes Produkt“ ,5]}' |
Einzelner Datensatz. In diesem Fall sieht die Vorlage so |
'{"features“: ["Das ist ein gutes Produkt“ ,5]}\n{"features“: ["Schlechtes Einkaufserlebnis“ ,1]}' |
Zwei Datensätze. |
Ein SageMaker Clarif-Verarbeitungsjob kann Daten in beliebige JSON-Strukturen (MIME-Typ:application/json
) serialisieren. Dazu müssen Sie eine Vorlagenzeichenfolge für den content_template
Analyse-Konfigurationsparameter angeben. Dies wird vom SageMaker Clarif-Verarbeitungsjob verwendet, um die äußere JSON-Struktur zu erstellen. Sie müssen auch eine Vorlagenzeichenfolge für record_template
angeben, die verwendet wird, um die JSON-Struktur für jeden Datensatz zu erstellen. Weitere Informationen zu content_template
und record_template
finden Sie unter Konfigurationsdateien für die Analyse.
Anmerkung
Da es sich bei content_template
und record_template
um Zeichenkettenparameter handelt, sollten alle doppelten Anführungszeichen ("
), die Teil der serialisierten JSON-Struktur sind, in Ihrer Konfiguration als Escape-Zeichen vermerkt werden. Wenn Sie beispielsweise ein doppeltes Anführungszeichen in Python umgehen möchten, könnten Sie Folgendes für content_template
eingeben.
"{\"data\":{\"features\":$record}}}"
Die folgende Tabelle zeigt Beispiele für serialisierte JSON-Anforderungs-Payloads und die entsprechenden content_template
und record_template
N-Parameter, die zu ihrer Erstellung erforderlich sind.
Nutzlast für Endpunktanfragen (Zeichenkettendarstellung) | Kommentare | content_template | Datensatzvorlage |
---|---|---|---|
'{"data“: {"Funktionen“: [1,2,3,4]}}' |
Einzelner Datensatz auf einmal. |
'{"Daten“: {"Funktionen“ :$record}}}' |
“$features” |
'{"Instances“: [[0, 1], [3, 4]], „Funktionsnamen“: ["A“, „B"]}' |
Mehrere Datensätze mit Feature-Namen. |
'{"Instances“ :$records, „Feature-Namen“ :$feature_names}' |
“$features" |
'[{"A“: 0, „B“: 1}, {"A“: 3, „B“: 4}]' |
Mehrfachdatensätze und Schlüssel-Wert-Paare. |
“$records" |
„$features_kvp“ |
'{"A“: 0, „B“: 1}' |
Einzelner Datensatz auf einmal und Schlüssel-Wert-Paare. |
"$record" |
„$features_kvp“ |
'{"A“: 0, „verschachtelt“: {"B“: 1}}' |
Verwenden Sie alternativ das vollständig ausführliche record_template für beliebige Strukturen. |
"$record" |
'{"A“: „$ {A}“, „verschachtelt“: {"B“: „$ {B}"}}' |