Richieste endpoint per dati tabulari - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Richieste endpoint per dati tabulari

Per ottenere previsioni basate sui modelli per l'analisi delle distorsioni post-allenamento e l'analisi dell'importanza delle funzionalità, i processi di elaborazione di SageMaker Clarify serializzano i dati tabulari in byte e li inviano a un endpoint di inferenza come payload di richieste. Questi dati tabulari provengono dal set di dati di input o vengono generati. Se si tratta di dati sintetici, vengono generati dall'esplicatore per l'analisi o l'analisi. SHAP PDP

Il formato dei dati di payload della richiesta deve essere specificato dal parametro content_type di configurazione dell'analisi. Se il parametro non viene fornito, il processo di elaborazione di SageMaker Clarify utilizzerà il valore del dataset_type parametro come tipo di contenuto. Per ulteriori informazioni su content_type odataset_type, vedereFile di configurazione dell'analisi.

Le sezioni seguenti mostrano esempi di richieste di endpoint nei formati CSV e JSON Lines.

Il processo di elaborazione di SageMaker Clarify può serializzare i dati in CSV formato (MIMEtipo:). text/csv La seguente tabella mostra esempi dei payload di richiesta serializzati.

Payload di richiesta dell'endpoint (rappresentazione di stringhe) Commenti

'1,2,3,4'

Record singolo (quattro funzionalità numeriche).

'1,2,3,4\n5,6,7,8'

Due record, separati da un'interruzione di riga \n.

'"Questo è un buon prodotto",5'

Record singolo (una funzionalità testuale e una numerica).

'"Questo è un buon prodotto",5\n"Pessima esperienza di acquisto",1'

Due record.

Il processo di elaborazione SageMaker Clarify può serializzare i dati in formato SageMaker JSON Lines denso (MIMEtipo:). application/jsonlines Per ulteriori informazioni su JSON Lines, vedere. JSONLINESformato della richiesta

Per trasformare i dati tabulari in JSON dati, fornite una stringa modello al content_template parametro di configurazione dell'analisi. Per ulteriori informazioni su content_template, consulta File di configurazione dell'analisi. La tabella seguente mostra esempi di payload serializzati di richieste JSON Lines.

Payload di richiesta dell'endpoint (rappresentazione di stringhe) Commenti

'{"data":{"features":[1,2,3,4]}}'

Record singolo. In questo caso, la stringa di esempio assomiglia a'{"data":{"features":$features}}' e $features viene sostituito dall'elenco delle funzionalità [1,2,3,4].

'{"data":{"features":[1,2,3,4]}}\n{"data":{"features":[5,6,7,8]}}'

Due record.

'{"features":["Questo è un buon prodotto",5]}'

Record singolo. In questo caso, la stringa di esempio assomiglia a '{"features":$features}' e $features viene sostituito dall'elenco delle funzionalità ["This is a good product",5].

'{"features":["Questo è un buon prodotto",5]}\n{"features":["Pessima esperienza di acquisto",1]}'

Due record.

Un processo di elaborazione di SageMaker Clarify può serializzare i dati in JSON strutture arbitrarie (MIMEtipo:). application/json A tale scopo, è necessario fornire una stringa di esempio al parametro content_template di configurazione dell'analisi. Viene utilizzato dal processo di elaborazione SageMaker Clarify per costruire la struttura esterna. JSON È inoltre necessario fornire una stringa modello perrecord_template, che viene utilizzata per costruire la JSON struttura di ogni record. Per ulteriori informazioni su content_template e record_template, consulta File di configurazione dell'analisi.

Nota

Poiché content_template e record_template sono parametri di stringa, tutti i caratteri con virgolette doppie (") che fanno parte della struttura JSON serializzata devono essere annotati come caratteri di escape nella configurazione. Ad esempio, se vuoi evitare una virgoletta doppia in Python, puoi inserire quanto segue per content_template.

"{\"data\":{\"features\":$record}}}"

La tabella seguente mostra esempi di payload di JSON richieste serializzate e i record_template parametri corrispondenti content_template e necessari per costruirli.

Payload di richiesta dell'endpoint (rappresentazione di stringhe) Commenti content_template record_template

'{"data":{"features":[1,2,3,4]}}'

Un singolo record alla volta.

'{"data":{"features":$record}}}'

"$features"

'{"instances":[[0, 1], [3, 4]], "feature-names": ["A", "B"]}'

Record multipli con nomi di funzionalità.

{"instances":$records, "feature-names":$feature_names}'

"$features"

'[{"A": 0, "B": 1}, {"A": 3, "B": 4}]'

Coppie multi-record e chiave-valore.

"$records"

"$features_kvp"

'{"A": 0, "B": 1}'

Un record alla volta e coppie chiave-valore.

"$record"

"$features_kvp"

'{"A": 0, "nested": {"B": 1}}'

In alternativa, usa il record_template completo per strutture arbitrarie.

"$record"

'{"A": "${A}", "nested": {"B": "${B}"}}'