Ottimizzazione GPU: Classificazione o Regressione Input: formato della richiesta di classificazione o regressione Output: formato della risposta di classificazione o regressione

Formati dei dati per l'inferenza Object2Vec

La pagina seguente descrive i formati di richiesta di input e output di risposta per ottenere l'inferenza del punteggio dal modello Amazon SageMaker AI Object2Vec.

Ottimizzazione GPU: Classificazione o Regressione

A causa della scarsità di memoria della GPU, è possibile specificare la variabile di INFERENCE_PREFERRED_MODE ambiente per ottimizzare il caricamento della rete di inferenza classification/regression o della rete di inferenza nella GPU. Output: Encoder Embedding Se la maggior parte dell'inferenza riguarda aspetti di classificazione o regressione, specificare INFERENCE_PREFERRED_MODE=classification. Di seguito è riportato un esempio di Batch Transform dell'utilizzo di 4 istanze di p3.2xlarge ottimizzate per l'inferenza: classification/regression


transformer = o2v.transformer(instance_count=4,
                              instance_type="ml.p2.xlarge",
                              max_concurrent_transforms=2,
                              max_payload=1,  # 1MB
                              strategy='MultiRecord',
                              env={'INFERENCE_PREFERRED_MODE': 'classification'},  # only useful with GPU
                              output_path=output_s3_path)

Input: formato della richiesta di classificazione o regressione

Content-type: application/json


{
  "instances" : [
    {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]},
    {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]},
    {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
  ]
}

Content-type: application/jsonlines


{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}
{"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}
{"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}

Per i problemi di classificazione, la lunghezza del vettore dei punteggi corrisponde a num_classes. Per i problemi di regressione, la lunghezza è 1.

Output: formato della risposta di classificazione o regressione

Accetta: application/json


{
    "predictions": [
        {
            "scores": [
                0.6533935070037842,
                0.07582679390907288,
                0.2707797586917877
            ]
        },
        {
            "scores": [
                0.026291321963071823,
                0.6577019095420837,
                0.31600672006607056
            ]
        }
    ]
}

Accetta: application/jsonlines


{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]}
{"scores":[0.251988261938095,0.258233487606048,0.489778339862823]}
{"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}

Nei formati di classificazione e di regressione, i punteggi si applicano a singole etichette.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Formati di addestramento

Formati di inferenza: Embeddings