richiamare l'endpoint - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

richiamare l'endpoint

Dopo l'esecuzione dell'endpoint, utilizzate il servizio SageMaker Runtime InvokeEndpointAPIin the SageMaker Runtime per inviare richieste o richiamare l'endpoint. In risposta, le richieste vengono gestite come richieste di spiegabilità dall'esplicatore Clarify. SageMaker

Nota

Per richiamare un endpoint, scegli una delle seguenti opzioni:

Richiesta

InvokeEndpointAPIHa un parametro opzionaleEnableExplanations, che è mappato all'intestazione. HTTP X-Amzn-SageMaker-Enable-Explanations Se viene fornito questo parametro, sostituisce il parametro EnableExplanations di ClarifyExplainerConfig.

Nota

I Accept parametri ContentType e di InvokeEndpoint API sono obbligatori. I formati supportati includono MIME type text/csv eapplication/jsonlines.

Utilizza il sagemaker_runtime_client per inviare una richiesta all'endpoint, come segue:

response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )

Per gli endpoint multimodello, passate un TargetModel parametro aggiuntivo nella precedente richiesta di esempio per specificare a quale modello indirizzare l'endpoint. L'endpoint a più modelli carica dinamicamente i modelli di destinazione in base alle esigenze. Per ulteriori informazioni sugli endpoint multimodello, consulta. Endpoint multi-modello Consultate il SageMaker Clarify Online Explainability on Multi-Model Endpoint Sample Notebook per un esempio di come configurare e richiamare più modelli di destinazione da un singolo endpoint.

Risposta

Se l'endpoint viene creato con ExplainerConfig, viene utilizzato un nuovo schema di risposta. Questo nuovo schema è diverso e non è compatibile con un endpoint privo del parametro ExplainerConfig fornito.

Il MIME tipo di risposta è application/json e il payload della risposta può essere decodificato da -8 byte a un oggetto. UTF JSON Quanto segue mostra che i membri di questo JSON oggetto sono i seguenti:

  • version: la versione dello schema di risposta in formato stringa. Ad esempio 1.0.

  • predictions: le previsioni effettuate dalla richiesta sono le seguenti:

    • content_type: Il MIME tipo di previsioni, che si riferisce alla risposta ContentType del contenitore del modello.

    • data: la stringa di dati delle previsioni fornita come payload della risposta del container del modello per la richiesta.

  • label_headers: le intestazioni delle etichette del parametro LabelHeaders. Viene fornito nella configurazione dello strumento esplicativo o nell'output del container del modello.

  • explanations: le spiegazioni fornite nel payload della richiesta. Se non viene spiegato alcun record, questo membro restituisce l'oggetto vuoto {}.

    • kernel_shap: Una chiave che fa riferimento a una serie di SHAP spiegazioni del kernel per ogni record della richiesta. Se un record non viene spiegato, la spiegazione corrispondente è null.

L'elemento kernel_shap dispone dei seguenti membri:

  • feature_header: il nome dell'intestazione delle caratteristiche fornite dal parametro FeatureHeaders nella configurazione dello strumento esplicativoExplainerConfig.

  • feature_type: il tipo di caratteristica dedotto dallo strumento esplicativo o fornito nel parametro FeatureTypes in ExplainerConfig. Questo elemento è disponibile solo per problemi di NLP spiegabilità.

  • attributions: un array di oggetti di attribuzione. Le caratteristiche del testo possono avere più oggetti di attribuzione, ciascuno per un'unità. L'oggetto attribuzione ha i seguenti membri:

    • attribution: un elenco di valori di probabilità, fornito per ogni classe.

    • description: La descrizione delle unità di testo, disponibile solo per problemi di NLP spiegabilità.

      • partial_text: la parte del testo spiegata dallo strumento esplicativo.

      • start_idx: un indice a base zero per identificare la posizione dell'array all'inizio del frammento di testo parziale.