

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Implementazione del modello su larga scala
<a name="jumpstart-text-classification-scale"></a>

Configura l'auto-scaling CloudWatch e il monitoraggio per il SageMaker tuo endpoint AI per renderlo pronto per la produzione.

## Perché il monitoraggio della produzione è importante per la classificazione del testo
<a name="w2aac37c15c27b5"></a>

I carichi di lavoro di classificazione del testo richiedono il monitoraggio perché:
+ Sono soggetti a modelli di traffico variabili con picchi di elaborazione.
+ Richiedono tempi di risposta inferiori al secondo.
+ Hanno bisogno di ottimizzare i costi attraverso il dimensionamento automatico.

## Prerequisiti
<a name="w2aac37c15c27b7"></a>

Prima di iniziare, assicurati di avere:
+ Il tuo endpoint SageMaker AI implementato nella sezione precedente.
+ Il nome del tuo endpoint (ad esempio,). jumpstart-dft-hf-tc
+ Il tuo Regione AWS (ad esempio, us-east-2).

Per la creazione o la risoluzione dei problemi degli endpoint, consulta [Inferenza in tempo reale](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html).

## Configurazione del monitoraggio in produzione
<a name="w2aac37c15c27b9"></a>

Configura CloudWatch il monitoraggio per monitorare le prestazioni del modello in produzione.

1. Nel tuo JupyterLab spazio, apri il `sagemaker_production_monitoring.ipynb` taccuino dal pacchetto di valutazione che hai caricato in precedenza.

1. Aggiorna il nome e la Regione dell’endpoint nella sezione di configurazione.

1. Per la configurazione, segui le istruzioni del notebook:
   + Dimensionamento automatico (1-10 istanze in base al traffico).
   + CloudWatch allarmi per le soglie di latenza e invocazione.
   + Dashboard di metriche per il monitoraggio visivo.

## Verifica della configurazione
<a name="w2aac37c15c27c11"></a>

Dopo aver completato le fasi del notebook, verifica di avere:
+ **Stato dell’endpoint**: `InService`.
+ **Dimensionamento automatico**: 1-10 istanze configurate.
+ **CloudWatch Allarmi: monitoraggio di 2 allarmi.**
+ **Metriche**: oltre 15 metriche registrate.

**Nota**  
All’inizio, gli allarmi possono visualizzare `INSUFFICIENT_DATA`. È un comportamento normale e il campo diventerà `OK` con l’utilizzo.

## Monitoraggio dell’endpoint
<a name="w2aac37c15c27c13"></a>

Accedi al monitoraggio visivo tramite la console di AWS gestione:
+ [CloudWatch Parametri](https://console.aws.amazon.com/cloudwatch/home#metricsV2:graph=~();query=AWS/SageMaker)
+ [CloudWatch Allarmi](https://console.aws.amazon.com/cloudwatch/home#alarmsV2:)

Per ulteriori informazioni, consulta [Monitor SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-overview.html).

## Gestione dei costi e pulizia delle risorse
<a name="w2aac37c15c27c15"></a>

La configurazione di monitoraggio fornisce preziose informazioni sulla produzione, ma comporta anche AWS costi continui attraverso CloudWatch metriche, allarmi e politiche di auto-scaling. Comprendere come gestire questi costi è essenziale per operazioni economicamente convenienti. Elimina le risorse quando non sono più necessarie.

**avvertimento**  
L’endpoint continua a comportare costi anche quando non elabora le richieste. Per arrestare tutti gli addebiti, è necessario eliminare l’endpoint. Per istruzioni, consulta [Eliminazione di endpoint e risorse](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints-delete-resources.html).

[Per configurazioni di monitoraggio avanzate, consulta Metrics for AI. CloudWatch SageMaker ](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html)