Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Il est conseillé de déployer votre modèle sur un point de terminaison d'inférence en temps réel basé sur l' SageMaker IA et d'envoyer des demandes au point de terminaison. Examinez manuellement les demandes et les réponses pour vous assurer qu'elles sont conformes aux exigences des Réponse du point de terminaison pour les données de séries chronologiques sections Demandes de données de séries chronologiques adressées aux terminaux et. Si votre modèle de conteneur prend en charge les demandes par lots, vous pouvez commencer par une seule demande d'enregistrement, puis essayer deux enregistrements ou plus.
Les commandes suivantes montrent comment demander une réponse à l'aide du AWS CLI. AWS CLI Il est préinstallé dans les instances Studio et SageMaker Notebook. Pour l'installer AWS CLI, suivez le guide d'installation
aws sagemaker-runtime invoke-endpoint \
--endpoint-name $ENDPOINT_NAME \
--content-type $CONTENT_TYPE \
--accept $ACCEPT_TYPE \
--body $REQUEST_DATA \
$CLI_BINARY_FORMAT \
/dev/stderr 1>/dev/null
Les paramètres sont définis, comme suit :
$ENDPOINT NAME — Le nom du point de terminaison.
$CONTENT_TYPE — Type MIME de la demande (entrée du conteneur du modèle).
$ACCEPT_TYPE — Type MIME de la réponse (modèle de sortie du conteneur).
$REQUEST_DATA — La chaîne de charge utile demandée.
$CLI_BINARY_FORMAT — Format du paramètre d'interface de ligne de commande (CLI). Pour AWS CLI la version 1, ce paramètre doit rester vide. Pour la version 2, ce paramètre doit être défini sur
--cli-binary-format raw-in-base64-out
.
Note
AWS CLI v2 transmet les paramètres binaires sous forme de chaînes codées en base64 par défaut. Les exemples de demande et de réponse suivants à destination et en provenance du point de terminaison utilisent la AWS CLI version v1.
Dans l'exemple de code suivant, la demande consiste en un seul enregistrement.
aws sagemaker-runtime invoke-endpoint \
--endpoint-name test-endpoint-json \
--content-type application/json \
--accept application/json \
--body '{"target": [1, 2, 3, 4, 5],
"start": "2024-01-01 01:00:00"}' \
/dev/stderr 1>/dev/null
L'extrait suivant montre le résultat de réponse correspondant.
{'predictions': {'mean': [1, 2, 3, 4, 5]}