Entrées du contrat de conteneur - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Entrées du contrat de conteneur

La plateforme Amazon SageMaker Model Monitor invoque votre code de conteneur selon un calendrier défini. Si vous avez choisi d'écrire votre propre code de conteneur, les variables d'environnement suivantes sont disponibles. Dans ce contexte, vous pouvez analyser le jeu de données actuel ou évaluer les contraintes si vous le souhaitez et émettre des métriques, le cas échéant.

Les variables d'environnement disponibles sont les mêmes pour les points de terminaison en temps réel et les tâches de transformation par lots, à l'exception de la variable dataset_format. Si vous utilisez un point de terminaison en temps réel, la variable dataset_format prend en charge les options suivantes :

{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}

Si vous utilisez une tâche de transformation par lots, dataset_format prend en charge les options suivantes :

{\"csv\": {\"header\": [\"true\",\"false\"]}}
{\"json\": {\"line\": [\"true\",\"false\"]}}
{\"parquet\": {}}

L'exemple de code suivant montre le jeu complet des variables d'environnement disponibles pour votre code de conteneur (et utilise le format dataset_format d'un point de terminaison en temps réel).

"Environment": { "dataset_format": "{\"sagemakerCaptureJson\": {\"captureIndexNames\": [\"endpointInput\",\"endpointOutput\"]}}", "dataset_source": "/opt/ml/processing/endpointdata", "end_time": "2019-12-01T16: 20: 00Z", "output_path": "/opt/ml/processing/resultdata", "publish_cloudwatch_metrics": "Disabled", "sagemaker_endpoint_name": "endpoint-name", "sagemaker_monitoring_schedule_name": "schedule-name", "start_time": "2019-12-01T15: 20: 00Z" }

Paramètres

Nom du paramètre Description
dataset_format

Pour une tâche démarrée à partir d'un MonitoringSchedule basé sur un Endpoint, il s'agit de sageMakerCaptureJson avec les indices de capture endpointInput et/ou endpointOutput. Pour une tâche de transformation par lots, cela indique le format des données, qu'il s'agisse de CSVJSON, ou de Parquet.

dataset_source

Si vous utilisez un point de terminaison en temps réel, le chemin d'accès local dans lequel les données correspondant à la période de surveillance, comme spécifié par start_time et end_time, sont disponibles. Dans ce chemin d'accès, les données sont disponibles dans /{endpoint-name}/{variant-name}/yyyy/mm/dd/hh.

Nous téléchargeons parfois plus de données que ce qui est spécifié par les heures de début et de fin. C'est au code de conteneur d'analyser les données selon les besoins.

output_path

Chemin d'accès local où écrire des rapports de sortie et d'autres fichiers. Vous devez spécifier ce paramètre dans la demande CreateMonitoringSchedule comme MonitoringOutputConfig.MonitoringOutput[0].LocalPath. Il est chargé dans le chemin d'accès S3Uri spécifié dans MonitoringOutputConfig.MonitoringOutput[0].S3Uri.

publish_cloudwatch_metrics

Pour une tâche lancée par CreateMonitoringSchedule, ce paramètre est défini sur Enabled. Le conteneur peut choisir d'écrire le fichier de CloudWatch sortie Amazon à l'adresse[filepath].

sagemaker_endpoint_name

Si vous utilisez un point de terminaison en temps réel, le nom du Endpoint pour lequel cette tâche planifiée a été lancée.

sagemaker_monitoring_schedule_name

Nom du MonitoringSchedule qui a lancé cette tâche.

*sagemaker_endpoint_datacapture_prefix*

Si vous utilisez un point de terminaison en temps réel, le préfixe spécifié dans le paramètre DataCaptureConfig du Endpoint. Le conteneur peut l'utiliser s'il a besoin d'accéder directement à plus de données que celles déjà téléchargées par SageMaker at the dataset_source path.

start_time, end_time

Fenêtre horaire pour l'analyse exécutée. Par exemple, pour une tâche dont l'exécution est prévue à 05h00 UTC et une tâche exécutée le 20/02/2020, start_time : est 2020-02-19T 06:00:00 Z et : est 2020-02-20T 05:00:00 Z end_time

baseline_constraints:

Chemin d'accès local du fichier de contrainte de référence spécifié dans BaselineConfig.ConstraintResource.S3Uri. Ce paramètre est disponible uniquement si ce paramètre a été spécifié dans la demande CreateMonitoringSchedule.

baseline_statistics

Chemin d'accès local au fichier de statistiques de référence spécifié dans BaselineConfig.StatisticsResource.S3Uri. Ce paramètre est disponible uniquement si ce paramètre a été spécifié dans la demande CreateMonitoringSchedule.