Protection des communications entres instances de calcul ML dans une tâche d'entraînement distribué - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Protection des communications entres instances de calcul ML dans une tâche d'entraînement distribué

Par défaut, Amazon SageMaker exécute des tâches de formation dans un Amazon Virtual Private Cloud (AmazonVPC) afin de garantir la sécurité de vos données. Vous pouvez ajouter un niveau de sécurité supplémentaire pour protéger vos conteneurs de formation et vos données en configurant un système privéVPC. Les infrastructures et algorithmes ML distribués transmettent généralement des informations qui sont directement liées au modèle, telles que les pondérations, et non au jeu de données. Lorsque vous effectuez un entraînement distribué, vous pouvez mieux protéger les données qui sont transmises entre les instances. Cela peut vous aider à respecter les exigences réglementaires. Pour ce faire, utilisez le chiffrement du trafic entre conteneurs.

Note

Pour les cas d'utilisation dans le secteur de la santé, la bonne pratique en matière de sécurité consiste à chiffrer les communications entre les nœuds.

L'activation du chiffrement du trafic entre conteneurs peut augmenter la durée de l'entraînement, surtout si vous utilisez des algorithmes de deep learning distribués. L'activation du chiffrement du trafic entre conteneurs n'affecte pas les tâches d'entraînement ayant une instance de calcul unique. Cependant, pour les tâches d'entraînement possédant plusieurs instances de calcul, l'incidence sur la durée d'entraînement dépend du volume de communication entre les instances de calcul. Pour les algorithmes concernés, l'ajout de ce niveau de sécurité augmente également les coûts. Le temps d'apprentissage de la plupart des algorithmes SageMaker intégrésXGBoost, tels que DeePar et Linear Learner, n'est généralement pas affecté.

Vous pouvez activer le chiffrement du trafic entre conteneurs pour les tâches d'entraînement ou les tâches de réglage d'hyper-paramètre. Vous pouvez utiliser notre SageMaker APIs console pour activer le chiffrement du trafic entre conteneurs.

Pour plus d'informations sur l'exécution de tâches de formation dans un environnement privéVPC, consultezDonnez à SageMaker Training Jobs l'accès aux ressources de votre Amazon VPC.

Activer le chiffrement du trafic entre conteneurs () API

Avant d'activer le chiffrement du trafic inter-conteneurs lors de tâches d'entraînement ou de réglage d'hyperparamètresAPIs, ajoutez des règles entrantes et sortantes au groupe de sécurité de votre compte privéVPC.

Pour activer le chiffrement du trafic entre conteneurs () API
  1. Ajoutez les règles entrantes et sortantes suivantes dans le groupe de sécurité de votre compte privé : VPC

    Protocole Plage de ports Source

    UDP

    500

    Self Security Group ID

    ESP 50

    N/A

    Self Security Group ID

  2. Lorsque vous envoyez une demande au CreateTrainingJobou CreateHyperParameterTuningJobAPI, spécifiez True le EnableInterContainerTrafficEncryption paramètre.

Note

Pour le ESP 50 protocole, la console du groupe AWS de sécurité peut afficher la plage de ports sous la forme « Tous ». Amazon EC2 ignore toutefois la plage de ports spécifiée car elle n'est pas applicable au protocole ESP 50 IP.

Activer le chiffrement du trafic entre conteneurs (Console)

Activer le chiffrement du trafic entre conteneurs dans une tâche d'entraînement

Activer le chiffrement du trafic entre conteneurs dans une tâche d'entraînement
  1. Ouvrez la SageMaker console Amazon à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation, choisissez Training (Entraînement), puis Training jobs (Tâches d'entraînement).

  3. Choisissez Create training job (Créer une tâche d'entraînement).

  4. Sous Réseau, choisissez un VPC. Vous pouvez utiliser la valeur par défaut VPC ou celle que vous avez créée.

  5. Choisissez Enable inter-container traffic encryption (Activer le chiffrement du trafic entre conteneurs).

Une fois que vous avez activé le chiffrement du trafic entre conteneurs, achevez la création de la tâche d'entraînement. Pour de plus amples informations, veuillez consulter Formation d'un modèle.

Activez le chiffrement du trafic entre conteneurs dans une tâche de réglage d'hyper-paramètre

Pour activer le chiffrement du trafic entre conteneurs dans une tâche de réglage d'hyper-paramètre
  1. Ouvrez la SageMaker console Amazon à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation, choisissez Training (Entraînement), puis Hyperparameter tuning jobs (Tâches de réglage d'hyper-paramètre).

  3. Choisissez Create hyperparameter tuning job (Créer une tâche de réglage d'hyperparamètre).

  4. Sous Réseau, choisissez un VPC. Vous pouvez utiliser la valeur par défaut VPC ou celle que vous avez créée.

  5. Choisissez Enable inter-container traffic encryption (Activer le chiffrement du trafic entre conteneurs).

Une fois que vous avez activé le chiffrement du trafic entre conteneurs, achevez la création de la tâche de réglage d'hyper-paramètre. Pour de plus amples informations, veuillez consulter Configuration et lancement de la tâche de réglage des hyperparamètres.