Migrez les charges de travail de création, de formation et de déploiement de ML vers Amazon à SageMaker l'aide des outils de AWS développement - Recommandations AWS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Migrez les charges de travail de création, de formation et de déploiement de ML vers Amazon à SageMaker l'aide des outils de AWS développement

Créée par Scot Marvin () AWS

Type R : Replateforme

Source : Machine Learning

Cible : Amazon SageMaker

Créé par : AWS

Environnement : PoC ou pilote

Technologies : apprentissage automatique et intelligence artificielle DevOps ; migration

AWSservices : Amazon SageMaker

Récapitulatif

Ce modèle fournit des conseils pour la migration d'une application d'apprentissage automatique (ML) sur site exécutée sur des serveurs Unix ou Linux à former et à déployer sur Amazon. AWS SageMaker Ce déploiement utilise un pipeline d'intégration continue et de déploiement continu (CI/CD). Le modèle de migration est déployé à l'aide d'une AWS CloudFormation pile.

Conditions préalables et limitations

Prérequis

  • Un AWS compte actif utilisant AWSLanding Zone

  • AWSInterface de ligne de commande (AWSCLI) installée et configurée sur votre serveur Unix ou Linux

  • Un référentiel de code source ML soit dans Amazon Simple Storage Service (Amazon S3) GitHub AWS CodeCommit, soit dans Amazon Simple Storage Service (Amazon S3)

Limites

  • Seuls 300 pipelines individuels peuvent être déployés dans une AWS région.

  • Ce modèle est destiné aux charges de travail ML supervisées avec train-and-deploy du code en Python.

Versions du produit

  • Docker version 19.03.5, build 633a0ea, avec Python 3.6x

Architecture

Pile technologique source

  • Instance de calcul Linux sur site avec des données sur le système de fichiers local ou dans une base de données relationnelle

Architecture de la source

Diagram showing on-premises setup with Python, Jupyter, and database components interconnected.

Pile technologique cible

  • AWS CodePipeline déployé avec Amazon S3 pour le stockage des données et Amazon DynamoDB comme magasin de métadonnées pour le suivi ou la journalisation des cycles de pipeline

Architecture cible

AWS machine learning workflow diagram showing integration of various services for model development and deployment.

Architecture de migration des applications

  • Package et AWS CodeCommit référentiel Python natifs (et un SQL client, pour les ensembles de données locaux sur une instance de base de données)

AWS Cloud architecture diagram showing ML pipeline orchestration and data flow from on-premises to cloud services.

Outils

  • Python

  • Git 

  • AWSCLI— AWSCLIDéploie la AWS CloudFormation pile et déplace les données vers le compartiment S3. Le compartiment S3 mène à son tour à la cible.

Épopées

TâcheDescriptionCompétences requises
Validez le code source et les ensembles de données.Spécialiste des données
Identifiez les types et tailles d'instances cibles de création, de formation et de déploiement.Ingénieur de données, scientifique des données
Créez une liste de capacités et des exigences de capacité.
Identifiez les exigences du réseau.DBA, Administrateur de systèmes
Identifiez les exigences de sécurité d'accès au réseau ou à l'hôte pour les applications source et cible.Ingénieur de données, ingénieur ML, administrateur système
Déterminez la stratégie de sauvegarde.Ingénieur ML, administrateur système
Déterminez les exigences de disponibilité.Ingénieur ML, administrateur système
Identifiez la stratégie de migration ou de transition des applications.Scientifique des données, ingénieur ML
TâcheDescriptionCompétences requises
Créez un cloud privé virtuel (VPC).Ingénieur ML, administrateur système
Créez des groupes de sécurité.Ingénieur ML, administrateur système
Configurez un compartiment Amazon S3 et des branches de AWS CodeCommit référentiel pour le code ML.Ingénieur ML
TâcheDescriptionCompétences requises
Utilisez des SQL outils My Tools natifs ou des outils tiers pour migrer, former, valider et tester des ensembles de données vers un compartiment S3 provisionné.

Cela est nécessaire pour le déploiement de la AWS CloudFormation pile.

Ingénieur de données, ingénieur ML
Package du train ML et du code d'hébergement sous forme de packages Python et transfert vers le référentiel provisionné dans AWS CodeCommit ou GitHub.

Vous avez besoin du nom de branche du référentiel pour déployer le AWS CloudFormation modèle à des fins de migration.

Scientifique des données, ingénieur ML
TâcheDescriptionCompétences requises
Suivez la stratégie de migration de la charge de travail ML.Propriétaire de l'application, ingénieur ML
Déployez la AWS CloudFormation pile.

Utilisez le AWS CLI pour créer la pile déclarée dans le YAML modèle fourni avec cette solution.

Scientifique des données, ingénieur ML
TâcheDescriptionCompétences requises
Basculez les clients de l'application vers la nouvelle infrastructure.Propriétaire de l'application, data scientist, ingénieur ML
TâcheDescriptionCompétences requises
Arrêtez les AWS ressources temporaires.

Arrêtez toutes les ressources personnalisées du AWS CloudFormation modèle (par exemple, les fonctions AWS Lambda qui ne sont pas utilisées).

Scientifique des données, ingénieur ML
Passez en revue et validez les documents du projet.Propriétaire de l'application, data scientist
Validez les résultats et les métriques d'évaluation du modèle ML avec les opérateurs.

Assurez-vous que les performances du modèle correspondent aux attentes des utilisateurs de l'application et sont comparables à celles de l'état sur site.

Propriétaire de l'application, data scientist
Clôturez le projet et faites part de vos commentaires.Propriétaire de l'application, ingénieur ML

Ressources connexes

Pièces jointes

Pour accéder au contenu supplémentaire associé à ce document, décompressez le fichier suivant : attachment.zip