Affiner un modèle dans Studio - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Affiner un modèle dans Studio

Le réglage fin entraîne un modèle préentraîné sur un nouveau jeu de données sans avoir à effectuer un entraînement à partir de zéro. Ce processus, également connu sous le nom d'apprentissage par transfert, peut produire des modèles précis avec des jeux de données plus petits et moins de temps d'entraînement. Pour affiner les modèles de JumpStart base, accédez à une fiche détaillée du modèle dans l'interface utilisateur de Studio. Pour plus d'informations sur la procédure d'ouverture JumpStart dans Studio, consultezOuvrir et utiliser JumpStart dans Studio. Après avoir accédé à la fiche détaillée du modèle de votre choix, choisissez Train dans le coin supérieur droit. Notez que le réglage fin n'est pas disponible sur tous les modèles.

Important

Certains modèles de base nécessitent l'acceptation explicite d'un contrat de licence utilisateur final (EULA) avant d'être peaufinés. Pour de plus amples informations, veuillez consulter EULAacceptation dans Amazon SageMaker Studio.

Réglages du modèle

Lorsque vous utilisez un modèle de JumpStart base préformé dans Amazon SageMaker Studio, l'emplacement de l'artefact du modèle (Amazon S3URI) est renseigné par défaut. Pour modifier l'Amazon S3 par défautURI, choisissez Enter model artefact location. Tous les modèles ne prennent pas en charge la modification de l'emplacement de l'artefact du modèle.

Réglages des données

Dans le champ Données, indiquez un URI point Amazon S3 vers l'emplacement de votre ensemble de données d'entraînement. L'Amazon S3 par défaut URI pointe vers un exemple de jeu de données d'entraînement. Pour modifier l'Amazon S3 par défautURI, choisissez Enter training dataset et modifiez leURI. N'oubliez pas de consulter la fiche détaillée du modèle dans Amazon SageMaker Studio pour obtenir des informations sur le formatage des données d'entraînement.

Hyperparamètres

Vous pouvez personnaliser les hyperparamètres de la tâche d'entraînement utilisés pour affiner le modèle. Les hyperparamètres disponibles pour chaque modèle réglable varient en fonction du modèle.

Les hyperparamètres suivants sont courants parmi les modèles :

  • Epochs (Époques) – Une époque est un cycle dans l'ensemble du jeu de données. Plusieurs intervalles complètent un lot, et plusieurs lots finissent par compléter une époque. Plusieurs époques sont exécutées jusqu'à ce que la précision du modèle atteigne un niveau acceptable ou lorsque le taux d'erreur descend en dessous d'un niveau acceptable.

  • Learning rate (Taux d'apprentissage) – Quantité de modifications que doivent subir les valeurs d'une époque à l'autre. Au fur et à mesure que le modèle est affiné, ses pondérations internes sont modifiées et les taux d'erreur sont vérifiés pour voir si le modèle s'améliore. Un taux d'apprentissage typique est de 0,1 ou 0,01, où 0,01 est un ajustement beaucoup plus petit et peut faire en sorte que l'entraînement prenne beaucoup de temps pour converger, alors que 0,1 est beaucoup plus grand et peut faire en sorte que l'entraînement dépasse les limites. Il s'agit de l'un des principaux hyperparamètres que vous pouvez ajuster pour l'entraînement de votre modèle. Notez que pour les modèles de texte, un taux d'apprentissage beaucoup plus faible (5e-5 pourBERT) peut se traduire par un modèle plus précis.

  • Taille du lot : nombre d'enregistrements de l'ensemble de données à sélectionner pour chaque intervalle à envoyer à des GPUs fins d'entraînement.

Consultez les info-bulles et les informations supplémentaires figurant sur la fiche détaillée du modèle dans l'interface utilisateur de Studio pour en savoir plus sur les hyperparamètres spécifiques au modèle de votre choix.

Pour plus d'informations sur les hyperparamètres disponibles, consultezHyperparamètres de réglage précis couramment pris en charge.

Déploiement

Spécifiez le type d'instance de formation et l'emplacement de l'artefact de sortie pour votre tâche de formation. Vous ne pouvez choisir que des instances compatibles avec le modèle de votre choix dans le cadre du réglage précis de l'interface utilisateur de Studio. L'emplacement de l'artefact de sortie par défaut est le bucket SageMaker par défaut. Pour modifier l'emplacement de l'artefact en sortie, choisissez Enter output artefact location et modifiez l'Amazon S3. URI

Sécurité

Spécifiez les paramètres de sécurité à utiliser pour votre tâche de formation, notamment le IAM rôle SageMaker utilisé pour former votre modèle, si votre formation doit se connecter à un cloud privé virtuel (VPC) et les clés de chiffrement permettant de sécuriser vos données.

Informations supplémentaires

Dans le champ Informations supplémentaires, vous pouvez modifier le nom du poste de formation. Vous pouvez également ajouter et supprimer des balises sous forme de paires clé-valeur pour vous aider à organiser et à classer vos tâches de formation pour peaufiner.

Après avoir fourni des informations pour affiner votre configuration, choisissez Soumettre. Si le modèle de base préformé que vous avez choisi de peaufiner nécessite l'accord explicite d'un contrat de licence utilisateur final (EULA) avant la formation, celui-ci EULA est fourni dans une fenêtre contextuelle. Pour accepter les termes duEULA, choisissez Accepter. Il vous incombe de vérifier et de respecter les contrats de licence applicables et de vous assurer qu'ils sont acceptables pour votre cas d'utilisation avant de télécharger ou d'utiliser un modèle.