Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Coûts d'utilisation d'Amazon Redshift ML
Avec Amazon Redshift, vous pouvez tirer parti des fonctionnalités d'apprentissage automatique pour obtenir des informations à partir de vos données sans avoir besoin d'une expertise approfondie en ingénierie des données ou en apprentissage automatique. Les sections suivantes décrivent les coûts associés à l'utilisation d'Amazon Redshift ML, afin de vous aider à planifier et à optimiser vos dépenses tout en tirant parti de cette puissante intégration du machine learning.
Coûts liés à l'utilisation d'Amazon Redshift ML avec l'IA SageMaker
Amazon Redshift ML for SageMaker AI utilise les ressources de votre cluster existantes à des fins de prévision afin que vous puissiez éviter des frais supplémentaires liés à Amazon Redshift. Il n'y a pas de frais supplémentaires Amazon Redshift pour la création ou l'utilisation d'un modèle. La prédiction se produit localement dans votre cluster Redshift. Vous n'avez donc pas à payer de frais supplémentaires à moins que vous n'ayez besoin de redimensionner votre cluster. Amazon Redshift ML utilise Amazon SageMaker AI pour entraîner votre modèle, ce qui entraîne un coût supplémentaire.
Il n'y a pas de frais supplémentaires pour les fonctions de prédiction qui s'exécutent au sein de votre cluster Amazon Redshift. L'instruction CREATE MODEL utilise Amazon SageMaker AI et entraîne un coût supplémentaire. Le coût augmente avec le nombre de cellules dans vos données d'entraînement. Le nombre de cellules est le produit du nombre d'enregistrements (dans la requête d'entraînement ou dans la table) multiplié par le nombre de colonnes. Par exemple, lorsqu'une requête SELECT de l'instruction CREATE MODEL crée 10 000 enregistrements et 5 colonnes, le nombre de cellules qu'elle crée est de 50 000.
Dans certains cas, les données d'entraînement produites par la requête SELECT de CREATE MODEL dépassent la limite MAX_CELLS que vous avez indiquée (ou la limite par défaut de 1 million si vous n'en avez pas spécifiée). Dans ces cas, CREATE MODEL choisit au hasard la limite MAX_CELLS (c'est-à-dire le nombre d'enregistrements « colonnes » du jeu de données d'entraînement). CREATE MODEL effectue ensuite un entraînement à l'aide de ces tuples choisis au hasard. L'échantillonnage aléatoire garantit que le jeu de données d'entraînement réduit n'aura aucun biais. Ainsi, en définissant la limite MAX_CELLS, vous pouvez contrôler vos coûts d'entraînement.
Lorsque vous utilisez l'instruction de commande CREATE MODEL, vous pouvez utiliser les options MAX_CELLS et MAX_RUNTIME pour contrôler les coûts, le temps et la précision potentielle du modèle.
MAX_RUNTIME indique la durée maximale que l'entraînement peut prendre dans l' SageMaker IA lorsque l'option AUTO ON ou OFF est utilisée. Les tâches d'entraînement se terminent souvent plus tôt que MAX_RUNTIME, en fonction de la taille du jeu de données. Après l'entraînement d'un modèle, Amazon Redshift effectue une tâche supplémentaire en arrière-plan pour compiler et installer vos modèles dans votre cluster. Ainsi, l'exécution de CREATE MODEL peut prendre plus de temps que MAX_RUNTIME. Cependant, MAX_RUNTIME limite la quantité de calcul et le temps utilisés par l' SageMaker IA pour entraîner votre modèle. Vous pouvez vérifier l'état de votre modèle à tout moment en utilisant la commande SHOW MODEL.
Lorsque vous exécutez CREATE MODEL avec AUTO ON, Amazon Redshift ML utilise le pilote automatique SageMaker AI pour explorer automatiquement et intelligemment différents modèles (ou candidats) afin de trouver le meilleur. MAX_RUNTIME limite la durée et le nombre de calculs effectués. Si la valeur MAX_RUNTIME est trop basse, il se peut qu'il n'y ait pas assez de temps pour explorer ne serait-ce qu'un seul candidat. Si l'erreur « Autopilot candidate has no models (Le candidat Autopilot n'a pas de modèles) » s'affiche, réexécutez l'instruction CREATE MODEL avec une valeur MAX_RUNTIME plus élevée. Pour plus d'informations sur ce paramètre, consultez MaxAutoMLJobRuntimeInSecondsle manuel Amazon SageMaker AI API Reference.
Lorsque vous exécutez CREATE MODEL avec AUTO OFF, MAX_RUNTIME correspond à une limite de durée d'exécution de la tâche d'entraînement dans SageMaker l'IA. Les tâches d'entraînement se terminent souvent plus tôt, en fonction de la taille du jeu de données et des autres paramètres utilisés, tels que num_rounds dans MODEL_TYPE XGBOOST.
Vous pouvez également contrôler les coûts ou réduire le temps d'entraînement en spécifiant une valeur MAX_CELLS plus petite lorsque vous exécutez CREATE MODEL. Une cellule est une entrée dans la base de données. Chaque ligne correspond à autant de cellules qu'il y a de colonnes, qui peuvent être de largeur fixe ou variable. MAX_CELLS limite le nombre de cellules, et donc le nombre d'exemples d'entraînement utilisés pour entraîner votre modèle. Par défaut, MAX_CELLS est défini à 1 million de cellules. La réduction de MAX_CELLS réduit le nombre de lignes issues du résultat de la requête SELECT dans CREATE MODEL qu'Amazon Redshift exporte et envoie SageMaker à AI pour entraîner un modèle. La réduction de MAX_CELLS permet donc de réduire la taille du jeu de données utilisé pour entraîner les modèles, que ce soit avec AUTO ON ou AUTO OFF. Cette approche permet de réduire les coûts et le temps d'entraînement des modèles. Pour consulter les informations relatives à la formation et aux délais de facturation d'une tâche de formation spécifique, choisissez Training jobs in Amazon SageMaker AI.
L'augmentation de MAX_RUNTIME et de MAX_CELLS améliore souvent la qualité des modèles en permettant à l' SageMaker IA d'explorer davantage de candidats. Ainsi, l' SageMaker IA peut prendre plus de temps pour former chaque candidat et utiliser davantage de données pour former de meilleurs modèles. Si vous souhaitez une itération ou une exploration plus rapide de votre jeu de données, utilisez des valeurs MAX_RUNTIME et MAX_CELLS plus basses. Si vous souhaitez améliorer la précision des modèles, utilisez des valeurs MAX_RUNTIME et MAX_CELLS plus élevées.
Pour plus d'informations sur les coûts associés aux différents nombres de cellules et sur les détails de l'offre gratuite, consultez la tarification Amazon Redshift
Coûts d'utilisation d'Amazon Redshift ML avec Amazon Bedrock
L'utilisation d'Amazon Redshift ML avec Amazon Bedrock entraîne des coûts supplémentaires. Pour plus d’informations, consultez Tarification d’Amazon Bedrock