Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Coûts d'utilisation d'Amazon Redshift ML
Avec Amazon Redshift, vous pouvez tirer parti des fonctionnalités d'apprentissage automatique pour obtenir des informations à partir de vos données sans avoir besoin d'une expertise approfondie en ingénierie des données ou en apprentissage automatique. Les sections suivantes décrivent les coûts associés à l'utilisation d'Amazon Redshift ML, afin de vous aider à planifier et à optimiser vos dépenses tout en tirant parti de cette puissante intégration du machine learning.
Coûts liés à l'utilisation d'Amazon Redshift ML avec SageMaker
Amazon Redshift ML for SageMaker utilise les ressources de votre cluster existantes à des fins de prévision afin que vous puissiez éviter des frais supplémentaires liés à Amazon Redshift. Il n'y a pas de frais supplémentaires Amazon Redshift pour la création ou l'utilisation d'un modèle. La prédiction se produit localement dans votre cluster Redshift. Vous n'avez donc pas à payer de frais supplémentaires à moins que vous n'ayez besoin de redimensionner votre cluster. Amazon Redshift ML utilise Amazon SageMaker pour entraîner votre modèle, ce qui entraîne un coût supplémentaire.
Il n'y a pas de frais supplémentaires pour les fonctions de prédiction qui s'exécutent au sein de votre cluster Amazon Redshift. La CREATE MODEL déclaration utilise Amazon SageMaker et entraîne un coût supplémentaire. Le coût augmente avec le nombre de cellules dans vos données d'entraînement. Le nombre de cellules est le produit du nombre d'enregistrements (dans la requête d'entraînement ou dans la table) multiplié par le nombre de colonnes. Par exemple, lorsqu'une SELECT requête de l'CREATEMODELinstruction crée 10 000 enregistrements et 5 colonnes, le nombre de cellules qu'elle crée est de 50 000.
Dans certains cas, les données d'entraînement produites par la SELECT requête de CREATE MODEL dépassent la CELLS limite MAX _ que vous avez fournie (ou la limite par défaut de 1 million si vous n'avez pas indiqué de limite). Dans ces cas, choisit CREATE MODEL au hasard environ MAX _ CELLS (c'est-à-dire le « nombre de colonnes » d'enregistrements de l'ensemble de données d'entraînement). CREATEMODELeffectue ensuite un entraînement à l'aide de ces tuples choisis au hasard. L'échantillonnage aléatoire garantit que le jeu de données d'entraînement réduit n'aura aucun biais. Ainsi, en définissant le MAX _CELLS, vous pouvez contrôler vos coûts de formation.
Lorsque vous utilisez l'CREATEMODELinstruction, vous pouvez utiliser les RUNTIME options MAX _ CELLS et MAX _ pour contrôler les coûts, le temps et la précision potentielle du modèle.
MAX_ RUNTIME indique la durée maximale que peut prendre l'entraînement SageMaker lorsque l'option AUTO ON ou l'OFFoption est utilisée. Les tâches de formation se terminent souvent avant le MAX _RUNTIME, selon la taille du jeu de données. Après l'entraînement d'un modèle, Amazon Redshift effectue une tâche supplémentaire en arrière-plan pour compiler et installer vos modèles dans votre cluster. Par conséquent, la réalisation CREATE MODEL peut prendre plus RUNTIME de MAX _. Cependant, MAX _ RUNTIME limite la quantité de calcul et le temps nécessaires SageMaker pour entraîner votre modèle. Vous pouvez vérifier l'état de votre modèle à tout moment à l'aide de SHOWMODEL.
Lorsque vous utilisez CREATE MODEL AUTO ON, Amazon Redshift ML utilise le SageMaker pilote automatique pour explorer automatiquement et intelligemment différents modèles (ou candidats) afin de trouver le meilleur. MAX_ RUNTIME limite le temps et les calculs consacrés. Si MAX _ RUNTIME est défini trop bas, il se peut que le temps ne soit pas suffisant pour explorer ne serait-ce qu'un seul candidat. Si le message d'erreur « Le candidat au pilote automatique n'a aucun modèle » s'affiche, réexécutez-le CREATE MODEL avec une valeur _ plus grandeMAX. RUNTIME Pour plus d'informations sur ce paramètre, consultez MaxAutoMLJobRuntimeInSecondsle Amazon SageMaker API Reference.
Lorsque vous courez CREATE MODEL avec AUTOOFF, MAX _ RUNTIME correspond à une limite de durée d'exécution de la tâche de formation SageMaker. Les tâches de formation se terminent souvent plus tôt, en fonction de la taille de l'ensemble de données et d'autres paramètres utilisés, tels que num_rounds dans MODEL _. TYPE XGBOOST
Vous pouvez également contrôler les coûts ou réduire le temps d'entraînement en spécifiant une CELLS valeur MAX _ inférieure lorsque vous courez CREATEMODEL. Une cellule est une entrée dans la base de données. Chaque ligne correspond à autant de cellules qu'il y a de colonnes, qui peuvent être de largeur fixe ou variable. MAX_ CELLS limite le nombre de cellules, et donc le nombre d'exemples d'entraînement utilisés pour entraîner votre modèle. Par défaut, MAX _ CELLS est défini sur 1 million de cellules. La réduction de MAX _ CELLS réduit le nombre de lignes issues du résultat de la SELECT requête CREATE MODEL qu'Amazon Redshift exporte et envoie pour SageMaker entraîner un modèle. La réduction de MAX _ réduit CELLS ainsi la taille du jeu de données utilisé pour entraîner les modèles à la fois avec AUTO ON et AUTOOFF. Cette approche permet de réduire les coûts et le temps d'entraînement des modèles. Pour consulter les informations relatives à la formation et aux délais de facturation d'un poste de formation spécifique, choisissez Training jobs in Amazon SageMaker.
L'augmentation de MAX _ RUNTIME et MAX _ améliore CELLS souvent la qualité du modèle en permettant d' SageMaker explorer un plus grand nombre de candidats. Cela SageMaker peut prendre plus de temps pour former chaque candidat et utiliser davantage de données pour former de meilleurs modèles. Si vous souhaitez accélérer l'itération ou l'exploration de votre jeu de données, utilisez des valeurs de MAX _ RUNTIME et MAX de _ plus faibles. CELLS Si vous souhaitez améliorer la précision des modèles, utilisez des valeurs de MAX _ RUNTIME et MAX de _ plus élevéesCELLS.
Pour plus d’informations sur les coûts associés aux différents nombres de cellules et sur les détails de l’essai gratuit, consultez Tarification Amazon Redshift
Coûts d'utilisation d'Amazon Redshift ML avec Amazon Bedrock
L'utilisation d'Amazon Redshift ML avec Amazon Bedrock entraîne des coûts supplémentaires. Pour plus d’informations, consultez Tarification d’Amazon Bedrock