Notes d’utilisation - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Notes d’utilisation

Tenez compte des éléments suivants lorsque vous utilisez CREATE MODEL :

  • L’instruction CREATE MODEL fonctionne en mode asynchrone et renvoie le résultat de l’exportation des données d’entraînement vers Amazon S3. Les étapes restantes de la formation dans Amazon SageMaker AI se déroulent en arrière-plan. Bien que l’entraînement soit en cours, la fonction d’inférence correspondante est visible mais ne peut pas être exécutée. Vous pouvez interroger STV_ML_ _ MODEL INFO pour voir l’état de l’entraînement.

  • L’entraînement peut s’exécuter jusqu’à 90 minutes en arrière-plan, par défaut dans le modèle Auto et peut être prolongée. Pour annuler l’entraînement, exécutez simplement la commande DROP MODEL.

  • Le cluster Amazon Redshift que vous utilisez pour créer le modèle et le compartiment Amazon S3 utilisé pour préparer les données d'entraînement et les artefacts du modèle doivent se trouver dans la même AWS région.

  • Pendant la formation du modèle, Amazon Redshift et SageMaker AI stockent les artefacts intermédiaires dans le compartiment Amazon S3 que vous fournissez. Par défaut, Amazon Redshift lance le récupérateur de mémoire à la fin de l’opération CREATE MODEL. Amazon Redshift supprime ces objets d’Amazon S3. Pour retenir ces artefacts sur Amazon S3, définissez l’option S3_GARBAGE COLLECT OFF.

  • Vous devez utiliser au moins 500 lignes dans les données d’entraînement fournies dans la clause FROM.

  • Vous pouvez spécifier jusqu’à 256 colonnes de fonctions (entrée) dans la clause FROM { table_name | ( select_query ) } lorsque vous utilisez l’instruction CREATE MODEL.

  • Pour AUTO ON, les types de colonnes que vous pouvez utiliser comme jeu d’entraînement sont SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE, BOOLEAN, CHAR, VARCHAR, DATE, TIME, TIMETZ, TIMESTAMP et TIMESTAMPTZ. Pour AUTO OFF, les types de colonnes que vous pouvez utiliser comme jeu d’entraînement sont SMALLINT, INTEGER, BIGINT, DECIMAL, REAL, DOUBLE et BOOLEAN.

  • Vous ne pouvez pas utiliser DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ, GEOMETRY, GEOGRAPHY, HLLSKETCH, SUPER ou VARBYTE comme type de colonne cible.

  • Pour améliorer la précision du modèle, optez pour l’une des solutions suivantes :

    • Ajoutez autant de colonnes pertinentes que possible dans la commande CREATE MODEL lorsque vous spécifiez les données d’entraînement dans la clause FROM.

    • Utilisez une valeur plus grande pour MAX_RUNTIME et MAX_CELLS. Des valeurs plus élevées pour ce paramètre augmentent le coût de l’entraînement d’un modèle.

  • L’exécution de l’instruction CREATE MODEL renvoie dès que les données d’entraînement sont calculées et exportées vers le compartiment Amazon S3. Ensuite, vous pouvez vérifier l’état de l’entraînement à l’aide de la commande SHOW MODEL. Lorsqu’un modèle entraîné en arrière-plan échoue, vous pouvez vérifier l’erreur à l’aide de la commande SHOW MODEL. Vous ne pouvez pas effectuer de nouvelle tentative pou un modèle ayant échoué. Utilisez la commande DROP MODEL pour supprimer un modèle ayant échoué et créer un nouveau modèle. Pour plus d’informations sur les modèles SHOW MODEL, consultez SHOW MODEL.

  • Le modèle BYOM local prend en charge le même type de modèles que ceux pris en charge par le ML d’Amazon Redshift pour les cas non-BYOM. Amazon Redshift prend en charge les modèles simples XGBoost ( XGBoost version 1.0 ou ultérieure), les modèles KMEANS sans préprocesseurs et les modèles XGBOOST/MLP/Linear Learner entraînés par Trained by Amazon AI Autopilot. SageMaker Il prend en charge ce dernier avec des préprocesseurs spécifiés par Autopilot et également pris en charge par Amazon SageMaker AI Neo.

  • Si le routage amélioré de votre cluster Amazon Redshift est activé pour votre cloud privé virtuel (VPC), assurez-vous de créer un point de terminaison Amazon S3 VPC et un point de terminaison VPC AI pour le SageMaker VPC dans lequel se trouve votre cluster. Cela permet au trafic de s’exécuter via votre VPC entre ces services pendant l’exécution de la commande CREATE MODEL. Pour plus d'informations, consultez SageMaker AI Clarify Job Amazon VPC Subnets and Security Groups.