Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Rapports générés par Amazon SageMaker Autopilot
Outre le bloc-notes d'exploration des données, Autopilot génère divers rapports pour le meilleur modèle candidat de chaque expérience.
-
Un rapport d'explicabilité fournit des informations sur la manière dont le modèle établit des prévisions.
-
Un rapport de performances fournit une évaluation quantitative des capacités de prévision du modèle.
-
Un rapport sur les résultats du rétro-test est généré après le test des performances du modèle sur des données historiques.
Rapport d'explicabilité
Le rapport d'explicabilité d'Autopilot vous aide à mieux comprendre l'impact des attributs de vos jeux de données sur les prévisions pour des séries temporelles (combinaisons d'éléments et de dimensions) et des points temporels spécifiques. Autopilot utilise une métrique appelée scores d'impact pour quantifier l'impact relatif de chaque attribut et déterminer s'ils augmentent ou diminuent les valeurs de prévision.
Imaginons, par exemple, un scénario de prévisions dans lequel la cible est sales
(ventes), associée à deux attributs : price
(prix) et color
(couleur). Autopilot peut constater que la couleur de l'élément a un impact important sur les ventes de certains articles, mais un effet négligeable pour d'autres articles. Il peut également constater qu'une promotion en été a un impact important sur les ventes, mais qu'une promotion en hiver a peu d'effet.
Le rapport d'explicabilité est généré uniquement lorsque :
-
Le jeu de données de séries temporelles inclut des colonnes de fonctionnalités supplémentaires ou est associé à un calendrier des jours fériés.
-
Les modèles de base CNN-QR et DeepAR+ sont inclus dans l'ensemble final.
Interprétation des scores d'impact
Les scores d'impact mesurent l'impact relatif des attributs sur les valeurs des prévisions. Par exemple, si le score d'impact de l'attribut price
est deux fois supérieur à celui de l'attribut store location
, vous pouvez en conclure que le prix d'un article a un impact deux fois plus important sur les valeurs des prévisions que l'emplacement du magasin.
Les scores d'impact fournissent également des informations indiquant si les attributs augmentent ou diminuent les valeurs des prévisions.
Les scores d'impact vont de -1 à 1, le signe indiquant la direction de l'impact. Un score de 0 indique une absence d'impact, tandis que des scores proches de 1 ou de -1 indiquent un impact significatif.
Il est important de noter que les scores d'impact mesurent l'impact relatif des attributs, et non l'impact absolu. Par conséquent, les scores d'impact ne peuvent pas être utilisés pour déterminer si des attributs particuliers améliorent la précision du modèle. Si un attribut a un faible score d'impact, cela ne signifie pas nécessairement qu'il a un faible impact sur les valeurs des prévisions ; cela signifie qu'il a un impact plus faible sur les valeurs des prévisions que les autres attributs utilisés par le prédicteur.
Recherche du rapport d'explicabilité
Vous trouverez le préfixe Amazon S3 des artefacts d'explicabilité générés pour le meilleur candidat dans la réponse à DescribeAutoMLJobV2
, dans BestCandidate.CandidateProperties.CandidateArtifactLocations.Explainability
.
Rapport de performances d'un modèle
Le rapport de qualité du modèle Autopilot (également appelé rapport de performances) fournit des renseignements et des informations de qualité pour le meilleur modèle candidat (meilleur prédicteur) généré par une tâche AutoML. Cela inclut des informations sur les détails de la tâche, la fonction objectif et les métriques de précision (wQL
, MAPE
, WAPE
, RMSE
, MASE
).
Vous trouverez le préfixe Amazon S3 des artefacts du rapport de qualité du modèle générés pour le meilleur candidat dans la réponse à DescribeAutoMLJobV2
, dans BestCandidate.CandidateProperties.CandidateArtifactLocations.ModelInsights
.
Rapport sur les résultats des rétro-tests
Les résultats des rétro-tests fournissent des renseignements sur les performances d'un modèle de prévision de séries temporelles en évaluant sa précision et sa fiabilité prédictives. Ils aident les analystes et les scientifiques des données à évaluer les performances du modèle sur les données historiques et à comprendre ses performances potentielles sur de futures données inédites.
Autopilot utilise les rétro-tests pour ajuster les paramètres et générer des métriques de précision. Lors de rétro-tests, Autopilot divise automatiquement vos données de séries temporelles en deux ensembles, un ensemble d'entraînement et un ensemble de test. L'ensemble d'entraînement est utilisé pour entraîner un modèle qui est ensuite utilisé pour générer des prévisions pour les points de données dans l'ensemble de test. Autopilot utilise ce jeu de données de test pour évaluer la précision du modèle en comparant les valeurs prévues aux valeurs observées dans l'ensemble de test.
Vous trouverez le préfixe Amazon S3 des artefacts du rapport de qualité du modèle générés pour le meilleur candidat dans la réponse à DescribeAutoMLJobV2
, dans BestCandidate.CandidateProperties.CandidateArtifactLocations.BacktestResults
.