Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Algorithme PCA (Principal Component Analysis, analyse en composantes principales)

Mode de mise au point
Algorithme PCA (Principal Component Analysis, analyse en composantes principales) - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

PCA est un algorithme de machine learning sans supervision qui tente de réduire la dimensionnalité (nombre de fonctions) au sein d'un jeu de données tout en conservant autant d'informations que possible. Cette action s'effectue en recherchant un nouvel ensemble de variables appelées composantes, qui constituent les composés des caractéristiques originales décorrélées les unes les autres. Les composants sont également contraints de telle sorte que le premier composant représente la plus grande variabilité possible dans les données, le deuxième composant la deuxième variabilité la plus importante, et ainsi de suite.

Dans Amazon SageMaker AI, le PCA fonctionne selon deux modes, selon le scénario :

  • regular : pour les ensembles de données avec données fragmentées et un nombre modéré d'observations et de caractéristiques.

  • randomized : pour les ensembles de données avec un grand nombre d'observations et de caractéristiques. Ce mode utilise un algorithme d'approximation.

L'algorithme PCA utilise des données tabulaires.

Les lignes correspondent aux observations que vous voulez intégrer dans un espace dimensionnel inférieur. Les colonnes correspondent aux fonctions pour lesquelles vous souhaitez rechercher une approximation réduite. L'algorithme calcule la matrice de covariance (ou une approximation correspondante de façon distribuée), puis effectue la décomposition des valeurs singulières sur ce résumé pour générer les principaux composants.

Interface d'entrée/sortie pour l'algorithme PCA

Pour l'apprentissage, l'algorithme PCA attend les données fournies dans le canal de formation et, le cas échéant, prend en charge un ensemble de données transmis à l'ensemble de données test, qui est noté par l'algorithme final. Les deux formats de fichier recordIO-wrapped-protobuf et CSV sont pris en charge pour l'entraînement. Vous pouvez utiliser le mode File (Fichier) ou le mode Pipe (Tube) pour entraîner les modèles sur les données obéissant au format recordIO-wrapped-protobuf ou au format CSV.

Pour l'inférence, PCA prend en charge text/csvapplication/json et application/x-recordio-protobuf. Les résultats sont retournés dans le format application/json ou application/x-recordio-protobuf avec un vecteur de « projections ».

Pour plus d'informations sur les formats de fichier en entrée et en sortie, consultez Formats de la réponse PCA pour l'inférence, ainsi que la rubrique Exemples de blocs-notes PCA.

EC2 Recommandation d'instance pour l'algorithme PCA

PCA prend en charge les instances de CPU et de GPU pour l'entraînement et l'inférence. Le type d'instance le plus important dépend fortement des spécificités des données d'entrée. Pour les instances de GPU, PCA prend en charge P2, P3, G4dn et G5.

Exemples de blocs-notes PCA

Pour un exemple de bloc-notes expliquant comment utiliser l'algorithme d'analyse des composants principaux de l' SageMaker IA pour analyser les images de chiffres manuscrits compris entre zéro et neuf dans le jeu de données MNIST, voir An Introduction to PCA with MNIST. Pour savoir comment créer et accéder à des instances de bloc-notes Jupyter que vous pouvez utiliser pour exécuter l'exemple dans SageMaker AI, consultez. Instances Amazon SageMaker Notebook Une fois que vous avez créé une instance de bloc-notes et que vous l'avez ouverte, sélectionnez l'onglet Exemples d'SageMaker IA pour voir la liste de tous les exemples d' SageMaker IA. Les exemples de blocs-notes de modélisation de rubrique utilisant les algorithmes NTM se trouvent dans la section Introduction to Amazon algorithms (Présentation des algorithmes Amazon). Pour ouvrir un bloc-notes, cliquez sur son onglet Use (Utiliser) et sélectionnez Create copy (Créer une copie).

Rubrique suivante :

Comment ça marche

Rubrique précédente :

Formats d'inférence
ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.