Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Paramètres pour les algorithmes intégrés
Le tableau suivant répertorie les paramètres de chacun des algorithmes fournis par Amazon SageMaker.
Nom de l'algorithme | Nom du canal | Mode d'entrée de l'entraînement | Type de fichier | Classe d'instance | Parallélisable |
---|---|---|---|---|---|
AutoGluon-Tabulaire | entraînement et (éventuellement) validation | Fichier | CSV | CPUou GPU (instance unique uniquement) | Non |
BlazingText | train | Fichier ou Tube | Fichier texte (une phrase par ligne avec des jetons séparés par des espaces) | CPUou GPU (instance unique uniquement) | Non |
CatBoost | entraînement et (éventuellement) validation | Fichier | CSV | CPU(instance unique uniquement) | Non |
DeepAR Forecasting | train et (facultativement) test | Fichier | JSONLignes ou parquet | CPUou GPU | Oui |
Machines de factorisation | train et (facultativement) test | Fichier ou Tube | recordIO-protobuf | CPU(GPUpour les données denses) | Oui |
Classification des images - MXNet | train et validation, (facultativement) train_lst, validation_lst et model | Fichier ou Tube | recordIO ou fichiers d'image (.jpg ou .png) | GPU | Oui |
Classification des images - TensorFlow | entraînement et validation | Fichier | fichiers image (.jpg, .jpeg ou .png) | CPUou GPU | Oui (uniquement sur plusieurs instances GPUs sur une seule instance) |
IP Insights | train et (facultativement) validation | Fichier | CSV | CPUou GPU | Oui |
K-Means | train et (facultativement) test | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPUou GPUCommon (GPUappareil unique sur une ou plusieurs instances) | Non |
K-Nearest-Neighbors (K-NN) | train et (facultativement) test | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPUou GPU (GPUappareil unique sur une ou plusieurs instances) | Oui |
LDA | train et (facultativement) test | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPU(instance unique uniquement) | Non |
Lumière GBM | train et (éventuellement) validation | Fichier | CSV | CPU | Oui |
Linear Learner | train et (facultativement) validation, test, ou les deux | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPUou GPU | Oui |
Neural Topic Model (NTM) | train et (facultativement) validation, test, ou les deux | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPUou GPU | Oui |
Object2Vec | train et (facultativement) validation, test, ou les deux | Fichier | JSONLignes | CPUou GPU (instance unique uniquement) | Non |
Détection d'objets - MXNet | train et validation, (facultativement) train_annotation, validation_annotation et model | Fichier ou Tube | recordIO ou fichiers d'image (.jpg ou .png) | GPU | Oui |
Détection d'objets - TensorFlow | entraînement et validation | Fichier | fichiers image (.jpg, .jpeg ou .png) | GPU | Oui (uniquement sur plusieurs instances GPUs sur une seule instance) |
PCA | train et (facultativement) test | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPUou GPU | Oui |
Random Cut Forest | train et (facultativement) test | Fichier ou Tube | Recordio-ProtoBuf ou CSV | CPU | Oui |
Semantic Segmentation | train et validation, train_annotation, validation_annotation et (facultativement) label_map et model | Fichier ou Tube | Fichiers image | GPU(instance unique uniquement) | Non |
Modélisation Seq2Seq | train, validation et vocab | Fichier | recordIO-protobuf | GPU(instance unique uniquement) | Non |
TabTransformer | entraînement et (éventuellement) validation | Fichier | CSV | CPUou GPU (instance unique uniquement) | Non |
Classification du texte - TensorFlow | entraînement et validation | Fichier | CSV | CPUou GPU | Oui (uniquement sur plusieurs instances GPUs sur une seule instance) |
XGBoost(0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) | train et (facultativement) validation | Fichier ou Tube | CSV, Lib SVM ou Parquet | CPU(ou GPU pour 1.2-1) | Oui |
Les algorithmes qui sont parallélisables peuvent être déployés sur plusieurs instances de calcul pour l'entraînement distribué.
Les rubriques suivantes fournissent des informations sur les formats de données, les types d'EC2instances Amazon recommandés et les CloudWatch journaux communs à tous les algorithmes intégrés fournis par Amazon SageMaker.
Note
Pour consulter l'image Docker URIs des algorithmes intégrés gérés par SageMaker, voir Chemins de registre Docker et exemple de code.