Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Parameter für integrierte Algorithmen
In der folgenden Tabelle sind die Parameter für jeden der von Amazon SageMaker AI bereitgestellten Algorithmen aufgeführt.
Name des Algorithmus | Kanalname | Trainingseingabemodus | Dateityp | Instance-Klasse | Parallelisierbar |
---|---|---|---|---|---|
AutoGluon-Tabellarisch | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU (nur einzelne Instance) | Nein |
BlazingText | "train" | Datei oder Pipe | Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) | CPU oder GPU (nur einzelne Instance) | Nein |
CatBoost | "train" und (optional) "validation" | Datei | CSV | CPU (nur einzelne Instance) | Nein |
DeepAR-Prognosen | "train" und (optional) "test" | Datei | JSON-Lines oder Parquet | CPU oder GPU | Ja |
Factorization Machines | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf | CPU (GPU für Daten mit hoher Dichte) | Ja |
Bildklassifizierung - MXNet | "train" und "validation", (optional) "train_lst", "validation_lst" und "model" | Datei oder Pipe | recordIO oder Bilddateien (JPEG oder PNG) | GPU | Ja |
Bildklassifizierung - TensorFlow | Training und Validierung | Datei | Bilddateien (.jpg, .jpeg oder .png) | CPU oder GPU | Ja (nur für mehrere GPUs auf einer einzigen Instanz) |
IP Insights | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU | Ja |
K-Means | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instanzen) | Nein |
K-Nearest-Neighbors (k-NN) | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances) | Ja |
LDA | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU (nur einzelne Instance) | Nein |
LightGBM | "train/training" und (optional) "validation" | Datei | CSV | CPU | Ja |
Lineares Lernen | "train" und (optional) "validation", "test" oder beides | Datei oder Pipe | recordIO-protobuf oder CSV | CPU oder GPU | Ja |
Neural Topic Modeling | "train" und (optional) "validation", "test" oder beides | Datei oder Pipe | recordIO-protobuf oder CSV | CPU oder GPU | Ja |
Object2Vec | "train" und (optional) "validation", "test" oder beides | Datei | JSON-Lines | CPU oder GPU (nur einzelne Instance) | Nein |
Objekterkennung - MXNet | "train" und "validation", (optional) "train_annotation", "validation_annotation" und "model" | Datei oder Pipe | recordIO oder Bilddateien (JPEG oder PNG) | GPU | Ja |
Objekterkennung - TensorFlow | Training und Validierung | Datei | Bilddateien (.jpg, .jpeg oder .png) | GPU | Ja (nur für mehrere GPUs auf einer einzigen Instanz) |
PCA | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU oder GPU | Ja |
Random Cut Forest | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU | Ja |
Semantische Segmentierung | "train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model" | Datei oder Pipe | Abbildungsdateien | GPU (nur einzelne Instance) | Nein |
Seq2Seq Modeling | "train", "validation" und "vocab" | Datei | recordIO-protobuf | GPU (nur einzelne Instance) | Nein |
TabTransformer | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU (nur einzelne Instance) | Nein |
Textklassifizierung - TensorFlow | Training und Validierung | Datei | CSV | CPU oder GPU | Ja (nur für mehrere GPUs auf einer einzigen Instanz) |
XGBoost (0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) | "train" und (optional) "validation" | Datei oder Pipe | CSV, LibSVM oder Parquet | CPU (oder GPU für 1.2-1) | Ja |
Algorithmen, die parallelisierbar sind, lassen sich für verteilte Trainings auf mehreren Datenverarbeitungs-Instances bereitstellen.
Die folgenden Themen enthalten Informationen zu Datenformaten, empfohlenen EC2 Amazon-Instance-Typen und CloudWatch Protokollen, die allen von Amazon SageMaker AI bereitgestellten integrierten Algorithmen gemeinsam sind.
Anmerkung
Informationen zum Docker-Image der integrierten Algorithmen, die URIs von SageMaker KI verwaltet werden, finden Sie unter Docker-Registrierungspfade und Beispielcode.