本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
下表列出了 Amazon A SageMaker I 提供的每种算法的参数。
算法名称 | 渠道名称 | 训练输入模式 | 文件类型 | 实例类 | 可并行化 |
---|---|---|---|---|---|
AutoGluon-表格 | 训练和(可选)验证 | 文件 | CSV | GPU 或 CPU(仅单个实例) | 否 |
BlazingText | 训练 | 文件或管道 | 文本文件(每行一句,带空格分隔的令牌) | GPU 或 CPU(仅单个实例) | 否 |
CatBoost | 训练和(可选)验证 | 文件 | CSV | CPU(仅单个实例) | 否 |
DeepAR 预测 | 训练和 (可选) 测试 | 文件 | JSON 行或 Parquet | CPU 或 GPU | 是 |
因子分解机 | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf | CPU(对密集数据使用 GPU) | 是 |
图像分类- MXNet | 训练和验证,(可选)train_lst、validation_lst 和模型 | 文件或管道 | recordIO 或图像文件 (.jpg 或 .png) | GPU | 是 |
图像分类- TensorFlow | 训练和验证 | 文件 | 图像文件(.jpg、.jpeg 或 .png) | CPU 或 GPU | 是(仅在单个实例 GPUs 上跨多个实例) |
IP 见解 | 训练和 (可选) 验证 | 文件 | CSV | CPU 或 GPU | 是 |
K-Means | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPUCommon (一个或多个实例上的单个 GPU 设备) | 否 |
K-Nearest-Neighbors (k-nn) | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU(一个或多个实例上的单个 GPU 设备) | 是 |
LDA | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU(仅单个实例) | 否 |
LightGBM | 训练和(可选)验证 | 文件 | CSV | CPU | 是 |
线性学习器 | 训练和 (可选) 验证和/或测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
神经主题模型 | 训练和 (可选) 验证和/或测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
Object2Vec | 训练和 (可选) 验证和/或测试 | 文件 | JSON 行 | GPU 或 CPU(仅单个实例) | 否 |
物体检测- MXNet | 训练和验证,(可选)train_annotation、validation_annotation 和模型 | 文件或管道 | recordIO 或图像文件 (.jpg 或 .png) | GPU | 是 |
物体检测- TensorFlow | 训练和验证 | 文件 | 图像文件(.jpg、.jpeg 或 .png) | GPU | 是(仅在单个实例 GPUs 上跨多个实例) |
PCA | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU 或 GPU | 是 |
Random Cut Forest | 训练和 (可选) 测试 | 文件或管道 | recordIO-protobuf 或 CSV | CPU | 是 |
语义分割 | 训练和验证、train_annotation、validation_annotation 以及(可选)label_map 和模型 | 文件或管道 | 图像文件 | GPU(仅单个实例) | 否 |
Seq2Seq 建模 | 训练、验证和 vocab | 文件 | recordIO-protobuf | GPU(仅单个实例) | 否 |
TabTransformer | 训练和(可选)验证 | 文件 | CSV | GPU 或 CPU(仅单个实例) | 否 |
文本分类- TensorFlow | 训练和验证 | 文件 | CSV | CPU 或 GPU | 是(仅在单个实例 GPUs 上跨多个实例) |
XGBoost (0.90-1、0.90-2、1.0-1、1.2-1、1.2-21) | 训练和 (可选) 验证 | 文件或管道 | CSV、LibSVM 或 Parquet | CPU(对于 1.2-1 为 GPU) | 是 |
可并行化 的算法可部署在多个计算实例上以进行分布式训练。
以下主题提供有关数据格式、推荐的 Amazon EC2 实例类型以及 Amazon A SageMaker I 提供的所有内置算法的通用 CloudWatch 日志的信息。
注意
要查找 SageMaker AI 管理 URIs 的内置算法的 Docker 镜像,请参阅 Docker 注册表路径和示例代码。