本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
SageMaker 工作流程
在扩展机器学习 (ML) 操作时,您可以使用 Amazon SageMaker 完全托管的工作流程服务来实施机器学习生命周期的持续集成和部署 (CI/CD) 实践。借助 PipelinesSDK,您可以选择管道步骤并将其集成到统一的解决方案中,该解决方案可自动执行从数据准备到模型部署的模型构建过程。对于基于 Kubernetes 的架构,你可以在 Kubernetes 集群上安装 SageMaker 运算符,以便使用 Kubernetes 和命令行 Kub API ernetes 工具(例如)在本地创建 SageMaker 作业。kubectl
借助 Kubeflow 管道 SageMaker 组件,您可以通过 Kubeflow 管道创建和监控原生 SageMaker 作业。可从 Kubeflow Pipelines SageMaker 用户界面访问的作业参数、状态和输出。最后,如果您想计划 Jupyter 笔记本的非交互式批量运行,请使用基于笔记本的工作流服务,按照您定义的计划启动独立运行或定期运行。
总而言之, SageMaker 提供了以下工作流程技术:
-
管线:用于构建和管理机器学习管道的工具。
-
Kubernetes 编排:Kubernetes 集群的 SageMaker自定义运算符和 Kubeflow Pipelines 的组件。
-
SageMaker 笔记本职位:按需或按计划非交互式批量运行 Jupyter 笔记本。
您还可以利用与之集成的其他服务 SageMaker 来构建您的工作流程。这些选项包含以下服务:
-
气流工作流程
:导出 SageMaker APIs用于创建和管理 Airflow 工作流程的配置。 -
AWS Step Functions
:Python 中的多步骤 ML 工作流程,无需 SageMaker单独配置资源即可协调基础架构。
有关管理 SageMaker 训练和推理的更多信息,请参阅 Amaz SageMaker on Python SDK 工作流程