SageMaker 工作室管理最佳实践 - SageMaker 工作室管理最佳实践

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SageMaker 工作室管理最佳实践

发布日期:2023 年 4 月 25 日 (文档修订)

摘要

Amazon SageMaker AI Studio 提供了一个基于 Web 的可视化界面,您可以在其中执行所有机器学习 (ML) 开发步骤,从而提高数据科学团队的工作效率。 SageMaker AI Studio 让您可以完全访问、控制和了解构建、训练和评估模型所需的每个步骤。

本白皮书讨论了运营模式、域管理、身份管理、权限管理、网络管理、日志记录、监控和自定义等主题的最佳实践。此处讨论的最佳实践适用于企业 SageMaker AI Studio 部署,包括多租户部署。本文档适用于机器学习平台管理员、机器学习工程师和机器学习架构师。

您使用 Well-Architected 了吗?

当您在云端构建系统时,AWS Well-Architected Framework 可帮助您了解所做决策的利弊。利用此框架的六个支柱,您可以了解到设计和运行可靠、安全、高效、经济有效且可持续的系统的架构最佳实践。您可以使用AWS Management Console免费提供的 AWS Well-Architected Tool,回答与每个支柱相关的一组问题,即可根据这些最佳实践检查自己的工作负载。

Machine Learning Lens 中,我们重点介绍了如何在 AWS Cloud中设计、部署和构建机器学习工作负载。此剖析对 Well-Architected Framework 所述最佳实践进行补充说明。

简介

在将 SageMaker AI Studio 作为机器学习平台进行管理时,您需要最佳实践指导来做出明智的决策,以帮助您在工作负载增长时扩展机器学习平台。如需预置、操作并扩展机器学习平台,请考虑以下事项:

  • 选择正确的运营模式并规划机器学习环境,以实现业务目标。

  • 选择如何为用户身份设置 SageMaker AI Studio 域身份验证,并考虑域级别限制。

  • 确定将用户身份与授权联合到机器学习平台的方法,以实现精细访问控制和审计。

  • 考虑为机器学习角色的不同身份设置权限和防护机制。

  • 根据机器学习工作负载的敏感度、用户数量、实例类型、应用程序和已启动的作业,规划您的虚拟私有云 (VPC) 网络拓扑。

  • 使用加密手段对静态数据和传输中数据进行分类和保护。

  • 考虑如何记录和监控各种应用程序编程接口 (APIs) 和用户活动以确保合规性。

  • 使用您自己的图像和生命周期配置脚本自定义 SageMaker AI Studio 笔记本体验。