SageMaker Studio 管理のベストプラクティス - SageMaker Studio 管理のベストプラクティス

SageMaker Studio 管理のベストプラクティス

発行日: 2023 年 4 月 25 日 (ドキュメントの改訂)

要約

Amazon SageMaker Studio では、すべての機械学習 (ML) 開発ステップを単一のウェブベースのビジュアルインターフェイスで実行できるため、データサイエンスチームの生産性が向上します。SageMaker Studio は、モデルの構築、トレーニング、評価に必要な各ステップに対する完全なアクセス、制御、可視化を提供します。

このホワイトペーパーでは、運用モデル、ドメイン管理、ID 管理、アクセス許可管理、ネットワーク管理、ログ記録、モニタリング、カスタマイズなどのテーマに関するベストプラクティスについて説明します。ここで説明するベストプラクティスは、マルチテナントデプロイを含む企業向けの SageMaker Studio デプロイを意図しています。このドキュメントは、ML プラットフォーム管理者、ML エンジニア、ML アーキテクトを対象としています。

Well-Architected の実現状況の確認

AWS Well-Architected フレームワークは、クラウド内でのシステム構築に伴う意思決定の長所と短所を理解するのに役立ちます。このフレームワークの 6 つの柱により、信頼性、安全性、効率、費用対効果、持続可能性の高いシステムを設計および運用するための、アーキテクチャのベストプラクティスを確認できます。AWS Management Console に無料で提供されている AWS Well-Architected Tool を使用すると、各柱に関する一連の質問に答えることで、これらのベストプラクティスに照らしてワークロードをレビューできます。

機械学習レンズでは、AWS クラウド で機械学習ワークロードを設計、デプロイ、構築する方法に焦点を当てます。このレンズは、Well-Architected Framework で説明されているベストプラクティスを発展させます。

序章

SageMaker Studio を ML プラットフォームとして管理する場合、ワークロードの増大に合わせて ML プラットフォームをスケールできるように、十分な情報に基づいた意思決定を行うためのベストプラクティスのガイダンスが必要です。ML プラットフォームのプロビジョニング、運用、スケーリングを行う場合は、以下の点を考慮してください。

  • 適切な運用モデルを選択し、ビジネス目標を達成できるように ML 環境を整えます。

  • ユーザー ID に対する SageMaker Studio ドメイン認証の設定方法を選択し、ドメインレベルの制限を考慮します。

  • きめ細かなアクセス制御と監査のために、ユーザーの ID と承認を ML プラットフォームにフェデレーションする方法を決定します。

  • ML ペルソナのさまざまなロールに対してアクセス許可とガードレールを設定することを検討します。

  • ML ワークロードの感度、ユーザー数、インスタンスタイプ、アプリ、起動されるジョブを考慮して、仮想プライベートクラウド (VPC) ネットワークトポロジを計画します。

  • 保存中と転送中のデータを分類し、暗号化して保護します。

  • コンプライアンスを確保するために、さまざまなアプリケーションプログラミングインターフェイス (API) やユーザーアクティビティをログに記録してモニタリングする方法を検討します。

  • 独自のイメージとライフサイクル設定スクリプトを使用して SageMaker Studio ノートブックのエクスペリエンスをカスタマイズします。