制約と考慮事項 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

制約と考慮事項

以下の制約を確認して、ノートブックジョブが正常に完了するようにします。Studio では Papermill を使用してノートブックを実行します。Papermill の要件に合わせるために Jupyter Notebook を更新する必要がある場合があります。また、LCCスクリプトの内容や、VPC設定に関して理解しておくべき重要な詳細にも制限があります。

JupyterLab バージョン

JupyterLab バージョン 3.0 以降がサポートされています。

カーネルの再起動が必要なパッケージのインストール

Papermill は、カーネルの再起動が必要なパッケージをインストールする pip install の呼び出しをサポートしていません。このような場合は、初期化スクリプトで pip install を使用します。カーネルの再起動を必要としないパッケージインストールでも、ノートブックに pip install を含めることができます。

Jupyter に登録されているカーネル名と言語名

Papermill は特定のカーネルと言語のトランスレーターを登録します。独自のインスタンス (BYOI) を持ち込む場合は、次のスニペットに示すように、標準のカーネル名を使用します。

papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)

パラメータと環境変数の制限

パラメータと環境変数の制限。ノートブックジョブを作成すると、指定したパラメータと環境変数がジョブに届きます。最大 100 個のパラメータを渡すことができます。各パラメータ名の長さは最大 256 文字、関連値は最大 2500 文字です。環境変数を渡す場合、最大 28 個の変数を渡すことができます。変数名と関連値の長さは 512 文字までです。28 個を超える環境変数が必要な場合は、使用できる環境変数の数に制限のない初期化スクリプトで追加の環境変数を使用します。

ジョブとジョブ定義の表示

ジョブとジョブ定義の表示。ノートブックの Studio UI で JupyterLab ノートブックジョブをスケジュールすると、Studio UI でノートブックジョブノートブックジョブ定義を表示できます。 SageMaker Python を使用してノートブックジョブをスケジュールした場合SDK、ジョブのみを表示できます。 SageMaker Python SDKノートブックジョブステップではジョブ定義は作成されません。ジョブを表示するには、ノートブックジョブステップインスタンスに追加のタグを指定する必要があります。詳細については、「Studio UI ダッシュボードでノートブックジョブを表示する」を参照してください。

イメージ

Studio でノートブックジョブを実行するか、パイプラインで SageMaker Python SDKノートブックジョブステップを実行するかに応じて、イメージの制約を管理する必要があります。

ノートブックジョブの画像制約 SageMaker (Studio)

イメージとカーネルのサポート。ノートブックジョブを起動するドライバーは、以下を前提としています。

  • 基本 Python ランタイム環境は Studio または bring-your-own (BYO) イメージにインストールされ、シェルのデフォルトです。

  • 基本の Python ランタイム環境には、カーネルスペックが適切に設定された Jupyter クライアントが含まれています。

  • 基本の Python ランタイム環境には pip 関数が含まれているため、ノートブックジョブはシステムの依存関係をインストールできます。

  • 複数の環境を含むイメージの場合、ノートブック固有のパッケージをインストールする前に、初期化スクリプトを適切なカーネル固有の環境に切り替える必要があります。カーネルの Python ランタイム環境を設定した後に、カーネルランタイム環境と異なる場合は、デフォルトの Python ランタイム環境に戻す必要があります。

ノートブックジョブを起動するドライバーは bash スクリプトであり、Bash v4 は /bin/bash で利用できる必要があります。

bring-your-own-images (BYOI) のルート権限。独自の Studio イメージに対しては、ルートユーザーとして、または sudo アクセスを通じてルート権限を持っている必要があります。ルートユーザーではないが sudo 経由で ルート権限にアクセスする場合は、UID/GID として 1000/100 を使用します。

Python SDKノートブックジョブの画像制約 SageMaker

ノートブックジョブステップでは、次のイメージがサポートされています。

  • SageMaker にリストされているディストリビューションイメージStudio Classic で使用できる Amazon SageMaker イメージ

  • 前のリストの SageMaker ディストリビューションイメージに基づくカスタムイメージ。SageMaker ディストリビューションイメージをベースとして使用します。

  • ノートブックジョブの依存関係 ( などBYOI) がプリインストールされたカスタムイメージ ()sagemaker-headless-execution-driver。イメージは、次の要件を満たしている必要があります。

    • イメージにはノートブックジョブの依存関係がプリインストールされています。

    • 基本の Python ランタイム環境がインストールされ、シェル環境にデフォルトで設定されます。

    • 基本の Python ランタイム環境には、カーネルスペックが適切に設定された Jupyter クライアントが含まれています。

    • ルート権限は、ルートユーザーとして、またはsudoアクセスを通じて付与されます。ルートユーザーではないが sudo 経由で ルート権限にアクセスする場合は、UID/GID として 1000/100 を使用します。

VPC ジョブの作成中に使用されるサブネット

を使用する場合VPC、Studio はプライベートサブネットを使用してジョブを作成します。1~5 つのプライベートサブネット (および 1~15 のセキュリティグループ) を指定します。

プライベートサブネットVPCで を使用する場合は、ノートブックジョブが依存するサービスまたはリソースに接続できるように、次のいずれかのオプションを選択する必要があります。

  • ジョブがインターフェイスVPCエンドポイントをサポートする AWS サービスにアクセスする必要がある場合は、サービスに接続するためのエンドポイントを作成します。インターフェイスエンドポイントをサポートするサービスのリストについては、AWS 「 と統合する のサービス AWS PrivateLink」を参照してください。インターフェイスVPCエンドポイントの作成の詳細については、「インターフェイスエンドポイント を使用して AWS サービスにアクセスするVPC」を参照してください。少なくとも、Amazon S3 VPCエンドポイントゲートウェイを指定する必要があります。

  • ノートブックジョブがインターフェイスVPCエンドポイントをサポートしていない AWS サービスまたは 外のリソースにアクセスする必要がある場合は AWS、NATゲートウェイを作成し、アウトバウンド接続を許可するようにセキュリティグループを設定します。のNATゲートウェイの設定についてはVPC、Amazon Virtual Private Cloud ユーザーガイドVPC「パブリックサブネットとプライベートサブネット (NAT) を使用する」を参照してください。

サービス制限

ノートブックジョブスケジューラは SageMaker パイプライン、 SageMaker トレーニング、Amazon EventBridge のサービスから構築されているため、ノートブックジョブにはサービス固有のクォータが適用されます。これらのクォータを超えると、これらのサービスに関連するエラーメッセージが表示されることがあります。例えば、一度に実行できるパイプラインの数や、1 つのイベントバスに設定できるルールの数には制限があります。 SageMaker クォータの詳細については、「Amazon SageMaker エンドポイントとクォータ」を参照してください。 EventBridge クォータの詳細については、「Amazon EventBridge Quotas」を参照してください。