Amazon SageMaker Studio Classic のトラブルシューティング - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Studio Classic のトラブルシューティング

重要

2023 年 11 月 30 日現在、以前の Amazon SageMaker Studio エクスペリエンスは Amazon SageMaker Studio Classic と名付けられています。以下のセクションは、Studio Classic アプリケーションの使用に固有のものです。更新された Studio エクスペリエンスの使用については、「」を参照してくださいAmazon SageMaker Studio

重要

Amazon SageMaker Studio または Amazon SageMaker Studio Classic が Amazon SageMaker リソースを作成できるようにするカスタムIAMポリシーは、それらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要です。IAM ポリシーで Studio と Studio Classic がリソースの作成を許可されていてもタグ付けが許可されていない場合、リソースの作成を試みるとAccessDenied「」エラーが発生する可能性があります。詳細については、「リソースにタグ付けするための SageMakerアクセス許可を提供する」を参照してください。

AWS Amazon のマネージドポリシー SageMaker SageMaker リソースを作成するアクセス許可を付与する には、それらのリソースの作成中にタグを追加するアクセス許可が既に含まれています。

このトピックでは、セットアップと使用中に発生する一般的な Amazon SageMaker Studio Classic の問題をトラブルシューティングする方法について説明します。Amazon SageMaker Studio Classic の使用中に発生する可能性のある一般的なエラーを次に示します。各エラーの後に、エラーの解決策を示します。

Studio Classic アプリケーションの問題

Studio Classic アプリケーションの起動と使用時に以下の問題が発生します。

  • 画面が読み込まれない: ワークスペースをクリアして待機しても問題が解消されない

    Studio Classic アプリケーションを起動すると、ポップアップに次のメッセージが表示されます。どのオプションを選択しても、Studio Classic はロードされません。

    Loading... The loading screen is taking a long time. Would you like to clear the workspace or keep waiting?

    Studio Classic ワークスペースで複数のタブが開いている場合、または Amazon に複数のファイルがある場合、Studio Classic アプリケーションは起動を遅らせる可能性がありますEFS。このポップアップは、Studio Classic ワークスペースの準備が整ってから数秒後に消えます。

    いずれかのオプションを選択した後にスピナーでロード画面が表示され続けると、Studio Classic で使用される Amazon Virtual Private Cloud の接続に問題がある可能性があります。 

    Studio Classic で使用される Amazon Virtual Private Cloud (Amazon VPC) の接続問題を解決するには、次のネットワーク設定を確認します。

    • ドメインが VpcOnly モードで設定されている場合: の Amazon VPCエンドポイント AWS STS、またはインターネット経由のトラフィックを含むアウトバウンドトラフィックの NAT Gateway があることを確認します。確認するには、「の Studio ノートブックVPCを外部リソースに接続する」の手順に従います。

    • Amazon VPCが提供する DNSではなくカスタムで DNS Amazon が設定されている場合: Studio Classic VPCで使用される Amazon に追加された各 Amazon VPCエンドポイントの動的ホスト設定プロトコル (DHCP) を使用してルートが設定されていることを確認します。デフォルトオプションセットとカスタムDHCPオプションセットの設定の詳細については、DHCPAmazon の「オプションセットVPC」を参照してください。

  • Studio Classic の起動時の内部障害

    Studio Classic を起動すると、Studio Classic UI を表示できません。また、次のようなエラーが表示され、エラーの詳細が内部障害になっています。

    Amazon SageMaker Studio The JupyterServer app default encountered a problem and was stopped.

    このエラーは複数の要因によって発生する可能性があります。これらの手順を完了しても問題が解決しない場合は、 で問題を作成します https://aws.amazon.com/premiumsupport/。 

    • Amazon EFSマウントターゲット がない: Studio Classic はストレージEFSに Amazon を使用します。Amazon EFSボリュームには、Amazon SageMaker ドメインが作成されるサブネットごとにマウントターゲットが必要です。この Amazon EFSマウントターゲットが誤って削除された場合、Studio Classic アプリケーションはユーザーのファイルディレクトリをマウントできないため、ロードできません。この問題を解決するには、次の手順に従います。

      マウントターゲットを検証または作成するには
      1. API 呼び出しを使用してDescribeDomain、ドメインに関連付けられている Amazon EFSボリュームを検索します。 

      2. にサインイン AWS Management Console し、 で Amazon https://console.aws.amazon.com/efs/EFSコンソールを開きます。

      3. Amazon EFSボリュームのリストから、ドメインに関連付けられている Amazon EFSボリュームを選択します。

      4. Amazon EFSの詳細ページで、ネットワークタブを選択します。ドメインが設定されているすべてのサブネットにマウントターゲットがあることを確認します。

      5. マウントターゲットがない場合は、不足している Amazon EFSマウントターゲットを追加します。手順については、「Creating and managing mount targets and security groups」を参照してください。

      6. 欠落しているマウントターゲットを作成したら、Studio Classic アプリケーションを起動します。

    • ユーザーの.localフォルダ内の競合ファイル: Studio Classic でバージョン 1 を使用している場合 JupyterLab、.localフォルダ内の競合ライブラリは Studio Classic アプリケーションを起動するときに問題を引き起こす可能性があります。これを解決するには、ユーザープロファイルのデフォルト JupyterLab バージョンを JupyterLab 3.0 に更新します。 JupyterLab バージョンの表示と更新の詳細については、「」を参照してくださいJupyterLab バージョニング

  • Studio Classic の起動時ConfigurationError: LifecycleConfig

    Studio Classic の起動時に Studio Classic UI を表示することはできません。これは、ドメインにアタッチされているデフォルトのライフサイクル設定スクリプトに問題があることが原因です。

    ライフサイクル設定の問題を解決するには
    1. ライフサイクル設定の Amazon CloudWatch Logs を表示して、障害の原因となったコマンドを追跡します。ログを表示するには、「 CloudWatch Logs からライフサイクル設定プロセスを検証する」の手順に従います。

    2. デフォルトのスクリプトをユーザープロファイルまたはドメインからデタッチします。詳細については、「ライフサイクル設定の更新とデタッチ」を参照してください。

    3. Studio Classic アプリケーションを起動します。

    4. ライフサイクル設定スクリプトをデバッグします。システムターミナルからライフサイクル設定スクリプトを実行することで、トラブルシューティングできます。スクリプトがターミナルから正常に実行されたら、ユーザープロファイルまたはドメインにスクリプトをアタッチできます。

  • SageMaker Studio Classic コア機能は利用できません。

    Studio Classic を開くときにこのエラーメッセージが表示された場合は、Python パッケージバージョンの競合が原因である可能性があります。これは、ノートブックまたはターミナルで次のコマンドを使用して、パッケージの依存関係とバージョンが競合する Python SageMaker パッケージをインストールした場合に発生します。

    !pip install
    pip install --user

    この問題を解決するには、次の手順に従います。

    1. 最近インストールした Python パッケージをアンインストールします。アンインストールするパッケージがわからない場合は、 に問題を作成します https://aws.amazon.com/premiumsupport/。 

    2. Studio Classic を再起動します。

      1. ファイルメニューから Studio Classic をシャットダウンします。

      2. 1 分間待ちます。

      3. ページを更新するか、 から Studio Classic を再度開きます AWS Management Console。

    競合の原因となったパッケージをアンインストールすると、問題は解決します。この問題を再度発生させないようにパッケージをインストールするには、--user フラグを付けずに %pip install を実行します。

    問題が解決しない場合、新しいユーザープロファイルを作成し、そのユーザープロファイルを使って環境を設定します。

    これらのソリューションで問題が解決しない場合は、 で問題を作成します https://aws.amazon.com/premiumsupport/。 

  • から Studio Classic を開くことができません AWS Management Console。

    Studio Classic を開くことができず、すべてのデフォルト設定で新しい実行中のインスタンスを作成できない場合は、 で問題を作成します https://aws.amazon.com/premiumsupport/。 

KernelGateway アプリケーションの問題

以下の問題は、Studio Classic で起動される KernelGateway アプリケーションに固有のものです。

  • カーネルセッションにアクセスできない

    ユーザーが新しいノートブックを起動しても、ノートブックセッションに接続できません。 KernelGateway アプリケーションのステータスが の場合In Service、以下を確認して問題を解決できます。

    • セキュリティグループの設定を確認する

      ドメインが VPCOnly モードで設定されている場合、ドメインに関連付けられたセキュリティグループは、 JupyterServer と KernelGateway アプリケーション間の接続8192-65535のために、 範囲内のポート間のトラフィックを許可する必要があります。

      セキュリティグループのルールを確認するには
      1. DescribeDomain API 呼び出しを使用してドメインに関連付けられたセキュリティグループを取得します。

      2. にサインイン AWS Management Console し、 で Amazon VPCコンソールを開きますhttps://console.aws.amazon.com/vpc/

      3. 左側のナビゲーションの [セキュリティ] で、[セキュリティグループ] を選択します。

      4. ドメインに関連付けられているIDsセキュリティグループの でフィルタリングします。

      5. 各セキュリティグループで次を実行します。

        1. セキュリティグループを選択します。

        2. セキュリティグループの詳細ページで、[インバウンドルール] を表示します。8192-65535 の範囲内のポート間で、トラフィックが許可されていることを確認します。

      セキュリティグループのルールの詳細については、「Control traffic to resources using security groups」を参照してください。Studio Classic を VPCOnly モードで使用するための要件の詳細については、「」を参照してくださいの Studio ノートブックVPCを外部リソースに接続する

    • ファイアウォールと WebSocket接続を確認する

      KernelGateway アプリケーションInServiceのステータスが で、ユーザーが Studio Classic ノートブックセッションに接続できない場合は、ファイアウォールとWebSocket 設定を確認します。

      1. Studio Classic アプリケーションを起動します。詳細については、「Amazon SageMaker Studio Classic を起動する」を参照してください。

      2. ウェブブラウザの開発者ツールを開きます。

      3. [ネットワーク] タブを選択します。

      4. 次の形式に一致するエントリを検索します。

        wss://<domain-id>.studio.<region>.sagemaker.aws/jupyter/default/api/kernels/<unique-code>/channels?session_id=<unique-code>

        エントリのステータスまたはレスポンスコードが 以外の場合101、ネットワーク設定により Studio Classic アプリケーションと KernelGateway アプリケーション間の接続が妨げられています。

        この問題を解決するには、ネットワーク設定を管理するチームに連絡して、Studio Classic のリストを許可URLし、 WebSocket 接続を有効にします。 

  • リソースクォータの超過によりアプリを起動できない

    ユーザーが新しいノートブックを起動しようとすると、ノートブックの作成が以下のいずれかのエラーで失敗します。これはリソースクォータの超過が原因です。

    • Unable to start more Apps of AppType [KernelGateway] and ResourceSpec(instanceType=[]) for UserProfile []. Please delete an App with a matching AppType and ResourceSpec, then try again

      Studio Classic は、同じインスタンスで最大 4 つの実行中の KernelGateway アプリケーションをサポートします。この問題を解決するには、次のいずれかを実行します。

      • インスタンスで実行されている既存の KernelGateway アプリケーションを削除し、新しいノートブックを再起動します。

      • 新しいノートブックを別のインスタンスタイプで起動します。

      詳細については、「インスタンスタイプの変更」を参照してください。

    • An error occurred (ResourceLimitExceeded) when calling the CreateApp operation

      この場合、アカウントには、指定されたインスタンスタイプで Studio Classic アプリケーションを作成するのに十分な制限がありません。これを解決するには、 の Service Quotas コンソールに移動しますhttps://console.aws.amazon.com/servicequotas/。コンソールで、Studio KernelGateway Apps running on instance-type instance 制限の引き上げをリクエストします。詳細については、AWS Service Quotas を参照してください。