Amazon SageMaker Clarify Jobs に Amazon のリソースへのアクセスを許可する VPC - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Clarify Jobs に Amazon のリソースへのアクセスを許可する VPC

データおよび SageMaker Clarify ジョブへのアクセスを制御するには、プライベート Amazon を作成しVPC、パブリックインターネット経由でジョブにアクセスできないように設定することをお勧めします。ジョブを処理するVPCための Amazon の作成と設定の詳細については、「Amazon のリソースに SageMaker 処理ジョブアクセスを許可するVPC」を参照してください。

このドキュメントでは、 SageMaker Clarify ジョブの要件を満たす Amazon VPC設定を追加する方法について説明します。

Amazon VPC Access の SageMaker Clarify ジョブを設定する

プライベート Amazon VPC for SageMaker Clarify ジョブを設定するときにサブネットとセキュリティグループを指定し、トレーニング後のバイアスメトリクスと SageMaker モデル予測の説明に役立つ特徴量の寄与を計算するときに、ジョブがモデルから推論を取得できるようにする必要があります。

SageMaker ジョブ Amazon VPC サブネットとセキュリティグループの明確化

プライベート Amazon のサブネットとセキュリティグループは、ジョブの作成方法に応じて、さまざまな方法で SageMaker Clarify ジョブに割り当てるVPCことができます。

  • SageMaker コンソール : SageMaker ダッシュボード でジョブを作成するときに、この情報を指定します。[Processing] (処理) メニューで [Processing jobs] (処理ジョブ) を選択し、[Create processing job] (処理ジョブを作成) を選択します。ネットワークパネルで VPCオプションを選択し、ドロップダウンリストを使用してサブネットとセキュリティグループを指定します。このパネルにあるネットワーク分離オプションがオフになっていることを確認します。

  • SageMaker API: 次の例に示すようにAPI、 CreateProcessingJobNetworkConfig.VpcConfigリクエストパラメータを使用します。

    "NetworkConfig": { "VpcConfig": { "Subnets": [ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2" ], "SecurityGroupIds": [ "sg-0123456789abcdef0" ] } }
  • SageMaker Python SDK: 次の例に示すようにAPI、 SageMakerClarifyProcessorAPIまたは ProcessorNetworkConfigパラメータを使用します。

    from sagemaker.network import NetworkConfig network_config = NetworkConfig( subnets=[ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2", ], security_group_ids=[ "sg-0123456789abcdef0", ], )

SageMaker は、 情報を使用してネットワークインターフェイスを作成し、 SageMaker Clarify ジョブにアタッチします。ネットワークインターフェイスは、パブリックインターネットに接続VPCされていない Amazon 内のネットワーク接続で SageMaker Clarify ジョブを提供します。また、 SageMaker Clarify ジョブがプライベート Amazon のリソースに接続できるようにしますVPC。

注記

SageMaker Clarify ジョブがシャドウエンドポイントと通信できるようにするには、 SageMaker Clarify ジョブのネットワーク分離オプションをオフにする必要があります (デフォルトではオプションをオフにします)。

Amazon VPC for Inference モデルを設定する

トレーニング後のバイアスメトリクスと説明可能性を計算するには、 SageMaker Clarify ジョブは、 SageMaker Clarify 処理ジョブの分析設定model_nameパラメータで指定された SageMaker モデルから推論を取得する必要があります。または、 SageMaker Python SageMakerClarifyProcessorAPIで を使用する場合SDK、ジョブは ModelConfig クラスでmodel_name指定された を取得する必要があります。これを実現するために、 SageMaker Clarify ジョブはシャドウエンドポイント と呼ばれるモデルを使用してエフェメラルエンドポイントを作成し、モデルの Amazon VPC設定をシャドウエンドポイントに適用します。

プライベート Amazon のサブネットとセキュリティグループVPCを SageMakerモデルに指定するには、 のVpcConfigリクエストパラメータを使用するCreateModelAPIか、コンソールの SageMaker ダッシュボードを使用してモデルを作成するときにこの情報を指定します。次に、VpcConfig への呼び出しに含める CreateModel パラメータの例を示します。

"VpcConfig": { "Subnets": [ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2" ], "SecurityGroupIds": [ "sg-0123456789abcdef0" ] }

SageMaker Clarify 処理ジョブの分析設定initial_instance_countパラメータを使用して、起動するシャドウエンドポイントのインスタンス数を指定できます。または、 SageMaker Python SageMakerClarifyProcessorAPIで を使用する場合SDK、ジョブは ModelConfig クラスでinstance_count指定された を取得する必要があります。

注記

シャドウエンドポイントの作成時に 1 つのインスタンスのみをリクエストする場合でも、ModelConfigモデルの個別のアベイラビリティーゾーンに少なくとも 2 つのサブネットが必要です。2 つ以上のサブネットがない場合は、シャドウエンドポイントの作成に失敗し、次のエラーが表示されます。

ClientError: エンドポイントのホスティングエラー sagemaker-clarify-endpoint-XXX: 失敗。理由: リクエストされたインスタンスタイプが SageMaker サブネットと重複YYYするアベイラビリティーゾーンが少なくとも 2 つ (複数可) 見つかりません。

モデルで Amazon S3 にモデルファイルが必要な場合は、モデル Amazon に Amazon S3 VPCエンドポイントVPCが必要です。Amazon VPC for SageMaker Model の作成と設定の詳細については、「」を参照してくださいAmazon のリソースへのアクセスを SageMaker ホストエンドポイントに許可する VPC

プライベート Amazon VPC for SageMaker Clarify ジョブを設定する

通常、 SageMaker 処理VPC用にプライベートを設定するの手順に従って、プライベート Amazon VPC for SageMaker Clarify ジョブを設定できます。 SageMaker Clarify ジョブのハイライトと特別な要件をいくつか示します。

Amazon 以外のリソースに接続する VPC

パブリックインターネットアクセスがないVPCように Amazon を設定する場合、Amazon 以外のリソースやサービスへのアクセスを SageMaker Clarify ジョブに許可するには、追加の設定が必要ですVPC。例えば、 SageMaker Clarify ジョブは S3 バケットからデータセットをロードし、分析結果を S3 バケットに保存する必要があるため、Amazon S3 VPCエンドポイントが必要です。 S3 詳細については、「 作成ガイド」のAmazon S3 VPC エンドポイントを作成する」を参照してください。さらに、 SageMaker Clarify ジョブがシャドウエンドポイントから推論を取得する必要がある場合は、さらにいくつかの AWS サービスを呼び出す必要があります。

  • Amazon SageMaker API サービスVPCエンドポイントの作成: SageMaker Clarify ジョブは、シャドウエンドポイントを操作するため、または Amazon SageMaker API VPC検証の SageMaker モデルを記述するために Amazon サービスを呼び出す必要があります。ブログで AWS すべての Amazon SageMaker API コールを保護する PrivateLink に記載されているガイダンスに従って、 SageMaker Clarify ジョブがサービスコールを実行できるようにする Amazon SageMaker API VPCエンドポイントを作成できます。Amazon SageMaker API サービスのサービス名は です。ここでcom.amazonaws.region.sagemaker.apiregion は、Amazon VPC が存在するリージョンの名前です。

  • Amazon SageMaker Runtime VPC Endpoint の作成: SageMaker Clarify ジョブは Amazon SageMaker ランタイムサービスを呼び出し、呼び出しをシャドウエンドポイントにルーティングする必要があります。セットアップ手順は、Amazon SageMaker API サービスの手順と似ています。Amazon SageMaker Runtime サービスのサービス名は です。ここでcom.amazonaws.region.sagemaker.runtimeregion は、Amazon VPC が存在するリージョンの名前です。

Amazon VPC セキュリティグループを設定する

SageMaker Clarify ジョブは、次のいずれかの方法で 2 つ以上の処理インスタンスが指定されている場合、分散処理をサポートします。

  • SageMaker コンソール : インスタンス数は処理ジョブの作成ページのジョブ設定パネルのリソース設定パートで指定されます。

  • SageMaker API: でジョブを作成するとCreateProcessingJobInstanceCountが指定されますAPI。

  • SageMaker Python SDK: SageMakerClarifyProcessorAPIまたはプロセッサ を使用する場合、 instance_countが指定されますAPI。

分散型処理では、同じ処理ジョブ内の異なるインスタンス間の通信を許可する必要があります。そのためには、同じセキュリティグループのメンバー間のインバウンド接続を許可するセキュリティグループのルールを設定します。詳細については、「セキュリティグループルール」を参照してください。