Amazon DataZone 組み込みブループリント - Amazon DataZone

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon DataZone 組み込みブループリント

環境が作成されるブループリントは、環境が属するプロジェクトのメンバーは、Amazon DataZone カタログ内のアセットを操作するときにどのツールやサービスを使用できるかを定義します。Amazon の現在のリリースでは DataZone、以下の組み込みブループリントがあります。

  • データレイクの設計図

  • データウェアハウスの設計図

  • Amazon SageMaker ブループリント

Amazon でデフォルトのブループリントを有効にするには、以下の手順を実行します DataZone。

で組み込みブループリントを有効にする AWS Amazon DataZone ドメインを所有する アカウント

環境が作成されるブループリントは、環境が属するプロジェクトのメンバーは、Amazon DataZone カタログ内のアセットを操作するときにどのツールやサービスを使用できるかを定義します。

Amazon の現在のリリースでは DataZone、データレイクブループリント、データウェアハウスブループリント、Amazon ブループリントのいくつかのブルー SageMaker プリントが組み込まれています。

  • データレイクの設計図には、一連のサービス (AWS Glue、 AWS Lake Formation、Amazon Athena ) は、Amazon DataZone カタログでデータレイクアセットを公開して使用します。

  • データウェアハウスの設計図には、Amazon DataZone カタログで Amazon Redshift アセットを公開および使用するための一連の サービス (Amazon Redshift) を起動および設定するための定義が含まれています。

  • Amazon SageMaker ブループリントには、Amazon DataZone カタログで Amazon SageMaker アセットを公開および使用するための一連の サービス (Amazon SageMaker Studio) を起動および設定するための定義が含まれています。

詳細については、「Amazon DataZone の用語と概念」を参照してください。

Amazon DataZone ドメインの作成中に、ドメイン作成プロセスの一環として、デフォルトのデータレイクとデフォルトのデータウェアハウス組み込みブループリントを自動的に有効にするクイックセットアップを選択することもできます。クイックセットアップでは、これらの組み込みブループリントを使用して、デフォルトの環境プロファイルとデフォルトの環境も作成されます。

Amazon DataZone ドメインの作成の一環としてクイックセットアップを選択しない場合は、以下の手順に従って、 で使用可能な組み込みブループリントを有効にできます。 AWS この Amazon DataZone ドメインを格納する アカウント。これらの組み込みブループリントを使用して、このドメインで環境プロファイルと環境を作成する前に、これらの組み込みブループリントを有効にする必要があります。

Amazon DataZone マネジメントコンソールを介して Amazon DataZone ドメインで組み込みブループリントを有効にするには、管理アクセス許可を持つアカウントの IAMロールを引き受ける必要があります。 は、最小限のアクセス許可Amazon DataZone マネジメントコンソールを使用するために必要なIAMアクセス許可を設定するを取得します。

Amazon DataZone ドメインで組み込みブループリントを有効にする
  1. https://console.aws.amazon.com/datazone の Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、1 つ以上の組み込みブループリントを有効にするドメインを選択します。

  3. ドメインの詳細ページで、ブループリントタブに移動します。

  4. ブループリントリストから、 DefaultDataLakeまたは DefaultDataWarehouse、または Amazon SageMaker ブループリントを選択します。

  5. 選択したブループリントの詳細ページで、このアカウント で有効化 を選択します。

  6. アクセス許可とリソースページで、以下を指定します。

    • DefaultDataLake ブループリントを有効にする場合は、 Glue のアクセス管理ロール で、 のテーブルへのアクセスを取り込んで管理する DataZone 権限を Amazon に付与する新規または既存のサービスロールを指定します。 AWS Glue と AWS Lake Formation。

    • DefaultDataWarehouse ブループリントを有効にする場合は、Redshift のアクセス管理ロール で、Amazon Redshift のデータ共有、テーブル、ビューへのアクセスを取り込み、管理する DataZone 権限を Amazon に付与する新規または既存のサービスロールを指定します。

    • Amazon SageMaker ブループリントを有効にする場合は、SageMaker アクセス管理ロール で、Amazon SageMaker データをカタログに発行するアクセス許可を Amazon DataZone に付与する新規または既存のサービスロールを指定します。また、カタログ内の Amazon が SageMaker 公開したアセットへのアクセスを許可または取り消すアクセス DataZone 許可も Amazon に付与します。

      重要

      Amazon SageMaker ブループリントを有効にすると、Amazon は Amazon の次のIAMロールが現在のアカウントとリージョン DataZone に存在する DataZone かどうかを確認します。これらのロールが存在しない場合、Amazon DataZone によって自動的に作成されます。

      • AmazonDataZoneGlueAccess-<region>-<domainId>

      • AmazonDataZoneRedshiftAccess-<region>-<domainId>

    • プロビジョニングロール で、 を使用して環境リソースを作成および設定する権限を Amazon DataZone に付与する新規または既存のサービスロールを指定します。 AWS CloudFormation 環境アカウントとリージョンの 。

    • Amazon SageMaker ブループリントを有効にする場合は、 SageMaker-Glue データソース の Amazon S3 バケット に、 内のすべての SageMaker 環境で使用される Amazon S3 バケットを指定します。 AWS アカウント。指定するバケットプレフィックスは、次のいずれかである必要があります。

      • Amazon データゾーン*

      • datazone-sagemaker*

      • sagemaker-datazone*

      • DataZone-Sagemaker*

      • Sagemaker-DataZone*

      • DataZone-SageMaker*

      • SageMaker-DataZone*

  7. ブループリントを有効にする を選択します。

選択したブループリントを有効にすると、アカウントでブループリント (複数可) を使用して環境プロファイルを作成できるプロジェクトを制御できます。これを行うには、プロジェクトの管理をブループリントの設定に割り当てます。

重要

デフォルトでは、環境ブループリントの管理プロジェクトは指定されません。つまり、Amazon DataZone ユーザーは環境ブループリントのプロファイルを作成できます。したがって、ガバナンスを強化するために、環境ブループリントのプロジェクト管理を常に指定することを強くお勧めします。

有効なブループリントでプロジェクトの管理を指定する
  1. https://console.aws.amazon.com/datazone の Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示 (View Domains) を選択し、選択した設計図の管理プロジェクトを追加するドメインを選択します。

  3. ブループリント タブを選択し、使用するブループリントを選択します。

  4. デフォルトでは、ドメイン内のすべてのプロジェクトは、 DefaultDataLake または DefaultDataWareshouse、またはアカウント内の Amazon SageMaker ブループリントを使用して環境プロファイルを作成できます。ただし、プロジェクト管理をブループリントに割り当てることで、これを制限できます。管理プロジェクトを追加するには、「管理プロジェクトを選択」を選択し、ドロップダウンメニューから管理プロジェクトとして追加するプロジェクトを選択し、「管理プロジェクトを選択」(複数可) を選択します。

で DefaultDataWarehouse ブループリントを有効にしたら AWS アカウントでは、設計図設定にパラメータセットを追加できます。パラメータセットはキーと値のグループであり、Amazon Redshift クラスターへの接続を確立 DataZone するために Amazon が必要とするもので、データウェアハウス環境の作成に使用されます。これらのパラメータには、Amazon Redshift クラスター、データベース、および の名前が含まれます。 AWS クラスターの認証情報を保持する シークレット。

DefaultDataWarehouse 設計図へのパラメータセットの追加
  1. https://console.aws.amazon.com/datazone の Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、パラメータセットを追加するドメインを選択します。

  3. ブループリントタブを選択し、 DefaultDataWareshouse ブループリントを選択してブループリントの詳細ページを開きます。

  4. 設計図の詳細ページのパラメータセットタブで、パラメータセットの作成 を選択します。

    • パラメータセットの名前を指定します。

    • 必要に応じて、パラメータセットの説明を入力します。

    • リージョンの選択

    • Amazon Redshift クラスターまたは Amazon Redshift Serverless を選択します。

    • を選択する AWS 選択した Amazon Redshift クラスターまたは Amazon Redshift Serverless ワークグループの認証情報ARNを保持する シークレット。- AWS シークレットをパラメータセット内で使用できるようにするには、 タグでAmazonDataZoneDomain : [Domain_ID]タグ付けする必要があります。

      • 既存の がない場合 AWS シークレット、新規作成 を選択して新しいシークレットを作成することもできます。 AWS シークレット 。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新規作成を選択したら AWS シークレット 、Amazon DataZone は に新しいシークレットを作成します。 AWS Secrets Manager サービスと は、シークレットにパラメータセットを作成しようとしているドメインがタグ付けされていることを確認します。

    • 上記のステップで Amazon Redshift クラスターを選択した場合は、ドロップダウンからクラスターを選択します。上記のステップで Amazon Redshift ワークグループを選択した場合は、ドロップダウンからワークグループを選択します。

    • 選択した Amazon Redshift クラスターまたは Amazon Redshift Serverless ワークグループ内のデータベースの名前を入力します。

    • パラメータセットの作成 を選択します。

注記

設計図に追加できるパラメータセットは最大 10 DefaultDataWarehouse個までです。

で Amazon SageMaker ブループリントを有効にしたら AWS アカウントでは、設計図設定にパラメータセットを追加できます。パラメータセットはキーと値のグループであり、Amazon が Amazon への接続を確立 DataZone するために必要 SageMaker であり、sagemaker 環境の作成に使用されます。

Amazon SageMaker ブループリントへのパラメータセットの追加
  1. https://console.aws.amazon.com/datazone の Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、パラメータセットを追加する有効なブループリントを含むドメインを選択します。

  3. ブループリントタブを選択し、Amazon SageMaker ブループリントを選択してブループリントの詳細ページを開きます。

  4. 設計図の詳細ページのパラメータ設定タブで、パラメータセットの作成 を選択し、以下を指定します。

    • パラメータセットの名前を指定します。

    • 必要に応じて、パラメータセットの説明を指定します。

    • Amazon SageMaker ドメイン認証タイプを指定します。IAM または IAM Identity Center () のいずれかを選択できますSSO。

    • を指定する AWS リージョン。

    • を指定する AWS KMS データ暗号化用の キー。既存のキーを選択するか、新しいキーを作成できます。

    • 環境パラメータ で、以下を指定します。

      • VPC ID - Amazon SageMaker 環境VPCの に使用している ID。既存の を指定するか、新しい を作成できますVPC。

      • サブネット - 内の特定のリソースの IP アドレスIDs範囲の 1 つ以上の VPC。

      • ネットワークアクセス - VPCのみまたはパブリックインターネットのみを選択します。

      • セキュリティグループ - VPCおよび サブネットを設定するときに使用するセキュリティグループ。

    • データソースパラメータで、次のいずれかを選択します。

      • AWS Glue のみ

      • AWS Glue + Amazon Redshift Serverless。このオプションを選択した場合は、以下を指定します。

        • を指定する AWS 選択した Amazon Redshift クラスターの認証情報ARNを保持する シークレット。- AWS シークレットをパラメータセット内で使用できるようにするには、 タグでAmazonDataZoneDomain : [Domain_ID]タグ付けする必要があります。

          既存の がない場合 AWS シークレット、新規作成 を選択して新しいシークレットを作成することもできます。 AWS シークレット 。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新規作成を選択したら AWS シークレット 、Amazon DataZone は に新しいシークレットを作成します。 AWS Secrets Manager サービスと は、シークレットにパラメータセットを作成しようとしているドメインがタグ付けされていることを確認します。

        • 環境の作成時に使用する Amazon Redshift ワークグループを指定します。

        • 環境の作成時に使用するデータベースの名前 (選択したワークグループ内) を指定します。

      • AWS Glue のみ + Amazon Redshift クラスター

        • を指定する AWS 選択した Amazon Redshift クラスターの認証情報ARNを保持する シークレット。- AWS シークレットをパラメータセット内で使用できるようにするには、 タグでAmazonDataZoneDomain : [Domain_ID]タグ付けする必要があります。

          既存の がない場合 AWS シークレット、新規作成 を選択して新しいシークレットを作成することもできます。 AWS シークレット 。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新規作成を選択したら AWS シークレット 、Amazon DataZone は に新しいシークレットを作成します。 AWS Secrets Manager サービスと は、シークレットにパラメータセットを作成しようとしているドメインがタグ付けされていることを確認します。

        • 環境の作成時に使用する Amazon Redshift クラスターを指定します。

        • 環境の作成時に使用するデータベースの名前 (選択したクラスター内) を指定します。

  5. パラメータセットの作成 を選択します。

で Amazon を信頼されたサービス SageMaker として追加する AWS Amazon DataZone ドメインを所有する アカウント

Amazon SageMaker ブループリントを有効にしている場合は、Amazon 内の信頼できるサービスの 1 つ SageMaker として も追加する必要があります DataZone。これを行うには、次の手順を実行します。

  1. https://console.aws.amazon.com/datazone の Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示 を選択し、有効な SageMaker ブループリントを含むドメインを選択します。

  3. Trusted services を選択し、Amazon SageMakerを選択し、Enable を選択します。