Amazon DataZone の用語と概念 - Amazon DataZone

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon DataZone の用語と概念

Amazon DataZone は、 に保存されているデータのカタログ化、検出、共有、管理を迅速かつ簡単に行うことができるデータ管理サービスです。 AWS、オンプレミス、およびサードパーティーのソース。Amazon を使用すると DataZone、組織のデータアセットを監督する管理者とデータスチュワードは、きめ細かな制御を使用してデータへのアクセスを管理および管理できます。これらのコントロールは、適切なレベルの権限とコンテキストでアクセスを確保するように設計されています。Amazon DataZone では、エンジニア、データサイエンティスト、プロダクトマネージャー、アナリスト、ビジネスユーザーが組織全体のデータに簡単にアクセスできるため、データ主導型のインサイトを発見、使用、コラボレーションできます。

Amazon の使用を開始するときは DataZone、その主要な概念、用語、コンポーネントを理解することが重要です。

Amazon DataZone コンポーネント

Amazon DataZone には、次の 4 つの主要コンポーネントが含まれています。

  • ビジネスデータカタログ - このコンポーネントを使用して、組織全体のデータをビジネスコンテキストでカタログ化できるため、組織内のすべてのユーザーがデータをすばやく見つけて理解できます。

  • ワークフローの公開とサブスクライブ - これらの自動ワークフローを使用して、プロデューサーとコンシューマー間のデータをセルフサービス方式で保護し、組織内のすべてのユーザーが適切な目的で適切なデータにアクセスできるようにすることができます。

  • プロジェクトと環境

    • Amazon DataZone プロジェクトでは、人、アセット (データ)、ツールをビジネスユースケースに基づいてグループ化し、 へのアクセスを簡素化します。 AWS 分析。プロジェクトは、プロジェクトメンバーが共同作業、データ交換、アセットの共有ができる分野を提供します。デフォルトでは、プロジェクトは、プロジェクトに明示的に追加されたユーザーのみが、その中のデータと分析ツールにアクセスできるように設定されています。プロジェクトは、データコンシューマーがアクセスするためのプロジェクトポリシーに従って生成されたアセットの所有権を管理します。

    • Amazon DataZone プロジェクト内では、環境は設定済みのリソース (Amazon S3 バケット、 AWS Glue データベース、または Amazon Athena ワークグループ) で、特定のIAMプリンシパルのセット (例えば、寄稿者のアクセス許可を持つユーザー) を操作できます。

  • データポータル ( AWS マネジメントコンソール) - これはブラウザベースのウェブアプリケーションであり、さまざまなユーザーがセルフサービス方式でデータのカタログ化、検出、管理、共有、分析を行うことができます。データポータルは、 を介して ID プロバイダーからのIAM認証情報または既存の認証情報を使用してユーザーを認証します。 AWS IAM Identity Center.

Amazon DataZone ドメインとは

Amazon DataZone ドメインを使用して、アセット、ユーザー、およびプロジェクトを整理できます。追加の を関連付ける AWS Amazon DataZone ドメインの アカウントでは、データソースをまとめることができます。その後、メタデータフォームと用語集を使用して、これらのデータソースからドメインのカタログにアセットを発行し、メタデータの完全性と品質を向上させることができます。これらのアセットを検索して参照し、ドメインで公開されているデータを確認することもできます。さらに、プロジェクトに参加して他のユーザーとコラボレーションしたり、アセットをサブスクライブしたり、プロジェクト環境を使用して Amazon Athena や Amazon Redshift などの分析ツールにアクセスしたりできます。Amazon DataZone ドメインを使用すると、エンタープライズ用に単一の Amazon ドメインを作成する場合でも、 DataZone 異なるビジネスユニット用に複数の Amazon DataZone ドメインを作成する場合でも、組織構造のデータと分析のニーズを柔軟に反映できます。

Amazon DataZone のプロジェクトと環境とは

Amazon DataZone では、チームや分析ユーザーが、チーム、ツール、データのユースケースベースのグループを作成して、プロジェクトでコラボレーションできます。

  • Amazon では DataZone、プロジェクトにより、Amazon DataZone カタログ内のデータの公開、検出、サブスクライブ、消費など、さまざまなビジネスユースケースでユーザーのグループがコラボレーションできるようになります。プロジェクトメンバーは Amazon DataZone カタログのアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトは、データポータル内の以下のアクティビティをサポートします。

    • プロジェクト所有者は、所有者と寄稿者のアクセス許可を持つメンバーを追加できます

    • プロジェクトメンバーは、SSOユーザー、SSOグループ、IAMユーザーです

    • プロジェクトメンバーがデータカタログ内のアセットへのサブスクリプションをリクエストできる

      サブスクリプションの承認がプロジェクトに提供される

  • Amazon DataZone プロジェクトでは、環境は設定済みのリソース (Amazon S3、 AWS Glue データベース、または Amazon Athena ワークグループ)。これらのリソースを操作できる特定のプリンIAMシパルのセット。環境は、環境を作成するための再利用可能なテンプレートを提供する事前設定されたリソースとブループリントのセットである環境プロファイルを使用して作成されます。環境プロファイルは、 などの設定を定義します。 AWS アカウント 環境がデプロイされている またはリージョン。

Amazon DataZone ブループリントとは

環境が作成されるブループリントは、何を定義しますか AWS ツールとサービス (例: AWS Glue または Amazon Redshift) 環境が属するプロジェクトのメンバーは、Amazon DataZone カタログ内のアセットを操作するときに を使用できます。

Amazon の現在のリリースでは DataZone、以下のデフォルトのブループリントがサポートされています。

設計図名 説明 作成されたリソース
Data Lake の設計図

Amazon DataZone プロジェクトメンバーが 環境内で Data Lake プロデューサーおよびコンシューマーサービスを起動できるようにします。

コンシューマー として、Amazon DataZone プロジェクトメンバーは、Amazon Athena および Lake Formation がサポートする他のクエリエンジンで、Lake Formation が管理するアセットの「読み取り専用」コピーに直接アクセスできます。

プロデューサー として、Amazon DataZone プロジェクトメンバーは Amazon Athena を使用して新しい LakeFormationマネージドテーブルを作成し、Amazon DataZone カタログに公開できます。

Amazon Athena を使用して Lake Formation テーブルを作成およびクエリする機能をユーザーに提供します。Amazon Athena ワークグループ、 AWS Glue 「読み取り専用」Lake Formation 許可、「読み取り専用IAM」許可、およびプロジェクトによって管理される Amazon S3 へのアクセスを持つ データベース。 AWS Glue 「作成」と「付与」の Lake Formation 許可、「読み取り」と「書き込みIAM」許可を持つ データベース、 AWS Glue ETL タグ付けによる (抽出、変換、ロード)。
データウェアハウスの設計図

コンシューマー として、このブループリントにより、Amazon DataZone プロジェクトメンバーは独自の Amazon Redshift クラスターに接続してリモートデータストアをクエリし、新しいデータセットを作成して保存できます。

プロデューサー として、このブループリントにより、Amazon DataZone プロジェクトメンバーは独自の Amazon Redshift クラスターに接続して、リモートデータストアをクエリし、新しいデータセットを作成し、Amazon DataZone カタログに公開できます。

Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターにローカルアセットを作成する機能。Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターからアセットを作成および発行する機能。
Amazon Sagemaker の設計図

このブループリントは、データプロデューサーとコンシューマーがシームレスに Amazon に切り替え SageMaker て機械学習 (ML) プロジェクトで共同作業を行い、データや ML アセットへのアクセスガバナンスを実施するのに役立ちます。Amazon DataZone と Amazon の新しい組み込み統合により SageMaker、データコンシューマーとプロデューサーは、インフラストラクチャのセットアップ全体の ML ガバナンスを合理化し、ビジネスイニシアチブに共同作業を行い、データと ML アセットを簡単に管理できます。

Amazon でデータおよび ML アセットを検索、サブスクライブ、公開できる Amazon SageMaker ドメインを作成できます DataZone。をサブスクライブして に発行することもできます。 AWS Glue データベースと設定されたレイクフォーメーション。

Amazon DataZone インベントリと発行ワークフローとは

プロジェクトインベントリアセットの作成

Amazon を使用してデータを DataZone カタログ化するには、まずデータ (アセット) を Amazon のプロジェクトのインベントリとして持ち込む必要があります DataZone。プロジェクトのインベントリを作成すると、そのプロジェクトのメンバーのみがアセットを検出できるようになります。プロジェクトインベントリアセットは、明示的に公開されていない限り、検索/閲覧のすべてのドメインユーザーが利用できるわけではありません。Amazon の現在のリリースでは DataZone、次の方法でプロジェクトインベントリにアセットを追加できます。

  • データポータルまたは Amazon を使用してデータソースを作成して実行します DataZone APIs。Amazon の現在のリリースでは DataZone、 のデータソースを作成して実行できます。 AWS Glue と Amazon Redshift。を作成して実行する AWS Glue または Amazon Redshift データソースでは、選択したプロジェクトインベントリにアセットを作成し、その技術メタデータをソースデータベーステーブルまたはデータウェアハウスからインベントリとして Amazon にインポートします DataZone。

  • を使用してAPIs、使用可能なシステムアセットタイプ (AWS Glue、Amazon Redshift、Amazon S3 オブジェクト)、またはカスタムアセットタイプから。

    • Amazon を使用して、プロジェクトインベントリにカスタムアセットタイプを作成します DataZone APIs。カスタムアセットタイプには、ML モデル、ダッシュボード、オンプレミステーブルなどが含まれます。

    • Amazon を使用して、これらのカスタムアセットタイプからアセットを作成します DataZone APIs。

  • Amazon DataZone データポータルを使用して、S3 オブジェクトのアセットを手動で作成します。

プロジェクトインベントリアセットのキュレーション - プロジェクトインベントリを作成した後、データ所有者は、ビジネス名 (アセットとスキーマ)、説明 (アセットとスキーマ)、読み上げ、用語集用語 (アセットとスキーマ)、メタデータフォームを追加または更新することで、必要なビジネスメタデータでインベントリアセットをキュレートできます。これは、データポータルまたは Amazon を使用して実行できます DataZone APIs。アセットを編集するたびに、新しいインベントリバージョンが作成されます。

Amazon DataZone カタログへのプロジェクトインベントリアセットの発行

Amazon を使用してデータを DataZone カタログ化する次のステップは、プロジェクトのインベントリアセットをドメインユーザーが検出できるようにすることです。これを行うには、インベントリアセットを Amazon DataZone カタログに発行します。インベントリアセットの最新バージョンのみをカタログに公開でき、最新の公開バージョンのみが検出カタログでアクティブになります。インベントリアセットが Amazon DataZone カタログに公開された後に更新された場合は、最新バージョンが検出カタログに含まれるように、インベントリアセットを再度明示的に公開する必要があります。Amazon の現在のリリースでは DataZone、次の方法でプロジェクトインベントリアセットを Amazon DataZone カタログに公開できます。

  • データポータルまたは Amazon を使用して、プロジェクトインベントリアセットを Amazon DataZone カタログに手動で公開します DataZone APIs。

  • データソースの作成または編集の一環として、オプションの「 の発行」を有効にします。 AWS アセットをカタログに Glue するか、Amazon Redshift アセットをカタログ設定に公開して、スケジュールされたデータソースまたは自動化されたデータソースの実行中に使用します。この設定を有効にすると、データソースの実行によってプロジェクトのインベントリにアセットが追加され、インベントリアセットも Amazon DataZone カタログに発行されます。直接公開すると、アセットにビジネスメタデータがない可能性があり、すべてのドメインユーザーが直接検出できるようになります。この設定は、データポータルまたは Amazon を使用してデータソースで使用できます DataZone APIs。

Amazon DataZone サブスクリプションおよびフルフィルメントワークフローとは

アセットが Amazon DataZone カタログに公開されると、ドメインユーザーはこれらのアセットを検出し、これらのアセットをリクエストしてアクセスし、引き続き Amazon を使用してこれらのアセット DataZone を管理、共有、分析できます。

ユーザーは、プロジェクトに代わってそのアセットにサブスクライブすることで、アセットへのアクセスをリクエストします。サブスクリプションリクエストが作成されると、アセットの所有者は通知を受け取り、サブスクリプションリクエストを確認して、承認または拒否するかどうかを決定できます。サブスクリプションリクエストがデータ所有者によって承認されると、サブスクライブするプロジェクトにそのアセットへのアクセス権が付与されます。

サブスクリプションリクエストが承認されると、Amazon はサブスクリプションフルフィルメントワークフロー DataZone を開始し、必要な許可を で作成して、プロジェクト内のすべての該当する環境にアセットを自動的に追加します。 AWS Lake Formation または Amazon Redshift。これにより、サブスクライブしているプロジェクトメンバーは、環境内のクエリツール (Amazon Athena または Amazon Redshift クエリエディタ) のいずれかを使用してアセットをクエリできます。

Amazon はこの自動フルフィルメントロジックをマネージドアセットに対してのみトリガー DataZone できます (これには、 AWS Glue テーブルと Amazon Redshift テーブルとビュー)。他のすべてのアセットタイプ (アンマネージドアセット) の場合、Amazon DataZone は自動的にフルフィルメントをトリガーすることはできませんが、代わりにイベントペイロードに必要なすべての詳細を含むイベントを Amazon Eventbridge に発行して、Amazon の外部で必要な許可を作成できるようにします DataZone。また、Amazon は、サブスクリプションが Amazon の外部で受理された後にサブスクリプションのステータスを更新して、Amazon がプロジェクトメンバー DataZone にアセットの使用を開始 DataZone できることを通知するupdateSubscriptionStatusAPIことができる DataZone も提供します。

Amazon のユーザーペルソナ DataZone

Amazon DataZone ユーザーの主なペルソナは次のとおりです。

  • Amazon を組織の分析プラットフォーム DataZone として設定するドメイン管理者。

    Amazon のコンテキストでは DataZone、ドメイン管理者は に Amazon をインストール DataZone します。 AWS アカウント、Amazon DataZone ドメインの作成、設定 AWS アカウントの関連付けと ID プロバイダーの Amazon DataZone ドメインとの関連付け。ドメイン管理者は他の も使用します。 AWS などの サービスコンソール AWS Amazon を設定するための Organization と Service Catalog DataZone。

  • 分析および機械学習タスクの Amazon DataZone (アセットパブリッシャーおよびサブスクライバー) の主なユーザーであるデータユーザー。

    データユーザーには、データアセットを生成して使用するデータ分析ワーカー、データサイエンティスト、システムユーザーが含まれます。Amazon のコンテキストでは DataZone、データユーザーはプロジェクトと環境を作成および結合し、事前設定された分析または機械学習ツールを使用してデータアセットをサブスクライブおよび消費し、出力データアセットを Amazon DataZone ドメインカタログに公開して他のユーザーと共有します。

  • カスタムインフラストラクチャテンプレートを構築し、Amazon DataZone を内部カタログまたは本番システムと統合するシステムデベロッパー。

    Amazon のコンテキストでは DataZone、システムデベロッパーは環境設計図 (インフラストラクチャテンプレート) または Infrastructure-As-Code CI/CD パイプラインを環境プロバイダーとして構築します。データパイプラインは、環境間でデータアセットを昇格させます。カタログ同期およびサブスクリプション許可フルフィルメントアダプターは、内部カタログと統合します。必要に応じて、Amazon DataZone APIs と内部ユーザーインターフェイスまたは本番システムの統合を行います。

  • 組織のセキュリティ、プライバシー、その他のコンプライアンスポリシーの定義とリスクを所有し、組織 DataZone 内での Amazon の使用がこれらの定義に準拠していることを確認するデータガバナンス責任者。

Amazon DataZone の用語

[ドメイン]

Amazon DataZone ドメインは、アセット、ユーザー、およびそれらのプロジェクトを連結するための組織エンティティです。Amazon DataZone ドメインを使用すると、エンタープライズ用の単一の Amazon ドメインを作成するか、複数のデータゾーンを作成するか、異なるビジネスユニットやチーム用のドメインを作成する DataZoneかにかかわらず、組織構造のデータと分析のニーズを柔軟に反映できます。

ドメイン単位

ドメインユニットを使用すると、アセットやその他のドメインエンティティを特定のビジネスユニットやチームで簡単に整理できます。組織のビジネスユニット間で安全かつ効率的なデータ共有を設定するには、Amazon 内でドメインユニットを作成し、各ビジネスユニット内の選択したユーザーがカタログにログインしてアセットを共有 DataZone できるようにします。ドメインユニットを使用して、 などのリソース所有者を有効にすることもできます。 AWS アカウント所有者は、リソースに Amazon DataZone 認証アクセス許可を設定します。ドメインユニットは、アカウント所有者からドメインユニット所有者に委任された権限を提供し、アカウント所有者に代わって環境プロファイル (設計図設定を使用して作成された) に認証権限を設定できます。詳細については、「Amazon のドメインユニットと承認ポリシー DataZone」を参照してください。

承認ポリシー

Amazon DataZone 認証ポリシーは、プロジェクト、ブループリント、環境、用語集、メタデータフォームなどのエンティティ DataZone に適用される Amazon 内の一連のコントロールです。これらのポリシーは、Amazon DataZone ポータルでこれらのエンティティを作成し、そのライフサイクルを管理できるユーザーを定義します。

Amazon DataZone ドメインユニット内で、ユーザーとグループに次の承認ポリシーを割り当てて、ユーザーに特定のアクセス許可を付与できます。

  • ドメイン単位作成ポリシー

  • プロジェクト作成ポリシー

  • プロジェクトメンバーシップポリシー

  • ドメイン単位の所有権の引き受けポリシー

  • プロジェクト所有権の引き受けポリシー

詳細については、「Amazon DataZone ドメイン単位内のユーザーとグループに承認ポリシーを割り当てる」を参照してください。

Amazon DataZone ドメインユニット内で、次の承認ポリシーをプロジェクトに割り当てて、特定のアクセス許可を付与できます。

  • 用語集作成ポリシー

  • メタデータフォーム作成ポリシー

  • カスタムアセットタイプ作成ポリシー

詳細については、「Amazon DataZone ドメイン単位内のプロジェクトに承認ポリシーを割り当てる」を参照してください。

特定のブループリント設定内で、プロジェクトとドメイン単位の所有者に次の承認ポリシーを割り当てることができます。

  • このブループリントを使用して環境プロファイルを作成する - このポリシーは Amazon DataZone プロジェクトに割り当てることができ、このブループリントを使用して環境プロファイルを作成することを承認します。

  • このブループリントを使用して環境プロファイルを作成するアクセス許可を付与する - このポリシーはドメイン単位の所有者に割り当てることができ、このブループリントを使用して環境プロファイルを作成するアクセス許可をプロジェクトに付与することを承認します。

詳細については、「Amazon DataZone ブループリント設定内で承認ポリシーを割り当てる」を参照してください。

関連付けられたアカウント

の関連付け AWS Amazon DataZone ドメインを持つ アカウントでは、これらの からのデータを発行できます。 AWS アカウントを Amazon DataZone カタログに追加し、複数の にまたがるデータを操作するための Amazon DataZone プロジェクトを作成します。 AWS アカウント。アカウント関連付けリクエストは、 でのみ開始できます。 AWS Amazon DataZone ドメインを所有する アカウント。アカウント関連付けリクエストは、招待された の管理ユーザーのみが受け入れることができます。 AWS アカウント。の 1 回 AWS アカウントは Amazon DataZone ドメインに関連付けられており、 などのデータソースを登録できます。 AWS このアカウントの Glue カタログと Amazon Redshift をこのドメインに。関連付けられると、 も有効になります。 AWS Amazon DataZone プロジェクトと環境を作成するための アカウント。

An AWS アカウント は、1 つ以上の Amazon DataZone ドメインに関連付けることができます。

データソース

Amazon では DataZone、データソースを使用して、ソースデータベースまたはデータウェアハウスから Amazon にアセット (データ) の技術メタデータをインポートできます DataZone。Amazon の現在のリリースでは DataZone、 のデータソースを作成して実行できます。 AWS Glue と Amazon Redshift。データソースを作成することで、Amazon DataZone とソース (AWS Glue Data Catalog または Amazon Redshift ウェアハウス) を使用して、テーブル名、列名、データ型などの技術的なメタデータを読み取ることができます。データソースを作成することで、Amazon で新しいアセットを作成または既存のアセットを更新する最初のデータソース実行も開始します DataZone。データソースの作成中またはデータソースが正常に作成された後に、データソースの実行スケジュールを指定するオプションもあります。

データソースの実行

Amazon では DataZone、データソースの実行は、プロジェクトインベントリにアセットを作成し、オプションでプロジェクトインベントリアセットを Amazon DataZone カタログに発行するために Amazon が DataZone 実行するタスクです。データソースの実行は、自動 (データソースが最初に作成されたときに開始) でも、スケジュールまたは手動でもかまいません。データ選択基準を使用すると、プロジェクトインベントリまたは Amazon DataZone カタログに取り込む既存および将来のデータセットと、それらのインベントリまたはカタログアセットへのメタデータ更新の頻度を微調整できます。

サブスクリプションターゲット

Amazon では DataZone、サブスクリプションターゲットを使用すると、プロジェクトでサブスクライブしたデータにアクセスできます。サブスクリプションターゲットは、Amazon がソースデータとの接続を確立し、Amazon DataZone プロジェクトのメンバーがサブスクライブしたデータのクエリを開始できるように、必要な許可を作成するために DataZone 使用できる場所 (データベースやスキーマなど) と必要なアクセス許可 (IAMロールなど) を指定します。

サブスクリプションリクエスト

Amazon では DataZone、サブスクリプションリクエストは、Amazon DataZone プロジェクトが特定のアセットへのアクセスを許可するために従う必要があるプロセスです。サブスクリプションリクエストは、承認、拒否、取り消し、または付与できます。

[アセット]

Amazon では DataZone、アセットは、単一の物理データオブジェクト (テーブル、ダッシュボード、ファイルなど) または仮想データオブジェクト (ビューなど) を表示するエンティティです。

アセットタイプ

アセットタイプは、Amazon DataZone カタログでのアセットの表現方法を定義します。アセットタイプは、特定のタイプのアセットのスキーマを定義します。アセットが作成されると、アセットタイプ (デフォルトでは最新バージョン) で定義されたスキーマに対して検証されます。アセットの更新が発生すると、Amazon DataZone は新しいアセットバージョンを作成し、Amazon DataZone ユーザーがすべてのアセットバージョンを操作できるようにします。

ビジネス用語集

Amazon では DataZone、ビジネス用語集は、アセットに関連する可能性のあるビジネス用語のコレクションです。ビジネス用語集は、さまざまなデータ分析タスクを通じて組織全体で同じ用語と定義が使用されるようにするのに役立ちます。

ビジネス用語集の用語をアセットや列に追加して、検索中にそれらの属性を分類または識別を強化できます。用語集は、アセットに関連付けられているメタデータフォームのフィールドの値タイプとして選択できます。アセットのメタデータフォームフィールドの値として特定の用語を選択すると、ユーザーはビジネス用語集の用語を検索し、関連するアセットを検索できます。

メタデータフォームタイプ

メタデータフォームタイプは、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインで公開されたときに収集および保存されるメタデータを定義するテンプレートです。メタデータフォームタイプは、データアセットに関連付けることができます。メタデータフォームタイプは、ドメイン管理者がコンプライアンス情報、規制情報、分類など、そのドメインに必要なメタデータフォームを定義するのに役立ちます。これにより、ドメイン管理者はアセットの追加メタデータをカスタマイズできます。Amazon DataZone には、 asset-common-details-form-type、 column-business-metadata-form-type、、 glue-table-form-type、 glue-view-form-type redshift-table-form-type、s3- redshift-view-form-type、 object-collection-form-type subscription-terms-form-typeなどのシステムメタデータフォームタイプがあります suggestion-form-type。

メタデータフォーム

Amazon では DataZone、メタデータフォームは、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインで公開されたときに収集および保存されるメタデータを定義します。メタデータフォーム定義は、ドメイン管理者がカタログドメインに作成します。メタデータフォーム定義は 1 つ以上のフィールド定義で構成され、ブール値、日付、10 進数、整数、文字列、ビジネス用語集フィールド値データ型がサポートされています。

ドメイン管理者は、ドメインにメタデータフォームを追加して、ドメイン内のアセットにメタデータフォームを適用します。アセットパブリッシャーは、メタデータフォームにオプションおよび必須のフィールド値を提供します。

プロジェクト

Amazon では DataZone、プロジェクトでは、プロジェクトインベントリにアセットを作成してすべてのプロジェクトメンバーが検出できるようにし、Amazon DataZone カタログでアセットを公開、検出、サブスクライブ、消費することを含むさまざまなビジネスユースケースでユーザーのグループがコラボレーションできます。プロジェクトメンバーは Amazon DataZone カタログのアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトメンバーは、所有者または寄稿者です。プロジェクト所有者は、他のユーザーを所有者または寄稿者として追加または削除したり、プロジェクトを変更または削除したりできます。寄稿者に対するその他の制限は、 ポリシーで定義できます。ユーザーがプロジェクトを作成すると、そのプロジェクトの最初の所有者になります。

環境

環境は、設定されたリソース (Amazon S3 バケット、 AWS Glue データベース、または Amazon Athena ワークグループ)。これらのリソースを操作できる特定のIAMプリンシパルのセット (寄稿者アクセス許可が付与されている)。各環境には、 リソースへのアクセスと、サブスクリプションとフルフィルメントを介してデータへのアクセスを許可されたユーザープリンシパルがいる場合もあります。環境は、実用的なリンクを に保存できるように設計されています。 AWS サービス、外部 IDEsおよびコンソール。プロジェクトのメンバーは、 環境内で設定されたディープリンクを介して、Amazon Athena コンソールなどのサービスにアクセスできます。SSO ユーザーとプロジェクトのIAMユーザーは、特定の環境を使用/アクセスするようにさらに絞り込むことができます。

環境プロファイル

Amazon では DataZone、環境プロファイルは環境の作成に使用できるテンプレートです。環境プロファイルは、ブループリントを使用して作成されます。

環境プロファイルを使用すると、ドメイン管理者は設計図を事前設定されたパラメータでラップでき、データワーカーは既存の環境プロファイルを選択し、新しい環境の名前を指定することで、任意の数の新しい環境をすばやく作成できます。これにより、データワーカーは、ドメイン管理者によって適用されるデータガバナンスポリシーを確実に満たすと同時に、プロジェクトと環境を効率的に管理できます。

ブループリント

環境が作成されるブループリントは、何を定義しますか AWS ツールとサービス (例: AWS Glue または Amazon Redshift) 環境が属するプロジェクトのメンバーは、Amazon DataZone カタログ内のアセットを操作するときに を使用できます。

Amazon の現在のリリースでは DataZone 、以下のデフォルトのブループリントがサポートされています。

  • データレイクの設計図

  • データウェアハウスの設計図

  • Amazon Sagemaker の設計図

ユーザープロファイル

ユーザープロファイルは Amazon DataZone ユーザーを表します。Amazon DataZone は、さまざまな目的で Amazon SSO DataZone マネジメントコンソールとデータポータルとやり取りするためのIAMロールと ID の両方をサポートしています。ドメイン管理者は、IAMロールを使用して、新しい Amazon ドメインの作成、メタデータフォームタイプの設定、ポリシーの実装など、Amazon DataZone マネジメントコンソールで最初の管理 DataZone ドメイン関連の作業を実行します。データワーカーは Identity Center 経由でSSO企業 ID を使用して Amazon DataZone Data Portal にログインし、メンバーシップがあるプロジェクトにアクセスします。

グループプロファイル

グループプロファイルは、Amazon DataZone ユーザーのグループを表します。グループは手動で作成することも、エンタープライズ顧客の Active Directory グループにマッピングすることもできます。Amazon では DataZone、グループは 2 つの目的を果たします。まず、グループは組織図のユーザーのチームにマッピングできるため、チームに加わったり退出したりする新しい従業員がいる場合の Amazon DataZone プロジェクト所有者の管理作業を減らすことができます。次に、企業管理者は Active Directory グループを使用してユーザーステータスを管理および更新するため、Amazon DataZone ドメイン管理者はこれらのグループメンバーシップを使用して Amazon DataZone ドメインポリシーを実装できます。

ドメイン管理者

Amazon では DataZone、Amazon DataZone ドメインを作成するIAMプリンシパルが、そのドメインのデフォルトのドメイン管理者です。Amazon のドメイン管理者は、ドメインの作成、他のドメイン管理者の割り当て、データソースとサブスクリプションターゲットの追加、プロジェクトと環境の作成、プロジェクト所有者の割り当てなど、ドメインの主要な機能 DataZone を実行します。

パブリッシャー

Amazon では DataZone、パブリッシャーは Amazon DataZone カタログにアセットを発行し、パブリッシュするアセットのメタデータを編集できます。この権限が付与されると、パブリッシャーは Amazon DataZone カタログで公開したアセットへのサブスクリプションリクエストを承認または拒否できます。

サブスクライバー

Amazon では DataZone、サブスクライバーは Amazon DataZone カタログ内のアセットを検索、アクセス、消費したい Amazon DataZone プロジェクトです。

AWS アカウント owner (オーナー)

Amazon では DataZone、 AWS アカウント 所有者は、 でロール、ポリシー、アクセス許可を作成します。 AWS アカウント これらの を有効にする AWS アカウント Amazon DataZone ドメインに関連付けられる 。