翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon DataZone は、AWS、オンプレミス、およびサードパーティソースに格納されているデータのカタログ化、検出、共有、管理をより迅速で簡単に行うことができるデータ管理サービスです。Amazon DataZone を使用すると、組織のデータアセットを監視する管理者やデータスチュワードは、きめ細かなコントロールを使用してデータへのアクセスを管理および制御できます。これらのコントロールは、適切なレベルの権限とコンテキストによるアクセスを保証するように設計されています。Amazon DataZone を使用すると、エンジニア、データサイエンティスト、プロダクトマネージャー、アナリスト、ビジネスユーザーが組織全体のデータにアクセスしやすくなり、データを活用したインサイトの発見、使用、共同作業での導出ができます。
Amazon DataZone の使用を開始する際は、その主要な概念、用語、コンポーネントを理解しておくことが重要です。
トピック
Amazon DataZone のコンポーネント
Amazon DataZone には、次の 4 つの主要なコンポーネントが含まれています。
-
ビジネスデータカタログ - このコンポーネントを使用すると、ビジネスコンテキストを使用して組織全体のデータをカタログ化できるため、組織内のすべてのユーザーがデータをすばやく見つけて理解できます。
-
ワークフローの公開とサブスクライブ - これらの自動ワークフローを使用して、プロデューサーとコンシューマー間のデータをセルフサービスで保護し、組織内のすべてのユーザーが適切な目的に適したデータにアクセスできるようにすることができます。
-
プロジェクトと環境
-
Amazon DataZone プロジェクトは、ユーザー、アセット (データ)、および使用ツールがビジネスユースケースに基づいてグループ化されているため、AWS 分析に簡単にアクセスできます。プロジェクトは、プロジェクトメンバーがコラボレーション、データ交換、アセット共有ができる領域を提供します。デフォルトでは、プロジェクトは、プロジェクトに明示的に追加されたユーザーのみが、そのプロジェクト内のデータと分析ツールにアクセスできるように設定されています。プロジェクトは、データコンシューマーがアクセスするためのプロジェクトポリシーに従って、生成されたアセットの所有権を管理します。
-
Amazon DataZone プロジェクト内では、環境は、指定された一連の IAM プリンシパル (コントロビューターアクセス許可を持つユーザーなど) が操作できる、0 以上の設定済みリソース (Amazon S3 バケット、AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションです。
-
-
データポータル (AWS マネジメントコンソール外) - これはブラウザベースのウェブアプリケーションであり、さまざまなユーザーがセルフサービス方式でデータのカタログ化、検出、管理、共有、分析を行うことができます。データポータルは、AWS IAM Identity Center を通じて ID プロバイダーからの IAM 認証情報または既存の認証情報を使用してユーザーを認証します。
Amazon DataZone ドメインとは
Amazon DataZone ドメインを使用して、アセット、ユーザー、それらのプロジェクトを整理できます。追加の AWS アカウントを Amazon DataZone ドメインに関連付けることで、データソースをまとめることができます。その後、これらのデータソースから、メタデータの完全性と品質を向上させるメタデータフォームと用語集を使用して、アセットをドメインのカタログに公開できます。これらのアセットを検索して参照し、ドメインで公開されているデータを確認することもできます。さらに、プロジェクトに参加して他のユーザーとコラボレーションしたり、アセットをサブスクライブしたり、プロジェクト環境を使用して Amazon Athena や Amazon Redshift などの分析ツールにアクセスしたりできます。Amazon DataZone ドメインを使用すると、エンタープライズ用に単一の Amazon DataZone ドメインを作成する場合でも、異なるビジネスユニット用に複数の Amazon DataZone ドメインを作成する場合でも、組織構造のデータと分析のニーズを柔軟に反映できます。
Amazon DataZone プロジェクトと環境とは
Amazon DataZone を使用すると、チームや分析ユーザーは、チーム、ツール、データのユースケースベースのグループを作成して、プロジェクトでコラボレーションできます。
-
Amazon DataZone でプロジェクトを使用すると、ユーザーのグループは、Amazon DataZone カタログ内のデータの公開、検出、サブスクライブ、使用など、さまざまなビジネスユースケースでコラボレーションできます。プロジェクトメンバーは、Amazon DataZone カタログのアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトは、データポータル内で次のアクティビティをサポートします。
-
プロジェクト所有者は、所有者、コントロビューター、コンシューマー、スチュワード、およびビューワーのアクセス許可を持つメンバーを追加できます
-
プロジェクトメンバーは、SSO ユーザー、SSO グループ、IAM ユーザーです
-
プロジェクトメンバーは、データカタログ内のアセットへのサブスクリプションをリクエストできます
サブスクリプションの承認がプロジェクトに提供されます
プロジェクトの作成/削除
プロジェクトプロファイルの作成/削除 環境プロファイルの作成/削除 環境の作成/削除 プロジェクトへのメンバーの追加/削除 検索と検出 メタデータフォーム/用語集の作成/削除 データソース作成の実行とデータの取り込み データの公開 サブスクリプションのリクエスト サブスクリプションリクエストの承認/拒否 Amazon Athena と Amazon Redshift からのサブスクライブされたデータの読み取り 所有者 ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される はい はい はい はい はい はい はい はい コントロビューター ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ はい はい はい はい はい はい はい コンシューマー ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
いいえ
いいえ
いいえ
はい
いいえ
はい
ビューワー ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
いいえ
いいえ
いいえ
いいえ
いいえ
はい
スチュワード ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
はい
はい
はい
いいえ
はい
はい
-
-
Amazon DataZone プロジェクトの環境は、0 以上の設定済みリソース (Amazon S3、AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションであり、それらのリソースで操作できる特定の IAM プリンシパルのセットが含まれます。環境は、環境を作成するための再利用可能なテンプレートを提供する事前設定されたリソースとブループリントのセットである環境プロファイルを使用して作成されます。環境プロファイルで、環境が展開される AWS アカウントやリージョンなどの設定を定義します。
Amazon DataZone のブループリントとは
環境の作成に使用するブループリントで、 Amazon DataZone カタログのアセットを操作するときに使用できる、環境が属するプロジェクト AWS ツールやサービス (AWS Glue や Amazon Redshift など) のメンバーを定義します。
Amazon DataZone の現在のリリースでは、以下のデフォルトのブループリントがサポートされています。
ブループリント名 | 説明 | 作成されるリソース |
---|---|---|
データレイクのブループリント |
Amazon DataZone プロジェクトメンバーは、環境内でデータレイクプロデューサーおよびコンシューマーのサービスを起動できます。 コンシューマーとして、Amazon DataZone プロジェクトメンバーはAmazon Athena およびその他の Lake Formation がサポートするクエリエンジンで Lake Formation が管理するアセットの「読み取り専用」コピーに直接アクセスできます。 プロデューサー として、Amazon DataZone プロジェクトメンバーは Amazon Athena を使用して新しい LakeFormation マネージドテーブルを作成し、Amazon DataZone カタログに公開できます。 |
Amazon Athena を使用して Lake Formation テーブルを作成およびクエリする機能をユーザーに提供します。Amazon Athena ワークグループ、「読み取り専用」 Lake Formation アクセス許可を持つ AWS Glue データベース、「読み取り専用」 IAM アクセス許可、プロジェクトで管理される Amazon S3 へのアクセスが。「作成」および「付与」 Lake Formation アクセス許可を持つ AWS Glue データベース、「読み取り」および「書き込み」 IAM アクセス許可、タグ付けによる AWS Glue ETL (抽出、変換、ロード)。 |
データウェアハウスのブループリント |
コンシューマーとしてこのブループリントを使用すると、Amazon DataZone プロジェクトメンバーは固有の Amazon Redshift クラスターに接続してリモートデータストアをクエリし、新しいデータセットを作成および保存できます。 プロデューサーとしてこのブループリントを使用すると、Amazon DataZone プロジェクトメンバーは固有の Amazon Redshift クラスターに接続してリモートデータストアをクエリし、新しいデータセットを作成し、Amazon DataZone カタログに公開できます。 |
Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからのサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターにローカルアセットを作成する機能。Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからのサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターからアセットを作成して公開する機能。 |
Amazon Sagemaker ブループリント |
このブループリントは、データプロデューサーおよびコンシューマーが Amazon SageMaker にシームレスに切り替えて、データおよび ML アセットへのアクセスガバナンスを適用しながら、機械学習 (ML) プロジェクトでコラボレーションするのに役立ちます。Amazon DataZone と Amazon SageMaker の新しい組み込み統合により、データコンシューマーおよびプロデューサーはインフラストラクチャのセットアップ全体の ML ガバナンスを合理化し、ビジネスイニシアチブでコラボレーションして、データと ML アセットを簡単に管理できます。 |
Amazon DataZone でデータおよび ML アセットを検索、サブスクライブ、公開できる Amazon SageMaker ドメインを作成できます。また、設定に従って AWS Glue データベースと Lake Formation をサブスクライブして公開することもできます。 |
Amazon DataZone インベントリと公開ワークフローとは
プロジェクトインベントリアセットの作成
Amazon DataZone を使用してデータをカタログ化するには、まず Amazon DataZone のプロジェクトのインベントリとしてデータ (アセット) を取り込む必要があります。プロジェクトのインベントリを作成すると、そのプロジェクトのメンバーのみがアセットを検出できます。プロジェクトインベントリアセットは、明示的に公開されていない限り、すべてのドメインユーザーが検索/参照で利用できるわけではありません。Amazon DataZone の現在のリリースでは、次の方法でプロジェクトインベントリにアセットを追加できます。
-
データポータルまたは Amazon DataZone API を使用して、データソースを作成および実行します。Amazon DataZone の現在のリリースでは、AWS Glue と Amazon Redshift のデータソースを作成して実行できます。AWS Glue または Amazon Redshift データソースを作成して実行することで、選択したプロジェクトインベントリにアセットを作成し、その技術メタデータをソースデータベーステーブルまたはデータウェアハウスからインベントリとして Amazon DataZone にインポートします。
-
API を使用して、使用可能なシステムアセットタイプ (AWS Glue、Amazon Redshift、Amazon S3 のオブジェクト) またはカスタムアセットタイプからアセットを作成できます。
-
Amazon DataZone API を使用して、プロジェクトインベントリにカスタムアセットタイプを作成します。カスタムアセットタイプには、ML モデル、ダッシュボード、オンプレミステーブルなどが含まれます。
-
Amazon DataZone API を使用して、これらのカスタムアセットタイプからアセットを作成します。
-
-
Amazon DataZone データポータルを使用して S3 オブジェクトのアセットを手動で作成します。
プロジェクトインベントリアセットのキュレート - プロジェクトインベントリの作成後、データ所有者は、ビジネス名 (アセットとスキーマ)、説明 (アセットとスキーマ)、Read me、用語集の用語 (アセットとスキーマ)、メタデータフォームを追加または更新することで、必要なビジネスメタデータを使用してインベントリアセットをキュレートできます。これは、データポータルまたは Amazon DataZone API を使用して行うことができます。アセットを編集するたびに、新しいインベントリバージョンが作成されます。
Amazon DataZone カタログへのプロジェクトインベントリアセットの公開
Amazon DataZone を使用してデータをカタログ化する次のステップは、プロジェクトのインベントリアセットをドメインユーザーが検出できるようにすることです。これを行うには、インベントリアセットを Amazon DataZone カタログに公開します。カタログに公開できるのはインベントリアセットの最新バージョンのみであり、検出カタログでは最新の公開バージョンのみがアクティブになります。インベントリアセットを Amazon DataZone カタログに公開された後に更新する場合は、最新バージョンが検出カタログに含まれるように、インベントリアセットを明示的に再公開する必要があります。Amazon DataZone の現在のリリースでは、次の方法でプロジェクトインベントリアセットを Amazon DataZone カタログに公開できます。
-
データポータルまたは Amazon DataZone API を使用して、プロジェクトインベントリアセットを Amazon DataZone カタログに手動で公開します。
-
データソースの作成または編集の一環として、オプションの [AWS Glue アセットをカタログに公開] 設定、または、[Amazon Redshift アセットをカタログ公開] 設定を有効にして、スケジュールされた、または自動化されたデータソースの実行中に使用します。この設定を有効にすると、データソースの実行によってプロジェクトのインベントリにアセットが追加され、インベントリアセットが Amazon DataZone カタログに公開されます。直接公開すると、アセットにビジネスメタデータがない可能性があり、すべてのドメインユーザーが直接検出できるようになります。この設定は、データポータルまたは Amazon DataZone API を使用して、データソースに使用できます。
Amazon DataZone サブスクリプションおよびフルフィルメントワークフローとは
アセットが Amazon DataZone カタログに公開されると、ドメインユーザーはこれらのアセットを検出し、これらのアセットへのアクセスをリクエストして取得し、引き続き Amazon DataZone を使用してこれらのアセットを管理、共有、分析できます。
ユーザーは、プロジェクトの代わりにそのアセットをサブスクライブすることで、アセットへのアクセスをリクエストします。サブスクリプションリクエストが作成されると、アセットの所有者は通知を受け取り、サブスクリプションリクエストを確認して、承認するか拒否するかを決定できます。サブスクリプションリクエストがデータ所有者によって承認された場合、サブスクライブしているプロジェクトにはそのアセットへのアクセス権が付与されます。
サブスクリプションリクエストが承認されると、Amazon DataZone はサブスクリプションフルフィルメントワークフローを開始し、AWS Lake Formation または Amazon Redshift に必要なグラントを作成して、プロジェクト内のすべての該当する環境にアセットを自動的に追加します。これにより、サブスクライブしているプロジェクトメンバーは、環境内のクエリツール (Amazon Athena または Amazon Redshift クエリエディタ) のいずれかを使用してアセットをクエリできます。
Amazon DataZone は、マネージドアセット (AWS Glue テーブルと Amazon Redshift テーブルおよびビューを含む) に対してのみ、この自動フルフィルメントロジックをトリガーできます。他のすべてのアセットタイプ (アンマネージドアセット) では、Amazon DataZone は自動的にフルフィルメントをトリガーすることはできません。代わりに、イベントペイロードに必要なすべての詳細を含むイベントを Amazon Eventbridge に公開し、Amazon DataZone の外部で必要なグラントを作成できるようにします。Amazon DataZone には、サブスクリプションが Amazon DataZone の外部で満たされるとそのステータスを更新できる updateSubscriptionStatus
API も用意されており、Amazon DataZone はプロジェクトメンバーにアセットの消費を開始できることを通知できます。
Amazon DataZone のユーザーペルソナ
主な Amazon DataZone ユーザーペルソナは次のとおりです。
-
Amazon DataZone を組織の分析プラットフォームとして設定するドメイン管理者。
Amazon DataZone のコンテキストでは、ドメイン管理者は Amazon DataZone を AWS アカウントにインストールし、Amazon DataZone ドメインを作成し、Amazon DataZone ドメインとの、AWS アカウントの関連付けおよび ID プロバイダーの関連付けを設定します。ドメイン管理者は、AWS Organization や Service Catalog などの他 AWS サービスコンソールを使用して Amazon DataZone を設定します。
-
Amazon DataZone (アセットパブリッシャーとサブスクライバー) の主要なユーザーであるデータユーザーは、分析タスクと機械学習タスクを行います。
データユーザーには、データアセットを生成および消費するデータ分析ワーカー、データサイエンティスト、システムユーザーが含まれます。Amazon DataZone のコンテキストでは、データユーザーはプロジェクトと環境を作成および参加し、事前設定された分析ツールや機械学習ツールを使用してデータアセットをサブスクライブおよび消費し、出力データアセットを Amazon DataZone ドメインカタログに公開して他のユーザーと共有します。
-
カスタムインフラストラクチャテンプレートを構築し、Amazon DataZone を内部カタログまたは本番システムと統合するシステムデベロッパー。
Amazon DataZone のコンテキストでは、システムデベロッパーは、環境ブループリント (インフラストラクチャテンプレート) または環境プロバイダーとしての Infrastructure-As-Code CI/CD パイプライン、環境間でデータアセットを昇格させるデータパイプライン、内部カタログと統合するためのカタログ同期およびサブスクリプショングラントフルフィルメントアダプター、または必要に応じて Amazon DataZone API と内部ユーザーインターフェイスまたは本番システム間の統合を構築します。
-
組織のセキュリティ、プライバシー、その他のコンプライアンスポリシーの定義とリスクを認め、これらの定義に従って組織内で Amazon DataZone が使用されていることを確認するデータガバナンス責任者。
Amazon DataZone の用語
- ドメイン
-
Amazon DataZone ドメインは、アセット、ユーザー、およびプロジェクトを関連付けて整理するエンティティです。Amazon DataZone ドメインを使用すると、エンタープライズ用に単一の Amazon DataZone ドメインを作成する場合でも、異なるビジネスユニットやチーム用に複数の Amazon DataZone ドメインを作成する場合でも、組織構造のデータと分析ニーズを柔軟に反映できます。
- ドメインユニット
-
ドメインユニットを使用すると、アセットやその他のドメインエンティティを特定のビジネスユニットやチームに下で簡単に整理できます。組織のビジネスユニット内およびビジネスユニット間で安全で効率的なデータ共有を設定するには、Amazon DataZone 内にドメインユニットを作成し、各ビジネスユニット内の選択したユーザーがログインしてアセットをカタログに共有できるようにします。ドメインユニットを使用して、AWS アカウント所有者などのリソース所有者がリソースに Amazon DataZone 認可権限を設定することもできます。ドメインユニットは、アカウント所有者から委任された権限をドメインユニットの所有者に提供します。また、アカウント所有者の代わりに、(ブループリント設定を使用して作成される) 環境プロファイルに許可権限を設定できます。詳細については、「Amazon のドメインユニットと認可ポリシー DataZone」を参照してください。
- 認可ポリシー
-
Amazon DataZone 認可ポリシーは、プロジェクト、ブループリント、環境、用語集、メタデータフォームなどのエンティティに適用される Amazon DataZone 内の一連のコントロールです。これらのポリシーで、Amazon DataZone ポータルでこれらのエンティティを作成し、そのライフサイクルを管理できるユーザーを定義します。
Amazon DataZone ドメインユニット内で、次の認可ポリシーをユーザーとグループに割り当てると、ユーザーに特定のアクセス許可を付与できます。
-
ドメインユニット作成ポリシー
-
プロジェクト作成ポリシー
-
プロジェクトメンバーシップポリシー
-
ドメインユニット所有権引き受けポリシー
-
プロジェクト所有権引き受けポリシー
詳細については、「Amazon DataZone ドメインユニット内のユーザーとグループに承認ポリシーを割り当てる」を参照してください。
Amazon DataZone ドメインユニット内で次の認可ポリシーをプロジェクトに割り当てると、特定のアクセス許可を付与できます。
-
用語集作成ポリシー
-
メタデータフォーム作成ポリシー
-
カスタムアセットタイプ作成ポリシー
詳細については、「Amazon DataZone ドメインユニット内のプロジェクトに認可ポリシーを割り当てる」を参照してください。
特定のブループリント設定内で、プロジェクトとドメインユニットの所有者に次の認可ポリシーを割り当てることができます。
-
このブループリントを使用して環境プロファイルを作成する - このポリシーは Amazon DataZone プロジェクトに割り当てることができ、このブループリントを使用して環境プロファイルを作成することをプロジェクトに許可します。
-
このブループリントを使用して環境プロファイルを作成するアクセス許可を付与する - このポリシーはドメインユニットの所有者に割り当てることができ、このブループリントを使用して環境プロファイルを作成するアクセス許可をプロジェクトに付与することを所有者に許可します。
詳細については、「Amazon DataZone ブループリント設定内で認可ポリシーを割り当てる」を参照してください。
-
- アカウントの関連付け
-
AWS アカウントを Amazon DataZone ドメインに関連付けると、これらの AWS アカウントのデータを Amazon DataZone カタログに公開し、Amazon DataZone プロジェクトを作成して、複数の AWS アカウントでデータを操作することができます。アカウント関連付けリクエストは、Amazon DataZone ドメインを所有する AWS アカウントでのみ開始できます。アカウント関連付けリクエストは、招待された AWS アカウントの管理者ユーザーのみが承認できます。AWS アカウントを Amazon DataZone ドメインに関連付けると、このアカウントの AWS Glue カタログや Amazon Redshift などのデータソースをこのドメインに登録できます。関連付けると、AWS アカウントは Amazon DataZone プロジェクトと環境を作成することもできます。
AWS アカウント は、1 つ以上の Amazon DataZone ドメインに関連付けることができます。
- データソース
-
Amazon DataZone では、データソースを使用して、アセット (データ) の技術メタデータを、ソースデータベースまたはデータウェアハウスから Amazon DataZone にインポートできます。Amazon DataZone の現在のリリースでは、AWS Glue と Amazon Redshift のデータソースを作成して実行できます。データソースを作成することで、Amazon DataZone とソース (AWS Glue Data Catalog または Amazon Redshift Warehouse) 間の接続を確立し、テーブル名、列名、データ型などの技術的なメタデータを読み取ることができます。データソースを作成することで、Amazon DataZone で新しいアセットを作成または既存のアセットを更新する最初のデータソース実行も開始します。データソースの作成中や、データソースが正常に作成された後に、データソースの実行のスケジュールを指定するオプションもあります。
- データソースの実行
-
Amazon DataZone では、データソースの実行は、プロジェクトインベントリにアセットを作成するために、また、オプションでプロジェクトインベントリアセットを Amazon DataZone カタログに公開するために、Amazon DataZone が実行するタスクです。データソースの実行は、自動化 (データソースが最初に作成されたときに開始) することも、スケジュールしたり、手動にすることもできます。データ選択基準を使用すると、既存のデータセットと今後のデータセットをファインチューニングして、プロジェクトインベントリまたは Amazon DataZone カタログに取り込むことができ、それらのインベントリまたはカタログアセットへのメタデータの更新頻度も調整できます。
- サブスクリプションターゲット
-
Amazon DataZone でサブスクリプションターゲットを使用すると、プロジェクトでサブスクライブしているデータにアクセスできます。サブスクリプションターゲットは、Amazon DataZone がソースデータとの接続を確立し、Amazon DataZone プロジェクトのメンバーが既にサブスクライブしているデータのクエリを開始できるように必要な許可を作成するために使用できる、場所 (データベースやスキーマなど) および必要なアクセス許可 (IAM ロールなど) を指定します。
- サブスクリプションリクエスト
-
Amazon DataZone では、サブスクリプションリクエストは、特定のアセットへのアクセスを許可するために Amazon DataZone プロジェクトが従う必要があるプロセスです。サブスクリプションリクエストは、承認、拒否、取り消し、または付与できます。
- アセット
-
Amazon DataZone では、アセットは、単一の物理データオブジェクト (テーブル、ダッシュボード、ファイルなど) または仮想データオブジェクト (ビューなど) を表示するエンティティです。
- アセットタイプ
-
アセットタイプで、アセットを Amazon DataZone カタログで表す方法を定義します。アセットタイプで、特定のタイプのアセットのスキーマを定義します。アセットを作成すると、アセットタイプ (デフォルトでは最新バージョン) で定義されたスキーマに対して検証されます。アセットが更新されると、Amazon DataZone は新しいアセットバージョンを作成し、Amazon DataZone ユーザーがすべてのアセットバージョンで操作できるようにします。
- ビジネス用語集
-
Amazon DataZone では、ビジネス用語集は、アセットに関連付けられる可能性のあるビジネス用語のコレクションです。ビジネス用語集は、さまざまなデータ分析タスクを通じて組織全体で同じ用語と定義が使用されるようにするのに役立ちます。
ビジネス用語集の用語をアセットと列に追加して、検索中にそれらの属性の ID を分類したり強化したりできます。用語集は、アセットに関連付けられているメタデータ形式のフィールドの値タイプとして選択できます。アセットのメタデータフォームフィールドの値として特定の用語を選択すると、ユーザーはビジネス用語集の用語を検索し、関連付けられているアセットを見つけることができます。
- メタデータフォームタイプ
-
メタデータフォームタイプは、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインで公開されたときに収集して保存されるメタデータを定義するテンプレートです。メタデータフォームタイプは、データアセットに関連付けることができます。メタデータフォームタイプは、ドメイン管理者がコンプライアンス情報、規制情報、分類など、そのドメインに必要なメタデータフォームを定義するのに役立ちます。これにより、ドメイン管理者はアセットの追加のメタデータをカスタマイズできます。Amazon DataZone には、asset-common-details-form-type、column-business-metadata-form-type、glue-table-form-type, glue-view-form-type、redshift-table-form-type、redshift-view-form-type、s3-object-collection-form-type、subscription-terms-form-type、suggestion-form-type などのシステムメタデータフォームタイプがあります。
- メタデータフォーム
-
Amazon DataZone では、メタデータフォームで、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインに公開されたときに収集して保存されるメタデータを定義します。メタデータフォーム定義は、ドメイン管理者がカタログドメインに作成します。メタデータフォーム定義は 1 つ以上のフィールド定義で構成され、ブール値、日付、10 進数、整数、文字列、ビジネス用語集のフィールド値データ型をサポートしています。
ドメイン管理者は、メタデータフォームをドメインに追加して、ドメイン内のアセットにメタデータフォームを適用します。次に、アセットパブリッシャーは、メタデータフォームの任意フィールドと必須フィールドの値を提供します。
- プロジェクト
-
Amazon DataZone では、プロジェクトを利用して、ユーザーグループはさまざまなビジネスユースケースでコラボレーションできます。これには、プロジェクトインベントリにアセットを作成してすべてのプロジェクトメンバーがアセットを検出できるようにし、その後、Amazon DataZone カタログでのアセットの公開、検出、サブスクライブ、消費を行うことなどがあります。プロジェクトメンバーは、Amazon DataZone カタログのアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトメンバーは、所有者、コントロビューター、コンシューマー、スチュワード、ビューワーです。
プロジェクトの作成/削除
プロジェクトプロファイルの作成/削除 環境プロファイルの作成/削除 環境の作成/削除 プロジェクトへのメンバーの追加/削除 検索と検出 メタデータフォーム/用語集の作成/削除 データソース作成の実行とデータの取り込み データの公開 サブスクリプションのリクエスト サブスクリプションリクエストの承認/拒否 Amazon Athena と Amazon Redshift からのサブスクライブされたデータの読み取り 所有者 ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される はい はい はい はい はい はい はい はい コントロビューター ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ はい はい はい はい はい はい はい コンシューマー ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
いいえ
いいえ
いいえ
はい
いいえ
はい
ビューワー ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
いいえ
いいえ
いいえ
いいえ
いいえ
はい
スチュワード ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される ドメイン単位メンバーによって管理される いいえ
はい
はい
はい
はい
いいえ
はい
はい
プロジェクト所有者は、所有者またはコントロビューターとして他のユーザーを追加または削除でき、プロジェクトを変更または削除できます。コントロビューターに対するその他の制限は、ポリシーで定義できます。プロジェクトを作成したユーザーが、そのプロジェクトの最初の所有者になります。
- 環境
-
環境は、設定されたリソース (Amazon S3 バケット、AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションであり、それらのリソースで操作できる特定の IAM プリンシパル (コントロビューターアクセス許可が割り当てられている) のセットがあります。各環境には、サブスクリプションとフルフィルメントを介してリソースにアクセスし、データへのアクセスを取得する権限があるユーザープリンシパルが含まれる場合もあります。環境は、実用的なリンクを AWS サービス、外部 IDE、コンソールに保存するように設計されています。プロジェクトのメンバーは、環境内で設定されているディープリンクを使用して、Amazon Athena コンソールなどのサービスにアクセスできます。プロジェクトの SSO ユーザーと IAM ユーザーについては、特定の環境を使用したり特定の環境にアクセスしたりできるよう、さらに範囲を絞り込むことができます。
- 環境プロファイル
-
Amazon DataZone の環境プロファイルとは、環境の作成に使用できるテンプレートです。環境プロファイルは、ブループリントを使用して作成されます。
環境プロファイルを使用すると、ドメイン管理者は事前に設定されたパラメータでブループリントをラップでき、データワーカーは既存の環境プロファイルを選択し、新しい環境の名前を指定することで、新しい環境を必要なだけすばやく作成できます。これにより、データワーカーは、ドメイン管理者が適用したデータガバナンスポリシーを確実に満たすと同時に、プロジェクトと環境を効率的に管理できます。
- ブループリント
-
環境の作成に使用するブループリントで、 Amazon DataZone カタログのアセットを操作するときに使用できる、環境が属するプロジェクト AWS ツールやサービス (AWS Glue や Amazon Redshift など) のメンバーを定義します。
Amazon DataZone の現在のリリースでは、以下のデフォルトのブループリントがサポートされています。
-
データレイクのブループリント
-
データウェアハウスのブループリント
-
Amazon Sagemaker ブループリント
-
- ユーザープロファイル
-
ユーザープロファイルは Amazon DataZone ユーザーを表します。Amazon DataZone は、さまざまな目的で Amazon DataZone マネジメントコンソールとデータポータルを操作するための IAM ロールと SSO ID の両方をサポートしています。ドメイン管理者は、IAM ロールを使用して、新しい Amazon DataZone ドメインの作成、メタデータフォームタイプの設定、ポリシーの実装など、Amazon DataZone マネジメントコンソールで初期管理ドメイン関連の作業を実行します。データワーカーは、アイデンティティセンター経由で SSO コーポレートアイデンティティを使用して Amazon DataZone Data Portal にログインし、メンバーシップがあるプロジェクトにアクセスします。
- グループプロファイル
-
グループプロファイルは、Amazon DataZone ユーザーのグループを表します。グループは手動で作成することも、エンタープライズ顧客の Active Directory グループにマッピングすることもできます。Amazon DataZone では、グループは 2 つの目的を果たします。まず、グループは、組織図のユーザーのチームにマッピングできるため、新しい従業員がチームに参加したり、チームから退出したりするときに、Amazon DataZone プロジェクト所有者の管理作業を減らすことができます。次に、会社の管理者は、Active Directory グループを使用してユーザーステータスを管理および更新するため、Amazon DataZone ドメイン管理者はこれらのグループメンバーシップを使用して Amazon DataZone ドメインポリシーを実装できます。
- ドメイン管理者
-
Amazon DataZone では、Amazon DataZone ドメインを作成する IAM プリンシパルが、そのドメインのデフォルトのドメイン管理者です。Amazon DataZone のドメイン管理者は、ドメインの作成、他のドメイン管理者の割り当て、データソースとサブスクリプションターゲットの追加、プロジェクトと環境の作成、プロジェクト所有者の割り当てなど、ドメインの主要な機能を実行します。
- パブリッシャー
-
Amazon DataZone では、パブリッシャーは Amazon DataZone カタログにアセットを公開し、公開するアセットのメタデータを編集できます。この権限が付与された場合、パブリッシャーは、Amazon DataZone カタログに公開したアセットへのサブスクリプションリクエストを承認または拒否できます。
- サブスクライバー
-
Amazon DataZone では、サブスクライバーは Amazon DataZone カタログ内のアセットを検索、アクセス、消費する Amazon DataZone プロジェクトです。
- AWS アカウント所有者
-
Amazon DataZone では、AWS アカウント所有者は、ロール、ポリシー、アクセス許可を AWS アカウントに作成し、これらの AWS アカウントを Amazon DataZone ドメインに関連付けることができます。