翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon DataZone の用語と概念
Amazon DataZone は、 、オンプレミス、およびサードパーティーソースに格納されているデータのカタログ化、検出 AWS、共有、管理を迅速かつ簡単に行うことができるデータ管理サービスです。Amazon を使用すると DataZone、組織のデータアセットを監督する管理者とデータスチュワードは、きめ細かなコントロールを使用してデータへのアクセスを管理および制御できます。これらのコントロールは、適切なレベルの権限とコンテキストによるアクセスを保証するように設計されています。Amazon DataZone を使用すると、エンジニア、データサイエンティスト、製品マネージャー、アナリスト、ビジネスユーザーが組織全体のデータにアクセスしやすくなり、データ駆動型のインサイトを発見、使用、コラボレーションできるようになります。
Amazon の使用を開始する際には DataZone、その主要な概念、用語、コンポーネントを理解しておくことが重要です。
トピック
Amazon DataZone コンポーネント
Amazon DataZone には、次の 4 つの主要コンポーネントが含まれています。
-
ビジネスデータカタログ - このコンポーネントを使用して、ビジネスコンテキストを使用して組織全体のデータをカタログ化できるため、組織内のすべてのユーザーがデータをすばやく見つけて理解できます。
-
ワークフローの公開とサブスクライブ - これらの自動ワークフローを使用して、プロデューサーとコンシューマー間のデータをセルフサービス方式で保護し、組織内のすべてのユーザーが適切な目的のために適切なデータにアクセスできるようにすることができます。
-
プロジェクトと環境
-
Amazon DataZone プロジェクトでは、人、アセット (データ)、およびツールのビジネスユースケースベースのグループ化を使用して、 AWS 分析へのアクセスを簡素化します。プロジェクトは、プロジェクトメンバーがコラボレーション、データ交換、アセットの共有ができる領域を提供します。デフォルトでは、プロジェクトは、プロジェクトに明示的に追加されたユーザーのみが、そのプロジェクト内のデータと分析ツールにアクセスできるように設定されています。プロジェクトは、データコンシューマーがアクセスするためのプロジェクトポリシーに従って、生成されたアセットの所有権を管理します。
-
Amazon DataZone プロジェクト内では、環境は、特定のIAMプリンシパルのセット (寄稿者アクセス許可を持つユーザーなど) が操作できる、設定済みのリソース (Amazon S3 バケット、 AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションです。
-
-
データポータル ( AWS マネジメントコンソール外) - これはブラウザベースのウェブアプリケーションであり、さまざまなユーザーがセルフサービス方式でデータをカタログ化、検出、管理、共有、分析できます。データポータルは、 を通じて ID プロバイダーからのIAM認証情報または既存の認証情報を使用してユーザーを認証します AWS IAM Identity Center。
Amazon DataZone ドメインとは
Amazon DataZone ドメインを使用して、アセット、ユーザー、およびプロジェクトを整理できます。追加の AWS アカウントを Amazon DataZone ドメインに関連付けることで、データソースをまとめることができます。その後、メタデータの完全性と品質を向上させるメタデータフォームと用語集を使用して、これらのデータソースからドメインのカタログにアセットを発行できます。これらのアセットを検索して参照し、ドメインで公開されているデータを確認することもできます。さらに、プロジェクトに参加して他のユーザーとコラボレーションしたり、アセットをサブスクライブしたり、プロジェクト環境を使用して Amazon Athena や Amazon Redshift などの分析ツールにアクセスしたりできます。Amazon DataZone ドメインを使用すると、エンタープライズ用に単一の Amazon DataZone ドメインを作成する場合も、異なるビジネスユニット用に複数の Amazon DataZone ドメインを作成する場合も、組織構造のデータと分析のニーズを柔軟に反映できます。
Amazon DataZone のプロジェクトと環境とは
Amazon DataZone を使用すると、チームや分析ユーザーは、チーム、ツール、データのユースケースベースのグループを作成して、プロジェクトでコラボレーションできます。
-
Amazon では DataZone、プロジェクトにより、ユーザーのグループが Amazon DataZone カタログ内のデータの公開、検出、サブスクライブ、消費を含むさまざまなビジネスユースケースでコラボレーションできます。プロジェクトメンバーは、Amazon DataZone カタログからアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトは、データポータル内で次のアクティビティをサポートします。
-
プロジェクト所有者は、所有者、寄稿者、コンシューマー、スチュワード、視聴者のアクセス許可を持つメンバーを追加できます
-
プロジェクトメンバーは、SSOユーザー、SSOグループ、およびIAMユーザーです。
-
プロジェクトメンバーは、データカタログ内のアセットへのサブスクリプションをリクエストできます
サブスクリプションの承認がプロジェクトに提供される
プロジェクトの作成/削除
プロジェクトプロファイルの作成/削除 環境プロファイルの作成/削除 環境の作成/削除 プロジェクトへのメンバーの追加/削除 検索と検出 Create/delete metadata forms/glossaries データソースの実行とデータの取り込みを作成する データを発行する サブスクリプションをリクエストする サブスクリプションリクエストの承認/拒否 Amazon Athena と Amazon Redshift からサブスクライブされたデータの読み取り [所有者] ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される あり はい はい はい はい はい はい 可能 寄稿者 ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可 はい はい はい はい はい はい 可能 コンシューマー ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
いいえ
いいえ
いいえ
はい
いいえ
可能
表示者 ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
いいえ
いいえ
いいえ
いいえ
いいえ
可能
スチュワード ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
はい
はい
はい
いいえ
はい
可能
-
-
Amazon DataZone プロジェクトでは、環境は、0 つ以上の設定済みリソース (Amazon S3、 AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションであり、それらのリソースで操作できる特定のプリンIAMシパルのセットが含まれます。環境は、環境を作成するための再利用可能なテンプレートを提供する事前設定されたリソースと設計図のセットである環境プロファイルを使用して作成されます。環境プロファイルは、環境がデプロイされる AWS アカウント やリージョンなどの設定を定義します。
Amazon DataZone ブループリントとは
環境が作成される設計図は、環境が属するプロジェクトのどの AWS ツールやサービス ( AWS Glue Amazon Redshift など) メンバーが Amazon DataZone カタログのアセットを操作するときに使用できるかを定義します。
Amazon の現在のリリースでは DataZone、次のデフォルトの設計図がサポートされています。
設計図名 | 説明 | 作成されたリソース |
---|---|---|
Data Lake の設計図 |
Amazon DataZone プロジェクトメンバーが環境内で Data Lake プロデューサーとコンシューマーサービスを起動できるようにします。 コンシューマー として、Amazon DataZone プロジェクトメンバーはAmazon Athena およびその他の Lake Formation がサポートするクエリエンジンで Lake Formation が管理するアセットの「読み取り専用」コピーに直接アクセスできます。 プロデューサー として、Amazon DataZone プロジェクトメンバーは Amazon Athena を使用して新しい LakeFormationマネージドテーブルを作成し、Amazon DataZone カタログに発行できます。 |
Amazon Athena を使用して Lake Formation テーブルを作成およびクエリする機能をユーザーに提供します。Amazon Athena ワークグループ、「読み取り専用」の Lake Formation アクセス許可を持つ AWS Glue データベース、「読み取り専用」のIAMアクセス許可を持つデータベース、およびプロジェクトによって管理される Amazon S3 へのアクセス。「作成」および「付与」の Lake Formation アクセス許可、「読み取り」および「書き込み」のIAMアクセス許可を持つ AWS Glue データベース、 AWS Glue ETLタグ付けによる (抽出、変換、ロード)。 |
データウェアハウスの設計図 |
コンシューマー として、この設計図により、Amazon DataZone プロジェクトメンバーは独自の Amazon Redshift クラスターに接続してリモートデータストアをクエリし、新しいデータセットを作成および保存できます。 プロデューサー として、この設計図により、Amazon DataZone プロジェクトメンバーは独自の Amazon Redshift クラスターに接続してリモートデータストアをクエリし、新しいデータセットを作成し、Amazon DataZone カタログに発行できます。 |
Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターにローカルアセットを作成する機能。Amazon Redshift クエリエディタへのアクセス、Amazon DataZone カタログからサブスクライブされたデータソースへの「読み取り」アクセス、設定された Amazon Redshift クラスターからアセットを作成および発行する機能。 |
Amazon Sagemaker の設計図 |
この設計図は、データプロデューサーとコンシューマーが Amazon にシームレスに切り替え SageMaker て、データおよび ML アセットへのアクセスガバナンスを適用しながら、機械学習 (ML) プロジェクトでコラボレーションするのに役立ちます。Amazon DataZone と Amazon の新しい組み込み統合により SageMaker、データコンシューマーとプロデューサーはインフラストラクチャのセットアップ全体の ML ガバナンスを合理化し、ビジネスイニシアチブでコラボレーションし、データと ML アセットを簡単に管理できます。 |
Amazon でデータおよび ML アセットを検索、サブスクライブ、公開できる Amazon SageMaker ドメインを作成できます DataZone。また、設定に従って AWS Glue データベースとレイクフォーメーションをサブスクライブして公開することもできます。 |
Amazon DataZone インベントリとパブリッシュワークフローとは
プロジェクトインベントリアセットの作成
Amazon を使用してデータを DataZone カタログ化するには、まず Amazon でプロジェクトのインベントリとしてデータ (アセット) を持参する必要があります DataZone。プロジェクトのインベントリを作成すると、そのプロジェクトのメンバーのみがアセットを検出できるようになります。プロジェクトインベントリアセットは、明示的に公開されていない限り、検索/ブラウズのすべてのドメインユーザーが利用できるわけではありません。Amazon の現在のリリースでは DataZone、次の方法でプロジェクトインベントリにアセットを追加できます。
-
データポータルまたは Amazon を使用してデータソースを作成して実行します DataZone APIs。Amazon の現在のリリースでは DataZone、 AWS Glue と Amazon Redshift のデータソースを作成して実行できます。 AWS Glue または Amazon Redshift データソースを作成して実行することで、選択したプロジェクトインベントリにアセットを作成し、そのテクニカルメタデータをソースデータベーステーブルまたはデータウェアハウスからインベントリとして Amazon にインポートします DataZone。
-
を使用してAPIs、使用可能なシステムアセットタイプ (AWS Glue、Amazon Redshift、Amazon S3 オブジェクト) またはカスタムアセットタイプからアセットを作成できます。
-
Amazon を使用して、プロジェクトインベントリにカスタムアセットタイプを作成します DataZone APIs。カスタムアセットタイプには、ML モデル、ダッシュボード、オンプレミステーブルなどが含まれます。
-
Amazon を使用して、これらのカスタムアセットタイプからアセットを作成します DataZone APIs。
-
-
Amazon DataZone データポータルを使用して S3 オブジェクトのアセットを手動で作成します。
プロジェクトインベントリアセットのキュレート - プロジェクトインベントリを作成した後、データ所有者は、ビジネス名 (アセットとスキーマ)、説明 (アセットとスキーマ)、リードミー、用語集用語 (アセットとスキーマ)、メタデータフォームを追加または更新することで、必要なビジネスメタデータを使用してインベントリアセットをキュレートできます。これは、データポータルまたは Amazon を使用して行うことができます DataZone APIs。アセットを編集するたびに、新しいインベントリバージョンが作成されます。
Amazon DataZoneカタログへのプロジェクトインベントリアセットの発行
Amazon を使用してデータをカタログ DataZone 化する次のステップは、プロジェクトのインベントリアセットをドメインユーザーが検出できるようにすることです。これを行うには、インベントリアセットを Amazon DataZone カタログに発行します。インベントリアセットの最新バージョンのみをカタログに発行でき、最新の公開バージョンのみが検出カタログでアクティブになります。インベントリアセットが Amazon DataZone カタログに公開された後に更新される場合は、最新バージョンが検出カタログに含まれるように、インベントリアセットを明示的に再公開する必要があります。Amazon の現在のリリースでは DataZone、次の方法でプロジェクトインベントリアセットを Amazon DataZone カタログに発行できます。
-
データポータルまたは Amazon を使用して、プロジェクトインベントリアセットを Amazon DataZone カタログに手動で発行します DataZone APIs。
-
データソースの作成または編集の一環として、オプションの AWS Glue アセットをカタログに発行するか、Amazon Redshift アセットをカタログ設定に発行して、スケジュールされたデータソースまたは自動データソースの実行中に使用します。この設定を有効にすると、データソースの実行によってプロジェクトのインベントリにアセットが追加され、インベントリアセットも Amazon DataZone カタログに発行されます。直接公開すると、アセットにビジネスメタデータがない可能性があり、すべてのドメインユーザーが直接検出できるようになります。この設定は、データポータルまたは Amazon を使用してデータソースで使用できます DataZone APIs。
Amazon DataZone サブスクリプションおよびフルフィルメントワークフローとは
アセットが Amazon DataZone カタログに公開されると、ドメインユーザーはこれらのアセットを検出し、リクエストしてアクセスし、引き続き Amazon を使用してこれらのアセット DataZone を管理、共有、分析できます。
ユーザーは、プロジェクトに代わってそのアセットにサブスクライブすることで、アセットへのアクセスをリクエストします。サブスクリプションリクエストが作成されると、アセットの所有者は通知を受け取り、サブスクリプションリクエストを確認して、承認または拒否するかどうかを決定できます。サブスクリプションリクエストがデータ所有者によって承認された場合、サブスクライブプロジェクトにはそのアセットへのアクセス権が付与されます。
サブスクリプションリクエストが承認されると、Amazon はサブスクリプションフルフィルメントワークフロー DataZone を開始し、 AWS Lake Formation または Amazon Redshift で必要な許可を作成して、プロジェクト内のすべての該当する環境にアセットを自動的に追加します。これにより、サブスクライブしているプロジェクトメンバーは、環境内のクエリツール (Amazon Athena または Amazon Redshift クエリエディタ) のいずれかを使用してアセットをクエリできます。
Amazon は、マネージドアセット ( AWS Glue テーブルと Amazon Redshift テーブルとビューを含む) に対してのみ、この自動フルフィルメントロジックをトリガー DataZone できます。他のすべてのアセットタイプ (アンマネージドアセット) の場合、Amazon DataZone はフルフィルメントを自動的にトリガーすることはできませんが、代わりにイベントペイロードに必要なすべての詳細を含むイベントを Amazon Eventbridge に発行し、Amazon の外部で必要な許可を作成できるようにします DataZone。Amazon では、サブスクリプションが Amazon の外部で満たされると、サブスクリプションのステータスupdateSubscriptionStatus
APIを更新 DataZone して、Amazon がアセットの使用を開始できることをプロジェクトメンバーに通知 DataZone できるようにする DataZone も提供しています。
Amazon のユーザーペルソナ DataZone
Amazon DataZone ユーザーの主なペルソナを次に示します。
-
Amazon を組織の分析プラットフォーム DataZone として設定するドメイン管理者。
Amazon のコンテキストでは DataZone、ドメイン管理者は Amazon DataZone を AWS アカウントにインストールし、Amazon DataZone ドメインを作成し、 AWS アカウント関連付けと ID プロバイダーの Amazon DataZone ドメインとの関連付けを設定します。ドメイン管理者は、 AWS Organization や AWS Service Catalog などの他のサービスコンソールを使用して Amazon を設定します DataZone。
-
分析タスクと機械学習タスクの Amazon DataZone (アセットパブリッシャーとサブスクライバー) の主なユーザーであるデータユーザー。
データユーザーには、データアセットを生成および使用するデータ分析ワーカー、データサイエンティスト、システムユーザーが含まれます。Amazon のコンテキストでは DataZone、データユーザーはプロジェクトと環境を作成および参加し、事前設定された分析または機械学習ツールを使用してデータアセットをサブスクライブおよび消費し、出力データアセットを Amazon DataZone ドメインカタログに発行して他のユーザーと共有します。
-
カスタムインフラストラクチャテンプレートを構築し、Amazon DataZone を内部カタログまたは本番システムと統合するシステムデベロッパー。
Amazon のコンテキストでは DataZone、システムデベロッパーは環境設計図 (インフラストラクチャテンプレート) または Infrastructure-As-Code CI/CD パイプラインを環境プロバイダーとして構築し、データパイプラインを環境間でデータアセットを昇格させ、カタログ同期とサブスクリプショングラントフルフィルメントアダプターを内部カタログと統合し、必要に応じて Amazon DataZone APIsと内部ユーザーインターフェイスまたは本番システムの統合を行います。
-
組織のセキュリティ、プライバシー、その他のコンプライアンスポリシーの定義とリスクを所有し、組織 DataZone 内での Amazon の使用がこれらの定義に準拠していることを確認するデータガバナンスオフィサー。
Amazon DataZone の用語
- [ドメイン]
-
Amazon DataZone ドメインは、アセット、ユーザー、およびそれらのプロジェクトを連結するための組織エンティティです。Amazon DataZone ドメインを使用すると、エンタープライズ用の単一の Amazon DataZone ドメインを作成する場合でも、複数のデータゾーンを作成する場合でも、組織構造のデータと分析のニーズを柔軟に反映できます。また、異なるビジネスユニットやチームのドメインも柔軟に反映できます。
- ドメイン単位
-
ドメインユニットを使用すると、アセットやその他のドメインエンティティを特定のビジネスユニットやチームで簡単に整理できます。組織のビジネスユニット内およびビジネスユニット間で安全で効率的なデータ共有を設定するには、Amazon 内にドメインユニットを作成し DataZone 、各ビジネスユニット内の選択したユーザーがアセットをカタログにログインして共有できるようにします。ドメインユニットを使用して、 AWS アカウント所有者などのリソース所有者がリソースに Amazon DataZone 認証アクセス許可を設定することもできます。ドメインユニットは、アカウント所有者からドメインユニットの所有者に委任された権限を提供し、アカウント所有者に代わって環境プロファイル (設計図設定を使用して作成) に認証アクセス許可を設定できます。詳細については、「Amazon のドメインユニットと承認ポリシー DataZone」を参照してください。
- 認証ポリシー
-
Amazon DataZone 認証ポリシーは、プロジェクト、設計図、環境、用語集、メタデータフォームなどのエンティティ DataZone に適用される Amazon 内の一連のコントロールです。これらのポリシーは、Amazon DataZone ポータルでこれらのエンティティを作成し、そのライフサイクルを管理できるユーザーを定義します。
Amazon DataZone ドメインユニット内で、次の承認ポリシーをユーザーとグループに割り当てて、ユーザーに特定のアクセス許可を付与できます。
-
ドメインユニット作成ポリシー
-
プロジェクト作成ポリシー
-
プロジェクトメンバーシップポリシー
-
ドメインユニットの所有権の前提条件ポリシー
-
プロジェクトの所有権の前提条件ポリシー
詳細については、「Amazon DataZone ドメインユニット内のユーザーとグループに承認ポリシーを割り当てる」を参照してください。
Amazon DataZone ドメインユニット内で、次の承認ポリシーをプロジェクトに割り当てて、特定のアクセス許可を付与できます。
-
用語集作成ポリシー
-
メタデータフォーム作成ポリシー
-
カスタムアセットタイプ作成ポリシー
詳細については、「Amazon DataZone ドメインユニット内のプロジェクトに承認ポリシーを割り当てる」を参照してください。
特定の設計図設定内で、プロジェクトとドメインユニットの所有者に次の承認ポリシーを割り当てることができます。
-
この設計図を使用して環境プロファイルを作成する - このポリシーは Amazon DataZone プロジェクトに割り当てることができ、この設計図を使用して環境プロファイルを作成することを承認します。
-
このブループリントを使用して環境プロファイルを作成するアクセス許可を付与する - このポリシーはドメインユニットの所有者に割り当てることができ、このブループリントを使用して環境プロファイルを作成するためのアクセス許可をプロジェクトに付与することを許可します。
詳細については、「Amazon DataZone ブループリント設定内で承認ポリシーを割り当てる」を参照してください。
-
- 関連付けられたアカウント
-
AWS アカウントを Amazon DataZone ドメインに関連付けると、これらの AWS アカウントのデータを Amazon DataZone カタログに発行し、Amazon DataZone プロジェクトを作成して、複数の AWS アカウントでデータを操作することができます。アカウント関連付けリクエストは、Amazon DataZone ドメインを所有する AWS アカウントでのみ開始できます。アカウント関連付けリクエストは、招待された AWS アカウントの管理者ユーザーのみが承諾できます。 AWS アカウントが Amazon DataZone ドメインに関連付けられていると、このアカウントの AWS Glue カタログや Amazon Redshift などのデータソースをこのドメインに登録できます。関連付けることで、 AWS アカウントは Amazon DataZone プロジェクトと環境を作成することもできます。
は、1 つ以上の Amazon DataZone ドメインに関連付ける AWS アカウント ことができます。
- データソース
-
Amazon では DataZone、データソースを使用して、ソースデータベースまたはデータウェアハウスからアセット (データ) の技術メタデータを Amazon にインポートできます DataZone。Amazon の現在のリリースでは DataZone、 AWS Glue と Amazon Redshift のデータソースを作成して実行できます。データソースを作成することで、Amazon DataZone とソース (AWS Glue Data Catalog または Amazon Redshift Warehouse) 間の接続を確立し、テーブル名、列名、データ型などの技術的なメタデータを読み取ることができます。データソースを作成することで、Amazon で新しいアセットを作成または既存のアセットを更新する最初のデータソースの実行も開始します DataZone。データソースの作成中またはデータソースが正常に作成された後、データソースの実行スケジュールを指定するオプションもあります。
- データソースの実行
-
Amazon では DataZone、データソースの実行は、プロジェクトインベントリにアセットを作成し、オプションでプロジェクトインベントリアセットを Amazon DataZone カタログに発行するために Amazon が DataZone 実行するタスクです。データソースの実行は、自動化 (データソースが最初に作成されたときに開始) することも、スケジュールまたは手動にすることもできます。データ選択基準を使用すると、既存および将来のデータセットを微調整して、プロジェクトインベントリまたは Amazon DataZone カタログに取り込むことができます。また、これらのインベントリまたはカタログアセットへのメタデータ更新の頻度も調整できます。
- サブスクリプションターゲット
-
Amazon では DataZone、サブスクリプションターゲットを使用して、プロジェクトでサブスクライブしたデータにアクセスできます。サブスクリプションターゲットは、Amazon がソースデータへの接続を確立し、Amazon DataZone プロジェクトのメンバーがサブスクライブしたデータのクエリを開始できるように、必要な許可を作成するために DataZone 使用できる場所 (データベースやスキーマなど) と必要なアクセス許可 (IAMロールなど) を指定します。
- サブスクリプションリクエスト
-
Amazon では DataZone、サブスクリプションリクエストは、特定のアセットへのアクセスを許可するために Amazon DataZone プロジェクトが従う必要があるプロセスです。サブスクリプションリクエストは、承認、拒否、取り消し、または付与できます。
- [アセット]
-
Amazon では DataZone、アセットは、単一の物理データオブジェクト (テーブル、ダッシュボード、ファイルなど) または仮想データオブジェクト (ビューなど) を表示するエンティティです。
- アセットタイプ
-
アセットタイプは、Amazon DataZone カタログでアセットがどのように表現されるかを定義します。アセットタイプは、特定のタイプのアセットのスキーマを定義します。アセットが作成されると、アセットタイプ (デフォルトでは最新バージョン) で定義されたスキーマに対して検証されます。アセットの更新が発生すると、Amazon は新しいアセットバージョン DataZone を作成し、Amazon DataZone ユーザーがすべてのアセットバージョンで操作できるようにします。
- ビジネス用語集
-
Amazon では DataZone、ビジネス用語集は、アセットに関連付けられている可能性のあるビジネス用語のコレクションです。ビジネス用語集は、さまざまなデータ分析タスクを通じて組織全体で同じ用語と定義が使用されるようにするのに役立ちます。
ビジネス用語集の用語をアセットと列に追加して、検索中にこれらの属性を分類または識別を強化できます。用語集は、アセットに関連付けられているメタデータ形式のフィールドの値タイプとして選択できます。アセットのメタデータフォームフィールドの値として特定の用語を選択すると、ユーザーはビジネス用語集用語を検索し、関連するアセットを検索できます。
- メタデータフォームタイプ
-
メタデータフォームタイプは、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインに公開されたときに収集および保存されるメタデータを定義するテンプレートです。メタデータフォームタイプは、データアセットに関連付けることができます。メタデータフォームタイプは、ドメイン管理者がコンプライアンス情報、規制情報、分類など、そのドメインに必要なメタデータフォームを定義するのに役立ちます。これにより、ドメイン管理者はアセットの追加メタデータをカスタマイズできます。Amazon DataZone には、 asset-common-details-form-type、 column-business-metadata-form-type、 glue-table-form-type、 glue-view-form-type redshift-table-form-type、 redshift-view-form-type、s3-object-collection-form-type、 subscription-terms-form-type、 などのシステムメタデータフォームタイプがあります suggestion-form-type。
- メタデータフォーム
-
Amazon では DataZone、メタデータフォームは、アセットがインベントリとして作成されたとき、または Amazon DataZone ドメインに公開されたときに収集および保存されるメタデータを定義します。メタデータフォーム定義は、ドメイン管理者がカタログドメインに作成します。メタデータフォーム定義は 1 つ以上のフィールド定義で構成され、ブール値、日付、10 進数、整数、文字列、ビジネス用語集のフィールド値データ型をサポートしています。
ドメイン管理者は、メタデータフォームをドメインに追加して、ドメイン内のアセットにメタデータフォームを適用します。次に、アセットパブリッシャーは、メタデータ形式で任意のフィールド値と必須フィールド値を提供します。
- プロジェクト
-
Amazon では DataZone、プロジェクトにより、ユーザーのグループがプロジェクトインベントリにアセットを作成し、すべてのプロジェクトメンバーが検出できるようにし、Amazon DataZone カタログでアセットを発行、検出、サブスクライブ、消費することを含むさまざまなビジネスユースケースでコラボレーションできます。プロジェクトメンバーは、Amazon DataZone カタログからアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを生成します。プロジェクトメンバーは、所有者、寄稿者、コンシューマー、スチュワード、視聴者です。
プロジェクトの作成/削除
プロジェクトプロファイルの作成/削除 環境プロファイルの作成/削除 環境の作成/削除 プロジェクトへのメンバーの追加/削除 検索と検出 Create/delete metadata forms/glossaries データソースの実行とデータの取り込みを作成する データを発行する サブスクリプションをリクエストする サブスクリプションリクエストの承認/拒否 Amazon Athena と Amazon Redshift からサブスクライブされたデータの読み取り [所有者] ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される あり はい はい はい はい はい はい 可能 寄稿者 ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可 はい はい はい はい はい はい 可能 コンシューマー ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
いいえ
いいえ
いいえ
はい
いいえ
可能
表示者 ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
いいえ
いいえ
いいえ
いいえ
いいえ
可能
スチュワード ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される ドメインユニットメンバーによって管理される 不可
はい
はい
はい
はい
いいえ
はい
可能
プロジェクト所有者は、所有者または寄稿者として他のユーザーを追加または削除でき、プロジェクトを変更または削除できます。寄稿者に対するその他の制限は、ポリシーで定義できます。ユーザーがプロジェクトを作成すると、そのプロジェクトの最初の所有者になります。
- 環境
-
環境は、設定されたリソース (Amazon S3 バケット、 AWS Glue データベース、Amazon Athena ワークグループなど) のコレクションであり、それらのリソースで操作できる特定のIAMプリンシパルのセット (コントリビューターのアクセス許可が付与されている) があります。また、各環境には、サブスクリプションとフルフィルメントを介してリソースにアクセスし、データにアクセスする権限を持つユーザープリンシパルがいる場合もあります。環境は、実用的なリンクを AWS サービス、外部IDEs、コンソールに保存するように設計されています。プロジェクトのメンバーは、Amazon Athena コンソールなどのサービスに、環境内で設定されたディープリンクを介してアクセスできます。SSO プロジェクトのユーザーとIAMユーザーは、特定の環境を使用/アクセスするためにさらに詳しく調べることができます。
- 環境プロファイル
-
Amazon では DataZone、環境プロファイルは環境の作成に使用できるテンプレートです。環境プロファイルは、設計図を使用して作成されます。
環境プロファイルを使用すると、ドメイン管理者は事前に設定されたパラメータでブループリントをラップでき、データワーカーは既存の環境プロファイルを選択し、新しい環境の名前を指定することで、任意の数の新しい環境をすばやく作成できます。これにより、データワーカーは、ドメイン管理者によって強制されるデータガバナンスポリシーを確実に満たすと同時に、プロジェクトと環境を効率的に管理できます。
- ブループリント
-
環境が作成される設計図は、環境が属するプロジェクトのどの AWS ツールやサービス ( AWS Glue Amazon Redshift など) メンバーが Amazon DataZone カタログのアセットを操作するときに使用できるかを定義します。
Amazon の現在のリリースでは DataZone 、以下のデフォルトの設計図がサポートされています。
-
データレイクの設計図
-
データウェアハウスの設計図
-
Amazon Sagemaker の設計図
-
- ユーザープロファイル
-
ユーザープロファイルは Amazon DataZone ユーザーを表します。Amazon SSO DataZone は、さまざまな目的で Amazon DataZone マネジメントコンソールとデータポータルを操作するためのIAMロールと ID の両方をサポートしています。ドメイン管理者は、IAMロールを使用して、新しい Amazon ドメインの作成、メタデータフォームタイプの設定、ポリシーの実装など、Amazon DataZone マネジメントコンソールで初期管理 DataZone ドメイン関連の作業を実行します。データワーカーは、アイデンティティセンター経由でSSO企業 ID を使用して Amazon DataZone Data Portal にログインし、メンバーシップがあるプロジェクトにアクセスします。
- グループプロファイル
-
グループプロファイルは、Amazon DataZone ユーザーのグループを表します。グループは手動で作成することも、エンタープライズ顧客の Active Directory グループにマッピングすることもできます。Amazon では DataZone、グループは 2 つの目的を果たします。まず、グループは組織図のユーザーのチームにマッピングできるため、新しい従業員がチームに加わったり、チームから退出したりするときに、Amazon DataZone プロジェクト所有者の管理作業を減らすことができます。次に、企業管理者は Active Directory グループを使用してユーザーステータスを管理および更新するため、Amazon DataZone ドメイン管理者はこれらのグループメンバーシップを使用して Amazon DataZone ドメインポリシーを実装できます。
- ドメイン管理者
-
Amazon では DataZone、Amazon DataZone ドメインを作成するIAMプリンシパルが、そのドメインのデフォルトのドメイン管理者です。Amazon のドメイン管理者は、ドメインの作成、他のドメイン管理者の割り当て、データソースとサブスクリプションターゲットの追加、プロジェクトと環境の作成、プロジェクト所有者の割り当てなど、ドメインの主要な機能 DataZone を実行します。
- パブリッシャー
-
Amazon では DataZone、パブリッシャーは Amazon DataZone カタログにアセットを発行し、パブリッシュするアセットのメタデータを編集できます。この権限を付与すると、パブリッシャーは Amazon DataZone カタログで公開したアセットへのサブスクリプションリクエストを承認または拒否できます。
- サブスクライバー
-
Amazon では DataZone、サブスクライバーは Amazon DataZone カタログ内のアセットを検索、アクセス、消費したい Amazon DataZone プロジェクトです。
- AWS アカウント 所有者
-
Amazon では DataZone、 AWS アカウント 所有者はロール、ポリシー、アクセス許可を に作成 AWS アカウント し、これら AWS アカウント を Amazon DataZone ドメインに関連付けることができます。