翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS CloudTrail ソースからのデータレイクの作成
このチュートリアルでは、Lake Formation コンソールで AWS CloudTrail ソースから最初のデータレイクを作成してロードするためのアクションについて説明します。
データレイクを作成するための大まかなステップ
Amazon Simple Storage Service (Amazon S3) パスをデータレイクとして登録します。
Lake Formation に、Data Catalog、およびデータレイク内の Amazon S3 ロケーションに書き込みを行うための許可を付与します。
Data Catalog 内のメタデータテーブルを整理するためのデータベースを作成します。
ブループリントを使用してワークフローを作成します。ワークフローを実行して、データソースからデータを取り込みます。
-
他のユーザーが Data Catalog とデータレイク内のデータを管理できるようにする Lake Formation 許可を設定します。
Amazon S3 データレイクにインポートしたデータをクエリするように Amazon Athena をセットアップします。
一部のデータストアタイプについては、Amazon S3 データレイクにインポートしたデータをクエリするように Amazon Redshift Spectrum をセットアップします。
トピック
- 対象者
- 前提条件
- ステップ 1: データアナリストユーザーの作成
- ステップ 2: ワークフローロールに AWS CloudTrail ログを読み取るアクセス許可を追加する
- ステップ 3: データレイクとしての Amazon S3 バケットを作成する
- ステップ 4: Amazon S3 パスを登録する
- ステップ 5: データのロケーションの許可を付与する
- ステップ 6: Data Catalog でデータベースを作成する
- ステップ 7: データの許可を付与する
- ステップ 8: ブループリントを使用してワークフローを作成する
- ステップ 9: ワークフローを実行する
- ステップ 10: テーブルに対する SELECT を付与する
- ステップ 11: Amazon Athenaを使用してデータレイクをクエリする