Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

半構造化データのアンロード - Amazon Redshift

半構造化データのアンロード

Amazon Redshift を使用すると、Amazon Redshift クラスターから Amazon S3 に、テキスト、Apache Parquet、Apache ORC、Avro などのさまざまな形式で半構造化データをエクスポートできます。以下のセクションでは、Amazon Redshift で半構造化データのアンロード操作を設定および実行するプロセスについて説明します。

CSV or text formats

SUPER データ列を持つテーブルを、コンマ区切り値 (CSV) 形式またはテキスト形式で Amazon S3 にアンロードできます。navigation 句と unnest 句の組み合わせを使用して、Amazon Redshift は SUPER データ形式の階層データを CSV 形式またはテキスト形式の Amazon S3 にアンロードします。その後、アンロードされたデータに対して外部テーブルを作成し、Redshift Spectrum を使用してクエリを実行できます。UNLOAD の使用と必要な IAM アクセス許可の詳細については、「UNLOAD」を参照してください。

次の例を実行する前に、「半構造化データを Amazon Redshift にロードする」に記載されているプロセスを使用して region_nations テーブルにデータを入力します。次の例で使用されるテーブルの詳細については、「SUPER サンプルデータセット」を参照してください。

次の例では、Amazon S3 にデータをアンロードします。

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' DELIMITER AS '|' GZIP ALLOWOVERWRITE;

ユーザー定義の文字列が null 値を表す他のデータ型とは異なり、Amazon Redshift は JSON 形式を使用して SUPER データ列をエクスポートし、JSON 形式で決定されるように null として表します。その結果、SUPER データ列では、UNLOAD コマンドで使用される NULL [AS] オプションを無視します。

Parquet format

SUPER データ列を持つテーブルをParquet形式で Amazon S3 にアンロードできます。Amazon Redshift は、JSON データ型として、Parquetで SUPER 列を表します。これにより、半構造化データを Parquet で表すことができます。これらの列は、Redshift Spectrum を使用してクエリするか、またはCOPY コマンドを使用して Amazon Redshift に取り戻すことができます。UNLOAD の使用と必要な IAM アクセス許可の詳細については、「UNLOAD」を参照してください。

次の例では、データをParquet形式でAmazon S3 にアンロードします。

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' FORMAT PARQUET;

SUPER データ列を持つテーブルを、コンマ区切り値 (CSV) 形式またはテキスト形式で Amazon S3 にアンロードできます。navigation 句と unnest 句の組み合わせを使用して、Amazon Redshift は SUPER データ形式の階層データを CSV 形式またはテキスト形式の Amazon S3 にアンロードします。その後、アンロードされたデータに対して外部テーブルを作成し、Redshift Spectrum を使用してクエリを実行できます。UNLOAD の使用と必要な IAM アクセス許可の詳細については、「UNLOAD」を参照してください。

次の例を実行する前に、「半構造化データを Amazon Redshift にロードする」に記載されているプロセスを使用して region_nations テーブルにデータを入力します。次の例で使用されるテーブルの詳細については、「SUPER サンプルデータセット」を参照してください。

次の例では、Amazon S3 にデータをアンロードします。

UNLOAD ('SELECT * FROM region_nations') TO 's3://xxxxxx/' IAM_ROLE 'arn:aws:iam::xxxxxxxxxxxx:role/Redshift-S3-Write' DELIMITER AS '|' GZIP ALLOWOVERWRITE;

ユーザー定義の文字列が null 値を表す他のデータ型とは異なり、Amazon Redshift は JSON 形式を使用して SUPER データ列をエクスポートし、JSON 形式で決定されるように null として表します。その結果、SUPER データ列では、UNLOAD コマンドで使用される NULL [AS] オプションを無視します。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.