データ処理オプション - Amazon Redshift

データ処理オプション

このトピックでは、Redshift Spectrum が予期しない形式のデータを処理する方法を設定する方法について説明します。

外部テーブルの作成時にテーブルパラメータを設定して、外部テーブルでクエリされるデータを調整することができます。設定しなければ、スキャンエラーが発生する可能性があります。詳細については、「CREATE EXTERNAL TABLE」で「TABLE PROPERTIES」を参照してください。例については、「データ処理の例」を参照してください。エラーのリストについては、「SVL_SPECTRUM_SCAN_ERROR」を参照してください。

外部テーブルの作成時に以下の TABLE PROPERTIES を設定して、外部テーブルでクエリされるデータの入力処理を指定できます。

  • column_count_mismatch_handling を使用して、ファイルに、外部テーブル定義で指定された列数よりも行の値が少ないか、または多いかを識別します。

  • invalid_char_handling は、VARCHAR、CHAR、および文字列データが含まれる列内での無効な文字の入力処理を指定します。invalid_char_handling に REPLACE を指定するときは、使用する置換文字を指定できます。

  • numeric_overflow_handling は、整数と小数のデータが含まれる列内でのキャストオーバーフロー処理を指定します。

  • surplus_bytes_handling は、VARBYTE データを含む列の余剰バイトの入力処理を指定します。

  • surplus_char_handling は、VARCHAR、CHAR、および文字列データが含まれる列内での余剰文字の入力処理を指定します。

最大エラー数を超えるクエリをキャンセルする設定オプションを設定できます。詳細については、「spectrum_query_maxerror」を参照してください。