AWS Glue で Ion 形式を使用する
AWS Glue はソースからデータを取得し、さまざまなデータ形式で保存および転送されたターゲットにデータを書き込みます。このドキュメントでは、データが Ion データ形式で保存または転送される場合に、AWS Glue でデータを使用する際に利用できる機能を紹介します。
AWS Glue は Ion 形式の使用をサポートしています。この形式は、データ構造 (行または列ベースではない) を交換可能なバイナリおよびプレーンテキスト形式で表します。作成者による形式の概要については、「Amazon Ion
AWS Glue を使用して、Amazon S3 から Ion ファイルを読み取ることができます。S3 から、Ion ファイルを含む bzip
および gzip
アーカイブを読み取ることができます。このページで説明する設定ではなく、S3 接続パラメータ 上で圧縮動作を設定します。
次の表は、Ion 形式のオプションをサポートする一般的な AWS Glue オペレーションを示しています。
読み込み | 書き込み | ストリーミングの読み取り | 小さなファイルのグループ化 | ジョブのブックマーク |
---|---|---|---|---|
サポート | サポートされていません | サポートされていません | サポート | サポートされていません |
例: S3 から Ion ファイルとフォルダを読み取る
前提条件: 読み取る Ion ファイルまたはフォルダへの S3 パス (s3path
) が必要です。
設定: 関数オプションで format="json"
を指定します。connection_options
で、paths
キーを使用して s3path
を指定します。リーダーが S3 とやり取りする方法は、connection_options
で設定できます。詳細については、AWS Glue: Amazon S3 接続のオプションのリファレンス の「ETL の接続タイプとオプション」を参照してください。
次の AWS Glue ETL スクリプトは、S3 から Ion ファイルまたはフォルダを読み取るプロセスを示しています。
Ion 設定リファレンス
format="ion"
の format_options
値はありません。