タイムスタンプ列をフォーマットされた文字列に変換する
タイムスタンプ列をパターンに基づいた文字列にフォーマットします。Format timestamp を使用すると、日付と時刻を希望する形式の文字列で取得できます。形式の定義には、Spark の日付構文
例えば、日付文字列を「2023-01-01 00:00」のような形式にしたいときは、Spark 構文を「yyyy-MM-dd HH:mm」として使用するか、Python の同様の日付コード「%Y-%m-%d %H:%M」を使用することで、形式を定義できます。
Format timestamp 変換ノードをジョブ図に追加するには
-
リソースパネルを開いて、[Format timestamp] を選択し、ジョブ図に新しい変換を追加します。ノードを追加する際に選択したノードが、その親になります。
-
(オプション) [Node properties] (ノードのプロパティ) タブで、ジョブ図にノードの名前を入力できます。ノードの親がまだ選択されていない場合は、[Node parents] (ノードの親) リストから、変換の入力ソースとして使用するノードを選択します。
-
[Transform] (変換) タブで、変換する列の名前を入力します。
-
[Transform] タブに、使用するタイムスタンプ形式のパターンを、Spark 日付構文
または Python 日付コード を使って入力します。 -
(オプション) [Transform] タブでは、選択した列を変換する代わりに、新しい列の名前を入力すれば、新しい列を作成し、元の列を残すことができます。