RegEx データ形式 - AWS Data Pipeline

AWS Data Pipeline は、新規顧客には利用できなくなりました。の既存のお客様 AWS Data Pipeline は、通常どおりサービスを引き続き使用できます。詳細はこちら

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

RegEx データ形式

正規表現によって定義されるカスタムデータ形式。

以下は、このオブジェクト型の例です。

{ "id" : "MyInputDataType", "type" : "RegEx", "inputRegEx" : "([^ ]*) ([^ ]*) ([^ ]*) (-|\\[[^\\]]*\\]) ([^ \"]*|\"[^\"]*\") (-|[0-9]*) (-|[0-9]*)(?: ([^ \"]*|\"[^\"]*\") ([^ \"]*|\"[^\"]*\"))?", "outputFormat" : "%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s", "column" : [ "host STRING", "identity STRING", "user STRING", "time STRING", "request STRING", "status STRING", "size STRING", "referer STRING", "agent STRING" ] }

構文

オプションのフィールド 説明 スロットタイプ
このデータノードで記述されたデータに対して各フィールドで指定されたデータ型を持つ列名。例: STRING hostname 複数の値の場合は、スペースで区切られた列名とデータ型を使用します。 文字列
inputRegEx S3 入力 file. を解析する正規表現 inputRegEx は、ファイル内の比較的非構造化データから列を取得する方法を提供します。 文字列
outputFormat によって取得された列フィールドは inputRegEx、Java フォーマット構文を使用して %1$s %2$s として参照されます。 文字列
parent スロットの継承元となる現在のオブジェクトの親。 リファレンスオブジェクト、例:「parent」:{「ref"myBaseObjectId」}

実行時フィールド 説明 スロットタイプ
@version オブジェクトが作成されたパイプラインのバージョン。 文字列

システムフィールド 説明 スロットタイプ
@error 形式が正しくないオブジェクトを説明するエラー 文字列
@pipelineId このオブジェクトが属するパイプラインの ID 文字列
@sphere オブジェクトの球は、ライフサイクルにおける場所を示します。コンポーネントオブジェクトにより、試行オブジェクトを実行するインスタンスオブジェクトが発生します 文字列