RegEx Format Data - AWS Data Pipeline

AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada dari AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. Pelajari selengkapnya

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

RegEx Format Data

Format data kustom yang didefinisikan oleh ekspresi reguler.

Contoh

Berikut adalah contoh dari jenis objek ini.

{ "id" : "MyInputDataType", "type" : "RegEx", "inputRegEx" : "([^ ]*) ([^ ]*) ([^ ]*) (-|\\[[^\\]]*\\]) ([^ \"]*|\"[^\"]*\") (-|[0-9]*) (-|[0-9]*)(?: ([^ \"]*|\"[^\"]*\") ([^ \"]*|\"[^\"]*\"))?", "outputFormat" : "%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s", "column" : [ "host STRING", "identity STRING", "user STRING", "time STRING", "request STRING", "status STRING", "size STRING", "referer STRING", "agent STRING" ] }

Sintaks

Bidang Opsional Deskripsi Jenis Slot
kolom Nama kolom dengan jenis data yang ditentukan oleh masing-masing bidang untuk data yang dijelaskan oleh simpul data ini. Contoh: nama host STRING Untuk beberapa nilai, gunakan nama kolom dan tipe data yang dipisahkan oleh spasi. String
inputRegEx Ekspresi reguler untuk mengurai file input S3. inputRegEx menyediakan cara untuk mengambil kolom dari data yang relatif tidak terstruktur dalam file. String
outputFormat Kolom kolom diambil oleh inputRegEx, tetapi direferensikan sebagai %1$s %2$s menggunakan sintaks pemformat Java. String
induk Induk dari objek saat ini dari mana slot akan diwariskan. Objek Referensi, misalnya “induk”: {"ref”:” myBaseObject Id "}

Bidang Runtime Deskripsi Jenis Slot
@version Versi alur objek dibuat dengan. String

Bidang Sistem Deskripsi Jenis Slot
@error Galat mendeskripsikan obyek yang tidak terbentuk String
@pipelineId Id dari alur tempat objek ini berada String
@sphere Lingkup dari sebuah objek menunjukkan tempatnya dalam siklus hidup: Component Objects memunculkan Instance Objects yang mengeksekusi Attempt Objects String