Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pemetaan model data untuk pemuatan batch
Berikut ini membahas skema untuk pemetaan model data dan memberi dan contoh.
Skema pemetaan model data
Sintaks CreateBatchLoadTask
permintaan dan BatchLoadTaskDescription
objek dikembalikan oleh panggilan untuk DescribeBatchLoadTask
menyertakan DataModelConfiguration
objek yang menyertakan DataModel
untuk pemuatan batch. DataModel
Mendefinisikan pemetaan dari data sumber yang disimpan dalam CSV format di lokasi S3 ke Timestream target untuk database dan tabel. LiveAnalytics
TimeColumn
Bidang menunjukkan lokasi data sumber untuk nilai yang akan dipetakan ke time
kolom tabel tujuan di Timestream untuk. LiveAnalytics TimeUnit
Menentukan unit untukTimeColumn
, dan dapat menjadi salah satu dariMILLISECONDS
,, SECONDS
MICROSECONDS
, atauNANOSECONDS
. Ada juga pemetaan untuk dimensi dan ukuran. Pemetaan dimensi terdiri dari kolom sumber dan bidang target.
Untuk informasi lebih lanjut, lihat DimensionMapping. Pemetaan untuk tindakan memiliki dua opsi, MixedMeasureMappings
dan. MultiMeasureMappings
Untuk meringkas, a DataModel
berisi pemetaan dari sumber data di lokasi S3 ke Timestream target untuk tabel berikut ini. LiveAnalytics
-
Waktu
-
Dimensi
-
Tindakan
Jika memungkinkan, kami menyarankan Anda memetakan data pengukuran ke catatan multi-ukuran di Timestream untuk. LiveAnalytics Untuk informasi tentang manfaat catatan multi-ukuran, lihatCatatan multi-ukuran.
Jika beberapa ukuran dalam data sumber disimpan dalam satu baris, Anda dapat memetakan beberapa ukuran tersebut ke catatan multi-ukuran di Timestream untuk LiveAnalytics digunakan. MultiMeasureMappings
Jika ada nilai yang harus dipetakan ke catatan ukuran tunggal, Anda dapat menggunakannyaMixedMeasureMappings
.
MixedMeasureMappings
dan MultiMeasureMappings
keduanya termasukMultiMeasureAttributeMappings
. Catatan multi-ukuran didukung terlepas dari apakah catatan ukuran tunggal diperlukan.
Jika hanya catatan target multi-ukuran yang diperlukan di Timestream for LiveAnalytics, Anda dapat menentukan pemetaan ukuran dalam struktur berikut.
CreateBatchLoadTask MeasureNameColumn MultiMeasureMappings TargetMultiMeasureName MultiMeasureAttributeMappings array
catatan
Kami merekomendasikan penggunaan MultiMeasureMappings
bila memungkinkan.
Jika catatan target ukuran tunggal diperlukan di Timestream for LiveAnalytics, Anda dapat menentukan pemetaan ukuran dalam struktur berikut.
CreateBatchLoadTask MeasureNameColumn MixedMeasureMappings array MixedMeasureMapping MeasureName MeasureValueType SourceColumn TargetMeasureName MultiMeasureAttributeMappings array
Saat Anda menggunakanMultiMeasureMappings
, MultiMeasureAttributeMappings
array selalu diperlukan. Bila Anda menggunakan MixedMeasureMappings
array, jika MeasureValueType
adalah MULTI
untuk diberikanMixedMeasureMapping
, MultiMeasureAttributeMappings
diperlukan untuk ituMixedMeasureMapping
. Jika tidak, MeasureValueType
tunjukkan jenis ukuran untuk catatan ukuran tunggal.
Either way, ada array yang MultiMeasureAttributeMapping
tersedia. Anda menentukan pemetaan ke catatan multi-ukuran di masing-masing MultiMeasureAttributeMapping
sebagai berikut:
SourceColumn
-
Kolom dalam data sumber yang terletak di Amazon S3.
TargetMultiMeasureAttributeName
-
Nama nama multi-ukuran target di tabel tujuan. Input ini
MeasureNameColumn
diperlukan ketika tidak disediakan. JikaMeasureNameColumn
disediakan, nilai dari kolom itu digunakan sebagai nama multi-ukuran. MeasureValueType
-
Salah satu
DOUBLE
,BIGINT
BOOLEAN
,VARCHAR
, atauTIMESTAMP
.
Pemetaan model data dengan contoh MultiMeasureMappings
Contoh ini menunjukkan pemetaan ke catatan multi-ukuran, pendekatan yang disukai, yang menyimpan setiap nilai ukuran dalam kolom khusus. Anda dapat mengunduh sampel CSV di sampel CSV. Sampel memiliki judul berikut untuk dipetakan ke kolom target dalam Timestream untuk LiveAnalytics tabel.
-
time
-
measure_name
-
region
-
location
-
hostname
-
memory_utilization
-
cpu_utilization
Identifikasi time
dan measure_name
kolom dalam CSV file. Dalam hal ini peta ini langsung ke Timestream untuk kolom LiveAnalytics tabel dengan nama yang sama.
-
time
peta ketime
-
measure_name
peta kemeasure_name
(atau nilai yang Anda pilih)
Saat menggunakanAPI, Anda menentukan time
di TimeColumn
bidang dan nilai satuan waktu yang didukung seperti MILLISECONDS
di TimeUnit
bidang. Ini sesuai dengan nama kolom Sumber dan masukan waktu stempel waktu di konsol. Anda dapat mengelompokkan atau mempartisi catatan menggunakan measure_name
yang didefinisikan dengan MeasureNameColumn
kunci.
Dalam sampel,region
,location
, dan hostname
dimensi. Dimensi dipetakan dalam array DimensionMapping
objek.
Untuk ukuran, nilainya TargetMultiMeasureAttributeName
akan menjadi kolom di Timestream untuk LiveAnalytics tabel. Anda dapat menyimpan nama yang sama seperti dalam contoh ini. Atau Anda dapat menentukan yang baru. MeasureValueType
adalah salah satuDOUBLE
,BIGINT
,BOOLEAN
,VARCHAR
, atauTIMESTAMP
.
{ "TimeColumn": "time", "TimeUnit": "MILLISECONDS", "DimensionMappings": [ { "SourceColumn": "region", "DestinationColumn": "region" }, { "SourceColumn": "location", "DestinationColumn": "location" }, { "SourceColumn": "hostname", "DestinationColumn": "hostname" } ], "MeasureNameColumn": "measure_name", "MultiMeasureMappings": { "MultiMeasureAttributeMappings": [ { "SourceColumn": "memory_utilization", "TargetMultiMeasureAttributeName": "memory_utilization", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "cpu_utilization", "TargetMultiMeasureAttributeName": "cpu_utilization", "MeasureValueType": "DOUBLE" } ] } }
Pemetaan model data dengan contoh MixedMeasureMappings
Kami menyarankan Anda hanya menggunakan pendekatan ini ketika Anda perlu memetakan ke catatan ukuran tunggal di Timestream untuk. LiveAnalytics