Pemetaan model data untuk pemuatan batch - Amazon Timestream

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemetaan model data untuk pemuatan batch

Berikut ini membahas skema untuk pemetaan model data dan memberi dan contoh.

Skema pemetaan model data

Sintaks CreateBatchLoadTask permintaan dan BatchLoadTaskDescription objek dikembalikan oleh panggilan untuk DescribeBatchLoadTask menyertakan DataModelConfiguration objek yang menyertakan DataModel untuk pemuatan batch. DataModelMendefinisikan pemetaan dari data sumber yang disimpan dalam CSV format di lokasi S3 ke Timestream target untuk database dan tabel. LiveAnalytics

TimeColumnBidang menunjukkan lokasi data sumber untuk nilai yang akan dipetakan ke time kolom tabel tujuan di Timestream untuk. LiveAnalytics TimeUnitMenentukan unit untukTimeColumn, dan dapat menjadi salah satu dariMILLISECONDS,, SECONDSMICROSECONDS, atauNANOSECONDS. Ada juga pemetaan untuk dimensi dan ukuran. Pemetaan dimensi terdiri dari kolom sumber dan bidang target.

Untuk informasi lebih lanjut, lihat DimensionMapping. Pemetaan untuk tindakan memiliki dua opsi, MixedMeasureMappings dan. MultiMeasureMappings

Untuk meringkas, a DataModel berisi pemetaan dari sumber data di lokasi S3 ke Timestream target untuk tabel berikut ini. LiveAnalytics

  • Waktu

  • Dimensi

  • Tindakan

Jika memungkinkan, kami menyarankan Anda memetakan data pengukuran ke catatan multi-ukuran di Timestream untuk. LiveAnalytics Untuk informasi tentang manfaat catatan multi-ukuran, lihatCatatan multi-ukuran.

Jika beberapa ukuran dalam data sumber disimpan dalam satu baris, Anda dapat memetakan beberapa ukuran tersebut ke catatan multi-ukuran di Timestream untuk LiveAnalytics digunakan. MultiMeasureMappings Jika ada nilai yang harus dipetakan ke catatan ukuran tunggal, Anda dapat menggunakannyaMixedMeasureMappings.

MixedMeasureMappingsdan MultiMeasureMappings keduanya termasukMultiMeasureAttributeMappings. Catatan multi-ukuran didukung terlepas dari apakah catatan ukuran tunggal diperlukan.

Jika hanya catatan target multi-ukuran yang diperlukan di Timestream for LiveAnalytics, Anda dapat menentukan pemetaan ukuran dalam struktur berikut.

CreateBatchLoadTask
    MeasureNameColumn
    MultiMeasureMappings
        TargetMultiMeasureName
        MultiMeasureAttributeMappings array
catatan

Kami merekomendasikan penggunaan MultiMeasureMappings bila memungkinkan.

Jika catatan target ukuran tunggal diperlukan di Timestream for LiveAnalytics, Anda dapat menentukan pemetaan ukuran dalam struktur berikut.

CreateBatchLoadTask
    MeasureNameColumn
    MixedMeasureMappings array
        MixedMeasureMapping
            MeasureName
            MeasureValueType
            SourceColumn
            TargetMeasureName
            MultiMeasureAttributeMappings array

Saat Anda menggunakanMultiMeasureMappings, MultiMeasureAttributeMappings array selalu diperlukan. Bila Anda menggunakan MixedMeasureMappings array, jika MeasureValueType adalah MULTI untuk diberikanMixedMeasureMapping, MultiMeasureAttributeMappings diperlukan untuk ituMixedMeasureMapping. Jika tidak, MeasureValueType tunjukkan jenis ukuran untuk catatan ukuran tunggal.

Either way, ada array yang MultiMeasureAttributeMapping tersedia. Anda menentukan pemetaan ke catatan multi-ukuran di masing-masing MultiMeasureAttributeMapping sebagai berikut:

SourceColumn

Kolom dalam data sumber yang terletak di Amazon S3.

TargetMultiMeasureAttributeName

Nama nama multi-ukuran target di tabel tujuan. Input ini MeasureNameColumn diperlukan ketika tidak disediakan. Jika MeasureNameColumn disediakan, nilai dari kolom itu digunakan sebagai nama multi-ukuran.

MeasureValueType

Salah satuDOUBLE, BIGINTBOOLEAN,VARCHAR, atauTIMESTAMP.

Pemetaan model data dengan contoh MultiMeasureMappings

Contoh ini menunjukkan pemetaan ke catatan multi-ukuran, pendekatan yang disukai, yang menyimpan setiap nilai ukuran dalam kolom khusus. Anda dapat mengunduh sampel CSV di sampel CSV. Sampel memiliki judul berikut untuk dipetakan ke kolom target dalam Timestream untuk LiveAnalytics tabel.

  • time

  • measure_name

  • region

  • location

  • hostname

  • memory_utilization

  • cpu_utilization

Identifikasi time dan measure_name kolom dalam CSV file. Dalam hal ini peta ini langsung ke Timestream untuk kolom LiveAnalytics tabel dengan nama yang sama.

  • timepeta ke time

  • measure_namepeta ke measure_name (atau nilai yang Anda pilih)

Saat menggunakanAPI, Anda menentukan time di TimeColumn bidang dan nilai satuan waktu yang didukung seperti MILLISECONDS di TimeUnit bidang. Ini sesuai dengan nama kolom Sumber dan masukan waktu stempel waktu di konsol. Anda dapat mengelompokkan atau mempartisi catatan menggunakan measure_name yang didefinisikan dengan MeasureNameColumn kunci.

Dalam sampel,region,location, dan hostname dimensi. Dimensi dipetakan dalam array DimensionMapping objek.

Untuk ukuran, nilainya TargetMultiMeasureAttributeName akan menjadi kolom di Timestream untuk LiveAnalytics tabel. Anda dapat menyimpan nama yang sama seperti dalam contoh ini. Atau Anda dapat menentukan yang baru. MeasureValueTypeadalah salah satuDOUBLE,BIGINT,BOOLEAN,VARCHAR, atauTIMESTAMP.

{ "TimeColumn": "time", "TimeUnit": "MILLISECONDS", "DimensionMappings": [ { "SourceColumn": "region", "DestinationColumn": "region" }, { "SourceColumn": "location", "DestinationColumn": "location" }, { "SourceColumn": "hostname", "DestinationColumn": "hostname" } ], "MeasureNameColumn": "measure_name", "MultiMeasureMappings": { "MultiMeasureAttributeMappings": [ { "SourceColumn": "memory_utilization", "TargetMultiMeasureAttributeName": "memory_utilization", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "cpu_utilization", "TargetMultiMeasureAttributeName": "cpu_utilization", "MeasureValueType": "DOUBLE" } ] } }
Visual builder interface showing column mappings for timestream data attributes and types.

Pemetaan model data dengan contoh MixedMeasureMappings

Kami menyarankan Anda hanya menggunakan pendekatan ini ketika Anda perlu memetakan ke catatan ukuran tunggal di Timestream untuk. LiveAnalytics