Mappature dei modelli di dati per il caricamento in batch - Amazon Timestream

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Mappature dei modelli di dati per il caricamento in batch

Di seguito viene illustrato lo schema per le mappature dei modelli di dati e viene fornito un esempio.

Schema di mappatura del modello di dati

La sintassi della CreateBatchLoadTask richiesta e un BatchLoadTaskDescription oggetto restituito da una chiamata per DescribeBatchLoadTask includere un DataModelConfiguration oggetto che include il DataModel caricamento in batch. DataModelDefinisce le mappature dai dati di origine archiviati in CSV formato in una posizione S3 a un Timestream di destinazione per database e tabella. LiveAnalytics

Il TimeColumn campo indica la posizione dei dati di origine per il valore da mappare alla colonna della tabella di destinazione in Timestream for. time LiveAnalytics TimeUnitSpeciifica l'unità perTimeColumn, e può essere una delleMILLISECONDS,, SECONDS o. MICROSECONDS NANOSECONDS Sono disponibili anche mappature per dimensioni e misure. Le mappature delle dimensioni sono composte da colonne di origine e campi di destinazione.

Per ulteriori informazioni, vedere. DimensionMapping Le mappature per le misure hanno due opzioni, MixedMeasureMappings e. MultiMeasureMappings

Per riassumere, a DataModel contiene le mappature da un'origine dati in una posizione S3 a un Timestream di destinazione per la tabella per quanto segue. LiveAnalytics

  • Orario

  • Dimensioni

  • Misure

Se possibile, ti consigliamo di mappare i dati di misura su record multimisura in Timestream for. LiveAnalytics Per informazioni sui vantaggi dei record multimisura, consulta. Record multimisura

Se più misure nei dati di origine sono memorizzate in una riga, puoi mappare tali misure su record di più misure in Timestream per utilizzarle. LiveAnalytics MultiMeasureMappings Se ci sono valori che devono essere mappati a un record a misura singola, puoi usare. MixedMeasureMappings

MixedMeasureMappingsed MultiMeasureMappings entrambi includonoMultiMeasureAttributeMappings. I record a più misure sono supportati indipendentemente dal fatto che siano necessari record a misura singola.

Se in Timestream for sono necessari solo record di destinazione a più misure LiveAnalytics, è possibile definire le mappature delle misure nella seguente struttura.

CreateBatchLoadTask
    MeasureNameColumn
    MultiMeasureMappings
        TargetMultiMeasureName
        MultiMeasureAttributeMappings array
Nota

Si consiglia di utilizzarlo quando possibile. MultiMeasureMappings

Se sono necessari record di destinazione a misura singola in Timestream for LiveAnalytics, puoi definire le mappature delle misure nella seguente struttura.

CreateBatchLoadTask
    MeasureNameColumn
    MixedMeasureMappings array
        MixedMeasureMapping
            MeasureName
            MeasureValueType
            SourceColumn
            TargetMeasureName
            MultiMeasureAttributeMappings array

Quando si utilizzaMultiMeasureMappings, l'array è sempre necessario. MultiMeasureAttributeMappings Quando si utilizza l'MixedMeasureMappingsarray, se si MeasureValueType tratta MULTI di un dato elementoMixedMeasureMapping, MultiMeasureAttributeMappings è necessario a tal fineMixedMeasureMapping. Altrimenti, MeasureValueType indica il tipo di misura per il record a misura singola.

In entrambi i casi, ce n'è una serie di MultiMeasureAttributeMapping opzioni disponibili. Le mappature su record multimisura in ciascuno MultiMeasureAttributeMapping di essi vengono definite nel modo seguente:

SourceColumn

La colonna dei dati di origine che si trova in Amazon S3.

TargetMultiMeasureAttributeName

Il nome del nome multimisura di destinazione nella tabella di destinazione. Questo input è obbligatorio quando non MeasureNameColumn viene fornito. Se MeasureNameColumn fornito, il valore di quella colonna viene utilizzato come nome multimisura.

MeasureValueType

Uno diDOUBLE, BIGINT BOOLEANVARCHAR, oTIMESTAMP.

Mappature di modelli di dati con esempio MultiMeasureMappings

Questo esempio dimostra la mappatura su record multimisura, l'approccio preferito, che memorizza ogni valore di misura in una colonna dedicata. È possibile scaricare un esempio da sampleCSV. CSV L'esempio ha i seguenti titoli da mappare a una colonna di destinazione in un Timestream for table. LiveAnalytics

  • time

  • measure_name

  • region

  • location

  • hostname

  • memory_utilization

  • cpu_utilization

Identifica le measure_name colonne time e nel file. CSV In questo caso, vengono mappate direttamente al Timestream per le colonne della LiveAnalytics tabella con lo stesso nome.

  • timemappe per time

  • measure_namemappa a measure_name (o al valore scelto)

Quando si utilizza ilAPI, si specifica time nel TimeColumn campo e un valore di unità di tempo supportato, ad esempio MILLISECONDS nel TimeUnit campo. Questi corrispondono al nome della colonna di origine e all'ora del timestamp immessi nella console. È possibile raggruppare o partizionare i record utilizzando la measure_name chiave definita. MeasureNameColumn

Nell'esempio, regionlocation, e hostname sono dimensioni. Le dimensioni sono mappate in una serie di DimensionMapping oggetti.

Per le misure, il valore TargetMultiMeasureAttributeName diventerà una colonna nel Timestream for table. LiveAnalytics È possibile mantenere lo stesso nome come in questo esempio. Oppure puoi specificarne uno nuovo. MeasureValueTypeè uno dei DOUBLEBIGINT,BOOLEAN,VARCHAR, oTIMESTAMP.

{ "TimeColumn": "time", "TimeUnit": "MILLISECONDS", "DimensionMappings": [ { "SourceColumn": "region", "DestinationColumn": "region" }, { "SourceColumn": "location", "DestinationColumn": "location" }, { "SourceColumn": "hostname", "DestinationColumn": "hostname" } ], "MeasureNameColumn": "measure_name", "MultiMeasureMappings": { "MultiMeasureAttributeMappings": [ { "SourceColumn": "memory_utilization", "TargetMultiMeasureAttributeName": "memory_utilization", "MeasureValueType": "DOUBLE" }, { "SourceColumn": "cpu_utilization", "TargetMultiMeasureAttributeName": "cpu_utilization", "MeasureValueType": "DOUBLE" } ] } }
Visual builder interface showing column mappings for timestream data attributes and types.

mappature di modelli di dati con esempio MixedMeasureMappings

Ti consigliamo di utilizzare questo approccio solo quando devi mappare record a misura singola in Timestream for. LiveAnalytics