Bonnes pratiques en matière de chargement par lots - Amazon Timestream

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Bonnes pratiques en matière de chargement par lots

Le chargement par lots fonctionne de manière optimale (débit élevé) lorsque les conditions et recommandations suivantes sont respectées :

  1. CSVles fichiers soumis pour ingestion sont de petite taille, en particulier avec une taille de fichier comprise entre 100 Mo et 1 Go, afin d'améliorer le parallélisme et la vitesse d'ingestion.

  2. Évitez d'ingérer simultanément des données dans la même table (par exemple en utilisant l' WriteRecords APIopération ou une requête planifiée) lorsque le chargement du lot est en cours. Cela peut entraîner des ralentissements et la tâche de chargement par lots échouera.

  3. N'ajoutez, ne modifiez ou ne supprimez pas de fichiers du compartiment S3 utilisé pour le chargement par lots pendant que la tâche de chargement par lots est en cours d'exécution.

  4. Ne supprimez pas ou ne révoquez pas les autorisations relatives aux tables ou à la source, et ne signalez pas les compartiments S3 contenant des tâches de chargement par lots planifiées ou en cours.

  5. Lorsque vous ingérez des données avec un ensemble de valeurs de dimension à cardinalité élevée, suivez les instructions sur. Recommandations pour le partitionnement des enregistrements à mesures multiples

  6. Assurez-vous de vérifier l'exactitude des données en soumettant un petit fichier. Toutes les données soumises au chargement par lots vous seront facturées, qu'elles soient correctes ou non. Pour plus d'informations sur les tarifs, consultez les tarifs d'Amazon Timestream.

  7. Ne reprenez pas une tâche de chargement par lots sauf si la ActiveMagneticStorePartitions valeur est inférieure à 250. La tâche peut être limitée et échouer. La soumission de plusieurs tâches en même temps pour la même base de données devrait en réduire le nombre.

Les meilleures pratiques relatives à la console sont les suivantes :

  1. Utilisez le générateur uniquement pour simplifier la modélisation des données qui utilise un seul nom de mesure pour les enregistrements de plusieurs mesures.

  2. Pour une modélisation de données plus complexe, utilisezJSON. Par exemple, à utiliser JSON lorsque vous utilisez plusieurs noms de mesures lors de l'utilisation d'enregistrements de plusieurs mesures.

Pour un flux temporel supplémentaire consacré aux LiveAnalytics meilleures pratiques, voir. Bonnes pratiques