DynamoDB-Datenimport zu Amazon S3: Funktionsweise - Amazon-DynamoDB

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DynamoDB-Datenimport zu Amazon S3: Funktionsweise

Um Daten zu DynamoDB zu importieren, müssen sich Ihre Daten in einem Amazon S3-Bucket im CSV-, DynamoDB JSON- oder Amazon Ion-Format befinden. Daten können im ZSTD- oder GZIP-Format komprimiert oder direkt in unkomprimierter Form importiert werden. Quelldaten können entweder ein einzelnes Amazon-S3-Objekt oder mehrere Amazon-S3-Objekte sein, die dasselbe Präfix verwenden.

Ihre Daten werden in eine neue DynamoDB-Tabelle importiert, die erstellt wird, wenn Sie die Importanforderung initiieren. Sie können diese Tabelle mit sekundären Indizes erstellen und dann Ihre Daten über alle primären und sekundären Indizes hinweg abfragen und aktualisieren, sobald der Import abgeschlossen ist. Sie können auch ein globales Tabellenreplikat hinzufügen, nachdem der Import abgeschlossen ist.

Anmerkung

Während des Amazon-S3-Importvorgangs erstellt DynamoDB eine neue Zieltabelle, in die importiert wird. Der Import in vorhandene Tabellen wird von dieser Funktion derzeit nicht unterstützt.

Der Import aus Amazon S3 verbraucht keine Schreibkapazität für die neue Tabelle, so dass Sie keine zusätzliche Kapazität für den Import von Daten in DynamoDB bereitstellen müssen. Die Preise für Datenimporte basieren auf der unkomprimierten Größe der Quelldaten in Amazon S3, die als Ergebnis des Imports verarbeitet werden. Elemente, die verarbeitet werden, aber aufgrund von Formatierungen oder anderen Inkonsistenzen in den Quelldaten nicht in die Tabelle geladen werden können, werden im Rahmen des Importvorgangs ebenfalls in Rechnung gestellt. Siehe Amazon-DynamoDB-Preise für weitere Informationen.

Sie können Daten in einen S3-Bucket exportieren, der zu einem anderen Konto gehört, wenn Sie über die korrekten Schreibberechtigungen für den jeweiligen Bucket verfügen. Die neue Tabelle kann sich auch in einer anderen Region als die des Quell-Buckets aus Amazon S3 befinden. Weitere Informationen finden Sie unter Amazon Simple Storage Service – Einrichtung und Berechtigungen .

Die Importzeiten stehen in direktem Zusammenhang mit den Merkmalen Ihrer Daten in Amazon S3. Dazu gehören Datengröße, Datenformat, Komprimierungsschema, Einheitlichkeit der Datenverteilung, Anzahl der Amazon-S3-Objekte und andere zugehörige Variablen. Insbesondere Datensätze mit gleichmäßig verteilten Schlüsseln lassen sich schneller importieren als solche ohne diese. Zum Beispiel: Wenn der Schlüssel Ihres sekundären Index den Monat des Jahres für die Partitionierung verwendet und alle Ihre Daten aus dem Monat Dezember stammen, kann der Import dieser Daten deutlich länger dauern.

Es wird erwartet, dass die mit Schlüsseln verknüpften Attribute in der Basistabelle eindeutig sind. Wenn Schlüssel nicht eindeutig sind, werden beim Import die zugehörigen Elemente überschrieben, bis nur die letzte Überschreibung übrig bleibt. Wenn der Primärschlüssel beispielsweise der Monat ist und mehrere Elemente auf den Monat September festgelegt sind, überschreibt jedes neue Element die zuvor geschriebenen Elemente und es bleibt nur ein Element übrig, dessen Primärschlüssel (Monat) auf September festgelegt ist. In solchen Fällen stimmt die Anzahl der verarbeiteten Elemente in der Beschreibung der Importtabelle nicht mit der Anzahl der Elemente in der Zieltabelle überein.

AWS CloudTrail protokolliert alle Konsolen- und API-Aktionen für den Tabellenimport. Weitere Informationen finden Sie unter Protokollieren von DynamoDB-Operationen unter Verwendung von AWS CloudTrail.

Das folgende Video gibt eine Einführung in den direkten Import aus Amazon S3 in DynamoDB.