Weitere Themen - Amazon-DynamoDB

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Weitere Themen

Im Folgenden werden weitere Möglichkeiten zum Optimieren von Anwendungen beschrieben, die Hive für den Zugriff auf DynamoDB verwenden.

Retry duration

Standardmäßig führt Hive einen Hadoop-Auftrag erneut aus, wenn innerhalb von zwei Minuten keine Ergebnisse von DynamoDB zurückgegeben werden. Sie können diesen Zeitraum durch Ändern des Parameters dynamodb.retry.duration anpassen:

SET dynamodb.retry.duration=2;

Der Wert muss eine Ganzzahl ungleich Null sein, die die Anzahl der Minuten im Wiederholungsintervall darstellt. Der Standardwert für dynamodb.retry.duration ist 2 (Minuten).

Parallele Datenanforderungen

Mehrere Datenanforderungen, entweder von mehr als einem Benutzer oder mehr als einer Anwendung, an eine einzelne Tabelle kann den bereitgestellten Lesedurchsatz erschöpfen und die Leistung beeinträchtigen.

Prozessdauer

Die Datenkonsistenz in DynamoDB hängt von der Reihenfolge der Lese- und Schreibvorgänge auf den einzelnen Knoten ab. Während eine Hive-Abfrage verarbeitet wird, kann eine andere Anwendung neue Daten in die DynamoDB-Tabelle laden oder vorhandene Daten ändern oder löschen. In diesem Fall enthalten die Ergebnisse der Hive-Abfrage möglicherweise nicht die Datenänderungen, die vorgenommen wurden, während die Abfrage ausgeführt wurde.

Abfragezeit

Wenn Hive-Abfragen, die auf eine DynamoDB-Tabelle zugreifen, für Zeiten geplant werden, in denen wenig Anforderungen an die DynamoDB-Tabelle gerichtet werden, verbessert das die Leistung. Beispiel: Wenn die Mehrzahl der Benutzer Ihrer Anwendung in Hamburg leben, können Sie die täglichen Daten um 04:00 Uhr MEZ exportieren, wenn die meisten Benutzer schlafen und keine Datensätze in Ihrer DynamoDB-Datenbank aktualisieren.