Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
HyperLogLog skizzen
In diesem Thema wird beschrieben, wie Sie HyperLogLog Skizzen in Amazon Redshift verwenden. HyperLogLog ist ein Algorithmus für das Count-Distinct Problem, bei dem die Anzahl der unterschiedlichen Elemente in einem Datensatz approximiert wird. HyperLogLog Skizzen sind Anordnungen von Eindeutigkeitsdaten eines Datensatzes.
HyperLogLogist ein Algorithmus, der zur Schätzung der Kardinalität eines Multisets verwendet wird. Kardinalität bezieht sich auf die Anzahl der einzelnen Werte in einer Multimenge. Zum Beispiel: In der Menge {4,3,6,2,2,6,4,3,6,2,2,3} ist die Kardinalität 4, da die einzelnen Werte 4, 3, 6 und 2 sind.
Die Genauigkeit des HyperLogLog Algorithmus (auch als M-Wert bezeichnet) kann sich auf die Genauigkeit der geschätzten Kardinalität auswirken. Während der Kardinalitätsschätzung verwendet Amazon Redshift einen Standardgenauigkeitswert von 15. Bei kleineren Datensätzen ist ein Wert von bis zu 26 möglich. Die durchschnittliche relative Fehlerquote liegt also zwischen 0,01 und 0,6 %.
Bei der Berechnung der Kardinalität einer Mehrfachmenge generiert der HyperLogLog Algorithmus ein Konstrukt, das als Skizze bezeichnet wird. HLL Eine HLLSkizze enthält Informationen über die unterschiedlichen Werte in einem Multiset. Der Amazon Redshift Redshift-Datentyp HLLSKETCH steht für solche Sketch-Werte. Der Datentyp kann verwendet werden, um Skizzen in einer Amazon-Redshift-Tabelle zu speichern. Darüber hinaus unterstützt Amazon Redshift Operationen, die auf HLLSKETCH Werte als Aggregat- und Skalarfunktionen angewendet werden können. Sie können diese Funktionen verwenden, um die Kardinalität eines Werts zu extrahieren HLLSKETCH und mehrere Werte zu kombinieren. HLLSKETCH
Der HLLSKETCH Datentyp bietet erhebliche Vorteile bei der Abfrageleistung beim Extrahieren der Kardinalität aus großen Datensätzen. Sie können diese Datensätze mithilfe von HLLSKETCH Werten vorab aggregieren und in Tabellen speichern. Amazon Redshift kann die Kardinalität direkt aus den gespeicherten HLLSKETCH Werten extrahieren, ohne auf die zugrunde liegenden Datensätze zugreifen zu müssen.
Bei der Verarbeitung von HLL Skizzen führt Amazon Redshift Optimierungen durch, die den Speicherbedarf der Skizze minimieren und die Präzision der extrahierten Kardinalität maximieren. Amazon Redshift verwendet zwei Repräsentationen für HLL Skizzen: dünn und dicht. An HLLSKETCH beginnt im Format Sparse. Wenn neue Werte in eingefügt werden, nimmt die Größe zu. Wenn die Größe die Größe der ausführlichen Darstellung erreicht hat, konvertiert Amazon Redshift die Skizze automatisch von rudimentär zu ausführlich.
Amazon Redshift importiert, exportiert und druckt so, HLLSKETCH JSON als ob die Skizze in einem Sparse-Format vorliegt. Amazon Redshift importiert, exportiert und druckt eine HLLSKETCH als Base64-Zeichenfolge, wenn die Skizze ein dichtes Format hat. Weitere Informationen zu finden Sie UNLOAD unter. Der HLLSKETCH Datentyp wird entladen Verwenden Sie den Befehl, um Text- oder kommagetrennte Wertdaten (CSV) in Amazon Redshift zu importieren. COPY Weitere Informationen finden Sie unter Der Datentyp wird HLLSKETCH geladen.
Hinweise zu Funktionen, die mit HyperLogLog verwendet werden, finden Sie unter. HyperLogLog Funktionen