Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Der Offline-Speicher wird für historische Daten verwendet, wenn ein Abruf in Sekundenbruchteilen nicht erforderlich ist. Er wird in der Regel für die Datenexploration, das Modelltraining und die Batch-Inferenz verwendet.
Wenn Sie sowohl den Online- als auch den Offline-Speicher für Ihre Feature-Gruppe aktivieren, werden beide Speicher synchronisiert, um Diskrepanzen zwischen Trainings- und Bereitstellungsdaten zu vermeiden. Bitte beachten Sie, dass eine Onlineshop-Funktionsgruppe mit aktiviertem InMemory
Speichertyp derzeit keine entsprechende Featuregruppe im Offline-Speicher unterstützt (keine Online-zu-Offline-Replikation). Weitere Informationen zur Bereitstellung von ML-Modellen im Amazon SageMaker Feature Store finden Sie unterOnline-Geschäft.
Der Offline-Speicher enthält die folgenden TableFormat
Optionen. Informationen zu den Inhalten des Offline-Shops finden Sie OfflineStoreConfig
in der Amazon SageMaker API-Referenz.
Klebetabellenformat
Das Glue
Format (Standard) ist ein Standardtabellenformat vom Typ Hive für AWS Glue. Mit AWS Glue können Sie Daten aus mehreren Quellen ermitteln, aufbereiten, verschieben und integrieren. Es umfasst auch zusätzliche Produktivitäts- und Datenops-Tools für die Erstellung, Ausführung von Aufträgen und die Implementierung von Geschäftsabläufen. Weitere Informationen zu AWS Glue finden Sie unter Was ist AWS Glue? .
Iceberg-Tabellenformat
Das Iceberg
Format (empfohlen) ist ein offenes Tabellenformat für sehr große Analysetabellen. Mit Iceberg
können Sie die kleinen Datendateien in weniger große Dateien in der Partition komprimieren, was zu deutlich schnelleren Abfragen führt. Dieser Komprimierungsvorgang erfolgt gleichzeitig und hat keine Auswirkungen auf laufende Lese- und Schreibvorgänge in der Featuregruppe. Weitere Informationen zur Optimierung von Iceberg-Tabellen finden Sie in Amazon Athena und in den AWS Lake FormationBenutzerhandbüchern.
Iceberg
verwaltet große Sammlungen von Dateien als Tabellen und unterstützt moderne analytische Data-Lake-Operationen. Wenn Sie Iceberg
diese Option beim Erstellen neuer Feature-Gruppen wählen, erstellt Amazon SageMaker Feature Store die Iceberg
Tabellen im Parquet-Dateiformat und registriert die Tabellen bei der AWS Glue Data Catalog. Weitere Informationen zu Iceberg
Tabellenformaten finden Sie unter Verwenden von Apache Iceberg-Tabellen.
Wichtig
Beachten Sie, dass Sie für Feature-Gruppen im Iceberg
Tabellenformat den Feature-Typ String
für die Eventzeit angeben müssen. Wenn Sie einen anderen Typ angeben, können Sie die Feature-Gruppe nicht erfolgreich erstellen.