SDKFeature-Prozessor-Datenquellen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SDKFeature-Prozessor-Datenquellen

Der Amazon SageMaker Feature Store Feature Processor SDK for Python (Boto3) bietet Konstrukte zum Laden von Daten aus Feature-Gruppen oder Objekten, die in Amazon S3 gespeichert sind. Eine vollständige Liste der vom Feature Store bereitgestellten Datenquellendefinitionen finden Sie in der Feature Processor-Datenquelle Feature Store Python SDK.

Beispiele zur Verwendung der SDK Python-Datenquellendefinitionen des Feature Store finden Sie unterBeispiel für Feature-Verarbeitungs-Code für allgemeine Anwendungsfälle.

FeatureGroupDataSource

Das FeatureGroupDataSource wird verwendet, um eine Feature-Gruppe als Eingabedatenquelle für einen Feature-Prozessor anzugeben. Daten können aus einer Feature-Gruppe im Offline-Speicher geladen werden. Der Versuch, Ihre Daten aus einer Onlineshop-Featuregruppe zu laden, führt zu einem Validierungsfehler. Sie können Start- und Endversätze angeben, um die Daten, die geladen werden, auf einen bestimmten Zeitraum zu beschränken. Sie können beispielsweise einen Startversatz von „14 Tagen“ angeben, um nur die Daten der letzten zwei Wochen zu laden, und Sie können zusätzlich einen Endversatz von „7 Tagen“ angeben, um die Eingabe auf die Daten der letzten Woche zu beschränken.

Vom Feature Store bereitgestellte Datenquellendefinitionen

Der Feature Store Python SDK enthält Datenquellendefinitionen, mit denen verschiedene Eingabedatenquellen für einen Feature-Prozessor angegeben werden können. Dazu gehören CSV die Tabellenquellen Parquet und Iceberg. Eine vollständige Liste der vom Feature Store bereitgestellten Datenquellendefinitionen finden Sie in der Feature Processor-Datenquelle Feature Store Python SDK.