功能处理器SDK数据源 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

功能处理器SDK数据源

SDK适用于 Python 的亚马逊 SageMaker 功能商店功能处理器 (Boto3) 提供了从存储在 Amazon S3 中的功能组或对象加载数据的结构。有关功能存储提供的数据源定义的完整列表,请参阅功能处理器数据源功能存储 Python SDK

有关如何使用功能存储 Python SDK 数据源定义的示例,请参阅常见使用案例的特征处理代码示例

FeatureGroupDataSource

FeatureGroupDataSource 用于将特征组指定为特征处理器的输入数据源。可以从离线存储特征组加载数据。尝试从在线存储特征组加载数据将会导致验证错误。您可以指定开始偏移和结束偏移,将加载的数据限制在特定时间范围内。例如,可以指定一个“14 天”的开始偏移,以便仅加载最近两周的数据;还可以指定一个“7 天”的结束偏移,以便将输入限制为前一周的数据。

Feature Store 提供的数据源定义

Feature Store Python SDK 包含可用于为特征处理器指定各种输入数据源的数据源定义。这些资源包括 P CSV arquet 和 Iceberg 桌子来源。有关功能存储提供的数据源定义的完整列表,请参阅功能处理器数据源功能存储 Python SDK