특성 프로세서 SDK 데이터 소스 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

특성 프로세서 SDK 데이터 소스

Amazon SageMaker Feature Store Feature Processor SDK for Python(Boto3)은 Amazon S3에 저장된 특성 그룹 또는 객체에서 데이터를 로드하는 구성 요소를 제공합니다. 특성 저장소에서 제공하는 데이터 소스 정의의 전체 목록은 특성 프로세서 데이터 소스 특성 저장소 Python을 SDK참조하세요.

특성 저장소 Python SDK 데이터 소스 정의를 사용하는 방법에 대한 예제는 섹션을 참조하세요일반 사용 사례에 대한 특성 처리 코드 예시.

FeatureGroupDataSource

FeatureGroupDataSource는 특성 그룹을 특성 프로세서의 입력 데이터 소스로 지정하는 데 사용됩니다. 오프라인 저장소 특성 그룹에서 데이터를 로드할 수 있습니다. 온라인 저장소 특성 그룹에서 데이터를 로드하려고 하면 유효성 검사 오류가 발생합니다. 시작 및 종료 오프셋을 지정하여 로드되는 데이터를 특정 시간 범위로 제한할 수 있습니다. 예를 들어 시작 오프셋을 '14일'로 지정하여 지난 2주의 데이터만 로드하고 종료 오프셋을 '7일'로 추가로 지정하여 입력값을 이전 주 데이터로 제한할 수 있습니다.

특성 저장소가 제공하는 데이터 소스 정의

특성 저장소 Python에는 특성 프로세서에 대한 다양한 입력 데이터 소스를 지정하는 데 사용할 수 있는 데이터 소스 정의가 SDK 포함되어 있습니다. 여기에는 CSV, Parquet 및 Iceberg 테이블 소스가 포함됩니다. 특성 저장소에서 제공하는 데이터 소스 정의의 전체 목록은 특성 프로세서 데이터 소스 특성 저장소 Python을 SDK참조하세요.