쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

Amazon SageMaker 특성 저장소 오프라인 저장소 데이터 형식

포커스 모드
Amazon SageMaker 특성 저장소 오프라인 저장소 데이터 형식 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker 특성 저장소는 오프라인 저장소에 대한 AWS Glue 및 Apache Iceberg 테이블 형식을 지원합니다. 새 특성 그룹을 생성할 때 테이블 형식을 선택할 수 있습니다.는 기본 형식 AWS Glue 입니다.

Amazon SageMaker 특성 저장소 오프라인 저장소 데이터는 계정 내 Amazon S3 버킷에 저장됩니다. PutRecord 호출 시 15분 이내에 데이터가 버퍼 및 일괄 처리되어 Amazon S3에 기록됩니다. 특성 저장소는 오프라인 저장소에 데이터를 쓸 때만 Parquet 파일 형식을 지원합니다. 특히 오프라인 저장소에 데이터를 쓸 때 Amazon S3 버킷에서 Parquet 형식으로 데이터를 검색할 수 있습니다. 각 파일은 여러 Record를 포함할 수 있습니다.

Iceberg 형식의 경우 특성 저장소는 오프라인 저장소 데이터를 저장하는 데 사용하는 것과 동일한 Amazon S3 버킷에 테이블의 메타데이터를 저장합니다. metadata 접두사 아래에서 찾을 수 있습니다.

또한 특성 저장소는 OfflineStoreconfig.s3StorageConfig.resolvedOutputs3 URI 필드를 노출하며, 이 필드는 DescribeFeatureGroup API 직접 호출에서 찾을 수 있습니다. 이 경로는 특정 특성 그룹의 파일이 작성되는 S3 경로입니다.

다음 추가 필드는 오프라인 저장소에 남아 있을 때 특성 저장소에서 각 레코드에 추가합니다.

  • api_invocation_time - 서비스가 PutRecord또는 DeleteRecord호출을 수신할 때의 타임스탬프입니다. 관리형 수집(예: Data Wrangler)을 사용하는 경우 오프라인 저장소에 데이터가 기록된 시점의 타임스탬프입니다.

  • write_time - 오프라인 저장소에 데이터가 기록된 시점의 타임스탬프입니다. 타임 트래블 관련 쿼리를 구성하는 데 사용할 수 있습니다.

  • is_deleted – 기본값은 False입니다. DeleteRecord 호출 시 새 RecordRecordIdentifierValue에 삽입되고 오프라인 저장소의 True로 설정됩니다.

Amazon SageMaker 특성 저장소 오프라인 저장소 URI 구조

다음 예제에서 amzn-s3-demo-bucket은 계정 내의 Amazon S3 버킷, example-prefix는 예제 접두사, 111122223333은 계정 ID, AWS 리전은 리전, feature-group-name은 특성 그룹 이름입니다.

AWS Glue 테이블 형식

AWS Glue 테이블 형식을 사용하여 저장된 오프라인 저장소의 레코드는 이벤트 시간별로 시간별 파티션으로 분할됩니다. 파티션 체계는 구성할 수 없습니다. 다음 URI 구조는 AWS Glue 형식을 사용한 Parquet 파일 구성을 보여줍니다.

s3://amzn-s3-demo-bucket/example-prefix/111122223333/sagemaker/AWS 리전/offline-store/feature-group-name-feature-group-creation-time/data/year=year/month=month/day=day/hour=hour/timestamp_of_latest_event_time_in_file_16-random-alphanumeric-digits.parquet

다음 예제는 feature-group-namecustomer-purchase-history-patterns인 파일에 대한 Parquet 파일의 출력 위치입니다.

s3://amzn-s3-demo-bucket/example-prefix/111122223333/sagemaker/AWS 리전/offline-store/customer-purchase-history-patterns-1593511200/data/year=2020/month=06/day=31/hour=00/20200631T064401Z_108934320012Az11.parquet

Iceberg 테이블 형식

Iceberg 테이블 형식으로 저장된 오프라인 저장소의 레코드는 이벤트 시간별로 일일 파티션으로 분할됩니다. 파티션 체계는 구성할 수 없습니다. 다음 URI 구조는 Iceberg 테이블 형식으로 저장된 데이터 파일의 구성을 보여줍니다.

s3://amzn-s3-demo-bucket/example-prefix/111122223333/sagemaker/AWS 리전/offline-store/feature-group-name-feature-group-creation-time/data/8-random-alphanumeric-digits/event-time-feature-name_trunc=event-time-year-event-time-month-event-time-day/timestamp-of-latest-event-time-in-file_16-random-alphanumeric-digits.parquet

다음 예제는 feature-group-namecustomer-purchase-history-patterns, event-time-feature-nameEventTime인 파일에 대한 Parquet 파일의 출력 위치입니다.

s3://amzn-s3-demo-bucket/example-prefix/111122223333/sagemaker/AWS 리전/offline-store/customer-purchase-history-patterns-1593511200/data/0aec19ca/EventTime_trunc=2022-11-09/20221109T215231Z_yolTtpyuWbkaeGIl.parquet

다음 예제는 Iceberg 테이블 형식으로 저장된 데이터 파일의 메타데이터 파일 위치입니다.

s3://amzn-s3-demo-bucket/example-prefix/111122223333/sagemaker/AWS 리전/offline-store/feature-group-name-feature-group-creation-time/metadata/
프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.