기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
동적 파티셔닝을 사용하면 데이터 내의 키(예: customer_id
또는 transaction_id
)를 사용하여 Firehose의 스트리밍 데이터를 지속적으로 분할한 다음 이 키에 의해 그룹화된 데이터를 해당되는 Amazon Simple Storage Service(Amazon S3) 접두사로 전달할 수 있습니다. 따라서 Amazon Athena, Amazon EMR, Amazon Redshift Spectrum, Amazon QuickSight와 같은 다양한 서비스를 사용하여 Amazon S3의 스트리밍 데이터에 대한 고성능 비용 효율적인 분석을 더 쉽게 실행할 수 있습니다. 또한 AWS Glue는 추가 처리가 필요한 사용 사례에서 동적으로 분할된 스트리밍 데이터를 Amazon S3로 전송한 후 더욱 정교한 추출, 전환, 적재(ETL) 작업을 수행할 수 있습니다.
데이터 파티셔닝을 통해 스캔되는 데이터 양을 최소화하고 성능을 최적화하며 Amazon S3의 분석 쿼리 비용을 절감할 수 있습니다. 또한 데이터에 대한 세분화된 액세스를 향상시킵니다. Firehose 스트림은 일반적으로 데이터를 캡처하여 Amazon S3로 로드하기 위해 사용됩니다. Amazon S3 기반 분석을 위해 스트리밍 데이터 세트를 분할하려면, 분석에 데이터를 제공하기에 앞서 Amazon S3 버킷 간에 파티셔닝 애플리케이션을 실행해야 하는데, 이는 복잡하거나 비용이 많이 들 수 있습니다.
Firehose는 동적 파티셔닝을 통해 동적 또는 정적으로 정의된 데이터 키를 사용하여 전송 중인 데이터를 지속적으로 그룹화하고, 해당 데이터를 키별 Amazon S3 접두사에 전달합니다. 이렇게 하면 인사이트 획득 시간을 몇 분 또는 몇 시간 단축할 수 있습니다. 또한 비용을 절감하고 아키텍처를 단순화할 수 있습니다.