Lustre 데이터 압축 - FSx for Lustre

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Lustre 데이터 압축

Lustre 데이터 압축 기능을 사용하면 고성능 Amazon FSx for Lustre 파일 시스템 및 백업 스토리지에서 비용을 절감할 수 있습니다. 데이터 압축이 활성화되면 Amazon FSx for Lustre는 새로 작성된 파일을 디스크에 쓰기 전에 자동으로 압축하고, 읽을 때 자동으로 압축을 해제합니다.

데이터 압축은 파일 시스템 성능에 부정적인 영향을 주지 않으면서 높은 수준의 압축을 제공하도록 최적화된 LZ4 알고리즘을 사용합니다. LZ4는 커뮤니티에서 신뢰하는 성능 지향적인 Lustre 알고리즘으로, 압축 속도와 압축된 파일 크기 사이의 균형을 제공합니다. 일반적으로 데이터 압축을 활성화해도 지연 시간에 측정 가능한 영향을 미치지는 않습니다.

데이터 압축은 Amazon FSx for Lustre 파일 서버와 스토리지 간에 전송되는 데이터의 양을 줄입니다. 아직 압축된 파일 형식을 사용하고 있지 않은 경우, 데이터 압축을 사용하면 전체 파일 시스템 처리량 용량이 증가하는 것을 확인할 수 있습니다. 데이터 압축과 관련된 처리량 용량 증가는 프런트 엔드 네트워크 인터페이스 카드를 가득 채운 후에 제한됩니다.

예를 들어 파일 시스템이 PERSISTENT-50 SSD 배포 유형인 경우 네트워크 처리량의 기준은 스토리지 TiB당 250MBps입니다. 디스크 처리량의 기준은 TiB당 50MBps입니다. 데이터 압축을 사용하면 디스크 처리량이 TiB당 50MBps에서 기준 네트워크 처리량 한도인 TiB당 최대 250MBps로 증가할 수 있습니다. 네트워크 및 디스크 처리량 제한에 대한 자세한 내용은 파일 시스템 성능 총계의 파일 시스템 성능 표를 참조하세요. 데이터 압축 성능에 대한 자세한 내용은 AWS 스토리지 블로그Amazon FSx for Lustre 데이터 압축으로 성능은 높이면서 비용 절감하기 게시물을 참조하세요.

데이터 압축 관리

Amazon FSx for Lustre 파일 시스템을 생성할 때 데이터 압축을 켜거나 끌 수 있습니다. 콘솔 AWS CLI또는 API에서 Amazon FSx for Lustre 파일 시스템을 생성하면 데이터 압축이 기본적으로 꺼집니다.

  1. https://console.aws.amazon.com/fsx/에서 Amazon FSx 콘솔을 엽니다.

  2. 시작하기 섹션의 1단계: FSx for Lustre 파일 시스템 생성 섹션에 설명된 새 파일 시스템 생성 절차를 따릅니다.

  3. 파일 시스템 세부 정보 섹션에서 데이터 압축 유형으로 LZ4를 선택합니다.

  4. 새 파일 시스템을 생성할 때와 마찬가지로 마법사를 완료합니다.

  5. 검토 및 생성을 선택합니다.

  6. Amazon FSx for Lustre 파일 시스템의 선택한 설정을 검토한 다음 파일 시스템 생성을 선택합니다.

파일 시스템을 사용할 수 있게 되면 데이터 압축이 켜집니다.

  • 데이터 압축이 활성화된 상태에서 FSx for Lustre 파일 시스템을 생성하려면 다음 그림과 같이 Amazon FSx CLI 명령 create-file-systemDataCompressionType 파라미터와 함께 사용합니다. 해당 API 작업은 CreateFileSystem 입니다.

    $ aws fsx create-file-system \ --client-request-token CRT1234 \ --file-system-type LUSTRE \ --file-system-type-version 2.12 \ --lustre-configuration DeploymentType=PERSISTENT_1,PerUnitStorageThroughput=50,DataCompressionType=LZ4 \ --storage-capacity 3600 \ --subnet-ids subnet-123456 \ --tags Key=Name,Value=Lustre-TEST-1 \ --region us-east-2

파일 시스템을 생성한 후 Amazon FSx에서는 다음 예에서처럼 파일 시스템 설명을 JSON으로 반환합니다.

{ "FileSystems": [ { "OwnerId": "111122223333", "CreationTime": 1549310341.483, "FileSystemId": "fs-0123456789abcdef0", "FileSystemType": "LUSTRE", "FileSystemTypeVersion": "2.12", "Lifecycle": "CREATING", "StorageCapacity": 3600, "VpcId": "vpc-123456", "SubnetIds": [ "subnet-123456" ], "NetworkInterfaceIds": [ "eni-039fcf55123456789" ], "DNSName": "fs-0123456789abcdef0.fsx.us-east-2.amazonaws.com", "ResourceARN": "arn:aws:fsx:us-east-2:123456:file-system/fs-0123456789abcdef0", "Tags": [ { "Key": "Name", "Value": "Lustre-TEST-1" } ], "LustreConfiguration": { "DeploymentType": "PERSISTENT_1", "DataCompressionType": "LZ4", "PerUnitStorageThroughput": 50 } } ] }

기존 파일 시스템의 데이터 압축 구성을 변경할 수도 있습니다. 기존 파일 시스템의 데이터 압축을 켜면 새로 작성된 파일만 압축되고 기존 파일은 압축되지 않습니다. 자세한 내용은 이전에 작성한 파일 압축 섹션을 참조하세요.

  1. https://console.aws.amazon.com/fsx/에서 Amazon FSx 콘솔을 엽니다.

  2. 파일 시스템으로 이동하여 데이터 압축을 관리할 Lustre 파일 시스템을 선택합니다.

  3. 작업에서 데이터 압축 유형 업데이트를 선택합니다.

  4. 데이터 압축 유형 업데이트 대화 상자에서 데이터 압축을 켜려면 LZ4를 선택하고, 끄려면 없음을 선택합니다.

  5. 업데이트를 선택합니다.

  6. 업데이트 탭의 파일 시스템 세부 정보 페이지에서 업데이트 진행 상황을 모니터링할 수 있습니다.

기존 FSx for Lustre 파일 시스템의 데이터 압축 구성을 업데이트하려면 update-file-system AWS CLI 명령을 사용합니다. 다음 파라미터를 설정합니다.

  • --file-system-id를 업데이트하려는 파일 시스템의 ID로 설정합니다.

  • --lustre-configuration DataCompressionTypeNONE으로 설정하여 데이터 압축을 끄거나 LZ4를 LZ4 알고리즘을 사용하여 데이터 압축을 켜도록 설정합니다.

이 명령은 데이터 압축이 LZ4 알고리즘으로 켜지도록 지정합니다.

$ aws fsx update-file-system \ --file-system-id fs-0123456789abcdef0 \ --lustre-configuration DataCompressionType=LZ4

백업에서 파일 시스템을 생성할 때의 데이터 압축 구성

사용 가능한 백업을 사용하여 새로운 Amazon FSx for Lustre 파일 시스템을 생성할 수 있습니다. 백업에서 새 파일 시스템을 생성할 때는 백업의 DataCompressionType 설정을 사용하여 설정이 적용되므로 DataCompressionType을 지정할 필요가 없습니다. 백업에서 생성할 때 DataCompressionType을 지정하도록 선택한 경우 값이 백업 DataCompressionType 설정과 일치해야 합니다.

백업에 대한 설정을 보려면 Amazon FSx 콘솔의 백업 탭에서 해당 설정을 선택합니다. 백업의 세부 정보는 백업의 요약 페이지에 나열됩니다. describe-backups AWS CLI 명령을 실행할 수도 있습니다(동등한 API 작업은 ). DescribeBackups

이전에 작성한 파일 압축

Amazon FSx for Lustre 파일 시스템에서 데이터 압축이 해제되었을 때 생성된 파일은 압축되지 않습니다. 데이터 압축을 켜도 기존의 압축되지 않은 데이터는 자동으로 압축되지 않습니다.

Lustre 클라이언트 설치의 일부로 설치된 lfs_migrate 명령을 사용하여 기존 파일을 압축할 수 있습니다. 예를 들어 GitHub에서 사용할 수 있는 FSxL 압축을 참조하세요.

파일 크기 보기

다음 명령을 사용하여 파일 및 디렉터리의 압축되지 않은 크기 및 압축된 크기를 볼 수 있습니다.

  • du 압축된 크기를 표시합니다.

  • du --apparent-size 압축되지 않은 크기를 표시합니다.

  • ls -l 압축되지 않은 크기를 표시합니다.

다음 예제는 동일한 파일이 있는 각 명령의 출력을 보여줍니다.

$ du -sh samplefile 272M samplefile $ du -sh --apparent-size samplefile 1.0G samplefile $ ls -lh samplefile -rw-r--r-- 1 root root 1.0G May 10 21:16 samplefile

-h 옵션은 사람이 읽을 수 있는 형식으로 크기를 인쇄하므로 이러한 명령에 유용합니다.

CloudWatch 지표 사용

Amazon CloudWatch Logs 지표를 사용하여 파일 시스템 사용량을 확인할 수 있습니다. LogicalDiskUsage 지표는 총 논리적 디스크 사용량(압축 제외)을 PhysicalDiskUsage 지표는 총 물리적 디스크 사용량(압축 포함)을 보여줍니다. 이 두 지표는 파일 시스템에서 데이터 압축을 활성화했거나 이전에 활성화한 경우에만 사용할 수 있습니다.

LogicalDiskUsage 통계의 SumPhysicalDiskUsage 통계의 Sum으로 나누어 파일 시스템의 압축률을 확인할 수 있습니다.

파일 시스템의 성능 모니터링에 대한 자세한 내용은 Amazon FSx for Lustre 파일 시스템 모니터링 섹션을 참조하세요.