에 의해 전송된 데이터 필터링AWS DataSync - AWS DataSync

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에 의해 전송된 데이터 필터링AWS DataSync

AWS DataSync데이터의 하위 집합 (예: 특정 파일, 폴더 또는 개체) 만 전송하려는 경우에만 필터를 적용할 수 있습니다.

예를 들어 소스 위치에 로.tmp 끝나는 임시 파일이 포함된 경우 해당 파일이 대상 위치로 이동하지 않도록 하는 제외 필터를 만들 수 있습니다. 또한 동일한 작업에서 제외 필터와 포함 필터를 함께 사용할 수 있습니다.

용어, 정의 및 구문 필터링

필터링에 사용할 수 있는 몇 가지 용어 및 정의는 다음과 같습니다.

Filter

특정 필터를 구성하는 전체 문자열 (예:*.tmp|*.temp 또는/folderA|/folderB)

필터는 | (파이프) 로 구분된 패턴으로 구성됩니다. 콘솔에서 패턴을 추가할 때는 각 패턴을 개별적으로 추가하므로 구분 기호가 필요하지 않습니다.

참고

필터는 대/소문자를 구분합니다. 예를 들어, 필터가 일치하지/folderA 않습니다/FolderA.

Pattern

필터 내 패턴입니다. 예를 들어,*.tmp*.tmp|*.temp 필터의 일부인 패턴입니다.

폴더
  • 모든 필터는 소스 위치 경로와 관련이 있습니다. 예를 들어 원본 위치 및 작업을 만들 때 원본 경로로 지정하고/my_source/ 포함 필터를 지정한다고 가정해 보겠습니다/transfer_this/. 이 경우/my_source/transfer_this/ 디렉터리와 해당 내용만DataSync 전송합니다.

  • 소스 위치 바로 아래에 폴더를 지정하려면 폴더 이름 앞에 슬래시 (/) 를 포함하십시오. 이전 예제에서 패턴은 transfer_this가 아닌 /transfer_this를 사용합니다.

  • DataSync는 다음 패턴을 동일한 방식으로 해석하고 폴더와 해당 내용을 모두 일치시킵니다.

    /dir

    /dir/

  • Amazon S3 버킷에서 또는 버킷으로 데이터를 전송할 때 객체 키의/ 문자를 파일 시스템의 폴더와 동일한 것으로DataSync 취급합니다.

특수 문자

필터링에 사용할 특수 문자는 다음과 같습니다.

특수 캐릭터 설명

*(와일드카드)

0개 이상의 문자를 일치시키는 데 사용되는 문자입니다. 예를 들어, /movies_folder*/movies_folder/movies_folder1 모두와 일치합니다.

|(파이프 구분 기호)

패턴 간 구분 기호로 사용되는 문자입니다. 이 문자를 사용하면 각각 필터와 일치하는 여러 패턴을 지정할 수 있습니다. 예를 들어, *.tmp|*.temptmp 또는 temp로 끝나는 파일과 일치합니다.

참고

콘솔에서 패턴을 추가할 때는 각 패턴을 별도의 줄에 추가하므로 이 구분 기호는 필요하지 않습니다.

\(백슬래시)

파일 또는 객체 이름에서 특수 문자 (*, |,\) 를 이스케이프 처리하는 데 사용되는 문자입니다.

백슬래시가 파일 이름의 일부인 경우 이중 백슬래시(\\)가 필요합니다. 마찬가지로, \\\\는 파일 이름에 두 개의 연속된 백슬래시가 있음을 나타냅니다.

파이프가 파일 이름의 일부인 경우 백슬래시 뒤 파이프(\|)가 필요합니다.

패턴 끝에 있는 백슬래시 (\) 뒤에 오는 다른 문자는 무시됩니다.

전송에서 데이터 제외

제외 필터는 소스 위치에서 대상 위치로 파일을 전송할 때 제외되는 파일, 폴더 및 객체를 정의합니다. 작업을 생성, 편집 또는 시작할 때 이러한 필터를 구성할 수 있습니다.

DataSync콘솔에서 제외 필터를 사용하여 작업을 만들려면 제외 패턴의 데이터 전송 구성 섹션에서 패턴 목록을 지정하십시오. 예를 들어tmp,temp 또는 라는 임시 폴더를 제외하려면 패턴 제외 텍스트*/temp 상자에서 지정하고 패턴 추가를 선택한 다음 두 번째 텍스트*/tmp 상자에서 지정할 수 있습니다. 필터에 더 많은 패턴을 추가하려면 Add pattern(패턴 추가)을 선택합니다. AWS Command Line Interface(AWS CLI) 를 사용할 때는 필터 주위에 작은따옴표 (') 가 필요하며 | (파이프) 는 구분 기호로 사용됩니다. 이 예제에서는'*/temp |를 지정합니다*/tmp'.

작업을 생성한 후 작업 구성을 편집하여 제외 필터에서 패턴을 추가하거나 제거할 수 있습니다. 변경 내용은 future 작업 실행에 적용됩니다.

작업을 실행할 때 오버라이드와 함께 시작 옵션을 사용하여 제외 필터 패턴을 수정할 수 있습니다. 모든 변경 사항은 해당 작업 실행에만 적용됩니다.

를AWS CLI 사용하여 예외 필터를 생성하거나 편집할 수도 있습니다. 다음은 이러한 CLI 명령을 보여주는 예제입니다.

aws datasync create-task --source-location-arn 'arn:aws:datasync:region:account-id:location/location-id' --destination-location-arn 'arn:aws:datasync:region:account-id:location/location-id' --cloud-watch-log-group-arn 'arn:aws:logs:region:account-id:log-group:your-log-group' --name your-task-name --excludes FilterType=SIMPLE_PATTERN,Value='*/temp|*/tmp'
참고

NetApp시스템에서 파일을 마이그레이션하는 경우 제외 필터에 패턴을*/.snapshot 지정하여NetApp 백업 폴더를 제외하는 것이 좋습니다.

전송에 데이터 포함

포함 필터는 작업을 실행할 때DataSync 전송되는 파일, 폴더 및 객체를 정의합니다. 작업을 생성, 편집 또는 시작할 때 포함 필터를 구성할 수 있습니다.

포함 필터를 사용하여 작업을 만들려면 특정 파일 및 폴더 옵션을 선택한 다음 포함 패턴에서 포함할 패턴 목록을 지정합니다.

DataSync포함 필터와 일치하는 파일 및 폴더만 스캔하고 전송합니다. 예를 들어 소스 폴더의 하위 집합을 포함하려면/important_folder_1 |를 지정할 수/important_folder_2 있습니다.

작업을 생성한 후 작업 구성을 편집하여 포함 필터에서 패턴을 추가하거나 제거할 수 있습니다. 모든 변경 사항은 future 작업 실행에 적용됩니다.

작업을 실행할 때 오버라이드와 함께 시작 옵션을 사용하여 포함 필터 패턴을 수정할 수 있습니다. 모든 변경 사항은 해당 작업 실행에만 적용됩니다.

를 사용하여AWS CLI asre를 생성하거나 편집할 수도 있습니다. 다음은 해당 CLI 명령을 보여주는 예제입니다. 필터 주위의 따옴표 (') 와 구분 기호로 사용되는| (파이프) 를 기록해 두십시오.

aws datasync start-task-execution --task-arn 'arn:aws:datasync:region:account-id:task/task-id' --includes FilterType=SIMPLE_PATTERN,Value='/important_folder1|/important_folder2'
참고

포함 필터는 와일드카드 (*) 문자를 패턴의 맨 오른쪽 문자로만 지원합니다. 예를 들어/documents*/code* |는 지원되지만*.txt 지원되지 않습니다.

예제 필터

다음은 와 함께 사용할 수 있는 일반 필터를 보여주는 예제입니다DataSync.

참고

필터에 사용할 수 있는 문자 수에는 제한이 있습니다. 자세한 정보는 DataSync작업 할당량을 참조하세요.

소스 위치에서 일부 폴더 제외

경우에 따라 원본 위치의 폴더를 대상 위치로 복사하지 않도록 제외할 수 있습니다. 예를 들어, 임시work-in-progress 폴더가 있을 수 있습니다. 또는NetApp 시스템을 사용하고 백업 폴더를 제외하려는 경우가 있을 수 있습니다. 이 경우 다음 필터를 사용할 수 있습니다.

*/.snapshot

비슷한 콘텐츠 (예:/reports2021/reports2022)) 를 가진 폴더를 제외하려면 다음과 같은 제외 필터를 사용할 수 있습니다.

/reports*

파일 계층 구조의 모든 수준에서 폴더를 제외하려면 다음과 같은 제외 필터를 사용할 수 있습니다.

*/folder-to-exclude-1|*/folder-to-exclude-2

소스 위치의 최상위 수준에 있는 폴더를 제외하려면 다음과 같은 제외 필터를 사용할 수 있습니다.

/top-level-folder-to-exclude-1|/top-level-folder-to-exclude-2

원본 위치에 폴더의 하위 집합을 포함시키십시오.

소스 위치가 많이 공유되어 루트 아래에 있는 폴더의 일부를 전송해야 하는 경우가 있을 수 있습니다. 특정 폴더를 포함하려면 다음과 같은 포함 필터가 있는 작업 실행을 시작합니다.

/folder-to-transfer/*

특정 파일 유형 제외

전송에서 특정 파일 유형을 제외하려면 *.temp와 같은 제외 필터가 있는 작업 실행을 생성하면 됩니다.

지정한 개별 파일 전송

개별 파일 목록을 전송하려면 다음과 같은 포함 필터를 사용하여 작업 실행을 시작하십시오. "/folder/subfolder/file1.txt|/folder/subfolder/file2.txt |/folder/subfolder/file2.txt