사용자 지정 데이터 식별자 생성
사용자 지정 데이터 식별자는 Amazon Simple Storage Service(S3) 객체의 민감한 데이터를 감지하기 위해 정의하는 기준 집합입니다. 사용자 지정 데이터 식별자를 생성할 때 S3 객체에서 일치시킬 텍스트 패턴을 정의하는 정규 표현식(정규식)을 지정합니다. 또한 결과를 구체화하는 문자 시퀀스와 근접 규칙을 지정할 수 있습니다. 문자 시퀀스는 정규식과 일치하는 텍스트 근처에 있어야 하는 단어 또는 구문인 키워드이거나 결과에서 제외할 단어 또는 구문인 단어 무시일 수 있습니다. 사용자 지정 데이터 식별자를 사용하면 Amazon Macie가 제공하는 관리형 데이터 식별자를 보완하고 조직의 특정 시나리오, 지적 재산 또는 독점 데이터를 반영하는 민감한 데이터를 감지할 수 있습니다.
예를 들어, 많은 회사에서는 직원 ID에 대한 특정 구문을 사용합니다. 이러한 구문 중 하나는 직원이 상근직(F) 직원인지 비상근직(P) 직원인지를 나타내는 대문자, 하이픈(-), 직원을 식별하는 8자리 시퀀스가 그 뒤에 오는 것입니다. 예: 상근직 직원의 경우 F–12345678, 비상근직 직원의 경우 P–87654321 등이 있습니다. 사용자 지정 데이터 식별자를 생성하여 이 구문을 사용하는 직원 ID를 탐지하는 경우, 다음 [A-Z]-\d{8}
정규식을 사용할 수 있습니다. 분석을 세분화하고 오탐을 방지하기 위해 키워드(employee
및 employee ID
)를 사용하고 최대 20자의 일치 거리를 사용하도록 식별자를 구성할 수도 있습니다. 이러한 기준을 사용하면 텍스트가 직원 또는 직원 ID 키워드 뒤에 나오고 모든 텍스트가 해당 키워드 중 하나의 20자 이내인 경우에만 정규식과 일치하는 텍스트가 결과에 포함됩니다.
키워드를 사용하여 민감한 데이터를 찾고 오탐을 방지하는 방법에 대한 데모를 보려면 다음 동영상을 시청하십시오.
감지 기준 외에도, 사용자 지정 데이터 식별자가 생성하는 조사 결과에 대한 사용자 지정 심각도 설정을 선택적으로 지정할 수 있습니다. 심각도는 식별자의 감지 기준과 일치하는 텍스트 발생 횟수를 기반으로 할 수 있습니다. 이러한 설정을 지정하지 않으면 Macie는 식별자가 생성하는 모든 조사 결과에 중간 심각도를 자동으로 할당합니다. 심각도는 식별자의 감지 기준과 일치하는 텍스트의 발생 횟수에 따라 달라지지 않습니다.
이러한 설정과 기타 설정에 대한 자세한 내용은 사용자 지정 데이터 식별자에 대한 구성 옵션 섹션을 참조하세요.
사용자 지정 데이터 식별자를 생성하려면
다음 단계에 따라 Amazon Macie 콘솔을 사용하여 사용자 지정 데이터 식별자를 생성합니다. 에는 각 에 대한 기본 할당량(이전에는 제한이라고 함)이 있습니다.
https://console.aws.amazon.com/macie/
에서 Amazon Macie 콘솔을 엽니다. -
탐색 창의 설정에서 사용자 지정 데이터 식별자를 선택합니다.
-
생성(Create)을 선택합니다.
-
이름에서 사용자 지정 데이터 식별자의 이름을 입력합니다. 이름은 최대 128자까지 포함할 수 있습니다.
-
설명에 사용자 지정 데이터 식별자에 대한 간략한 설명을 선택적으로 입력합니다. 설명은 512자까지 포함할 수 있습니다.
참고
사용자 지정 데이터 식별자의 이름 또는 설명에는 어떠한 민감한 데이터도 포함하지 마세요. Macie에서 수행할 수 있는 작업에 따라 계정의 기타 사용자가 이름이나 설명을 볼 수 있습니다.
-
정규 표현식의 경우, 일치시킬 텍스트 패턴을 정의하는 정규 표현식(정규식)을 입력합니다. Regex는 최대 512자까지 포함할 수 있습니다.
Macie는 펄 호환 정규 표현식(PCRE) 라이브러리
에서 제공하는 패턴 구문의 하위 집합을 지원합니다. 자세한 내용과 팁은 사용자 지정 데이터 식별자에 대한 감지 기준을 참조하세요. -
키워드의 경우, 최대 50개의 문자 시퀀스(쉼표로 구분)를 선택적으로 입력하여 정규식 패턴과 일치하는 텍스트 근처에 있어야 하는 특정 텍스트를 정의합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 이러한 키워드 중 하나와 일치하는 최대 일치 거리 내에 있는 경우에만 결과에 해당 항목을 포함합니다. 각 키워드는 3~90개의 UTF-8 문자를 포함할 수 있습니다. 키워드는 대/소문자를 구분하지 않습니다
-
단어 무시 의 경우, 결과에서 제외할 특정 텍스트를 정의하는 최대 10개의 문자 시퀀스(쉼표로 구분)를 선택적으로 입력합니다.
Macie는 텍스트가 정규식 패턴과 일치하지만 이러한 단어 무시 중 하나를 포함하는 경우, 해당 항목을 결과에서 제외합니다. 각 단어 무시는 4~90개의 UTF-8 문자를 포함할 수 있습니다. 단어 무시는 대/소문자를 구분합니다.
-
최대 일치 거리의 경우, 키워드의 끝 및 정규식 패턴과 일치하는 텍스트 끝 사이에 존재할 수 있는 최대 문자 수를 선택적으로 입력합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 전체 키워드로부터 이 거리 내에 있는 경우에만 결과에 일치 항목을 포함합니다. 거리는 1~300자일 수 있습니다. 기본 거리는 50자입니다.
-
심각도의 경우 사용자 지정 데이터 식별자가 생성하는 민감한 데이터 조사 결과의 심각도를 결정하는 방법을 선택합니다.
-
모든 조사 결과에 중간 심각도를 자동으로 할당하려면 일치하는 개수에 대해 중간 심각도 사용(기본값)을 선택합니다. 이 옵션을 사용하면 Macie는 영향을 받는 S3 객체에 탐지 기준과 일치하는 텍스트가 한 번 이상 포함되어 있는지 여부에 대해 조사 결과에 중간 심각도를 자동으로 할당합니다.
-
지정한 발생 횟수 임곗값을 기반으로 심각도를 할당하려면 사용자 지정 설정을 사용하여 심각도 확인을 선택합니다. 그런 다음 발생 임곗값 및 심각도 수준 옵션을 사용하여 선택한 심각도의 조사 결과를 생성하기 위해 S3 객체에 존재해야 하는 최소 일치 개수를 지정합니다.
Macie가 지원하는 각 심각도 수준인 낮음(가장 심각하지 않음), 보통, 높음(가장 심각함)에 대해 최대 세 개의 발생 임계값을 지정할 수 있습니다. 두 개 이상 지정하는 경우, 임곗값은 심각도에 따라 오름차순으로 낮음에서 높음으로 이동해야 합니다. S3 객체의 발생 횟수가 최저 지정된 임곗값보다 적은 경우, Macie는 조사 결과를 생성하지 않습니다.
-
-
(선택 사항) 태그 에서 태그 추가를 선택한 다음 사용자 지정 데이터 식별자에 할당할 태그를 50개까지 입력합니다.
태그는 사용자가 정의하여 특정 유형의 AWS 리소스에 할당하는 레이블입니다. 각 태그는 필수 태그 키와 선택적 태그 값으로 구성됩니다. 태그를 사용하면 용도, 소유자, 환경 또는 기타 기준과 같은 다양한 방법으로 리소스를 식별, 분류, 관리하는 데 도움이 됩니다. 자세한 내용은 Macie 리소스 태그 지정(을)를 참조하세요.
-
(선택 사항) 평가의 경우, 샘플 데이터란에 최대 1,000자를 입력한 다음 테스트를 선택하여 탐지 기준을 테스트합니다. Macie는 샘플 데이터를 평가하여 기준과 일치하는 텍스트의 발생 횟수를 보고합니다. 이 단계를 원하는 만큼 반복하여 기준을 세분화하고 최적화할 수 있습니다.
참고
사용자 지정 데이터 식별자를 저장하기 전에 감지 기준을 테스트하고 수정하는 것이 좋습니다. 사용자 지정 데이터 식별자는 민감한 데이터 검색 작업에 사용되므로 사용자 지정 데이터 식별자를 저장한 후에는 편집할 수 없습니다. 이를 통해 수행하는 데이터 프라이버시 및 보호 감사 또는 조사에 대한 민감한 데이터 조사 결과 및 검색 결과에 대한 변경 불가능한 기록이 있는지 확인할 수 있습니다.
-
마쳤으면 제출을 선택합니다.
Macie는 설정을 테스트하여 정규식을 컴파일할 수 있는지 확인합니다. 설정 또는 정규식에 문제가 있는 경우 Macie는 문제를 설명하는 오류를 표시합니다. 문제를 해결한 후 사용자 지정 데이터 식별자를 저장할 수 있습니다. 그런 다음 해당 식별자를 사용하도록 민감한 데이터 검색 작업을 만들고 구성하거나 민감한 데이터 자동 검색 설정에 식별자를 추가할 수 있습니다.