기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 데이터 식별자 생성
사용자 지정 데이터 식별자는 Amazon Simple Storage Service(S3) 객체의 민감한 데이터를 감지하기 위해 정의하는 기준 집합입니다. 사용자 지정 데이터 식별자를 생성할 때 S3 객체에서 일치시킬 텍스트 패턴을 정의하는 정규 표현식(정규식)을 지정합니다. 또한 결과를 구체화하는 문자 시퀀스와 근접 규칙을 지정할 수 있습니다. 문자 시퀀스는 정규식과 일치하는 텍스트 근처에 있어야 하는 단어 또는 구문인 키워드이거나 결과에서 제외할 단어 또는 구문인 단어 무시일 수 있습니다. 사용자 지정 데이터 식별자를 사용하면 Amazon Macie가 제공하는 관리형 데이터 식별자를 보완하고 조직의 특정 시나리오, 지적 재산 또는 독점 데이터를 반영하는 민감한 데이터를 감지할 수 있습니다.
예를 들어, 많은 회사에서는 직원 ID에 대한 특정 구문을 사용합니다. 이러한 구문 중 하나는 직원이 상근직(F) 직원인지 비상근직(P) 직원인지를 나타내는 대문자, 하이픈(-), 직원을 식별하는 8자리 시퀀스가 그 뒤에 오는 것입니다. 예: 풀타임 직원의 경우 F–12345678, 파트타임 직원의 경우 P–87654321. 이 구문을 사용하는 직원 IDs를 감지하기 위해 다음 정규식을 지정하는 사용자 지정 데이터 식별자를 생성할 수 있습니다[A-Z]-\d{8}
. 분석을 세분화하고 오탐을 방지하기 위해 키워드(employee
및 employee ID
)를 사용하고 최대 20자의 일치 거리를 사용하도록 식별자를 구성할 수도 있습니다. 이러한 기준을 사용하면 텍스트가 키워드 직원 또는 직원 ID 뒤에 발생하고 모든 텍스트가 해당 키워드 중 하나의 20자 이내에 발생하는 경우 정규식과 일치하는 텍스트가 결과에 포함됩니다.
키워드를 사용하여 민감한 데이터를 찾고 오탐을 방지하는 방법에 대한 데모를 보려면 다음 동영상을 시청하세요.
감지 기준 외에도, 사용자 지정 데이터 식별자가 생성하는 조사 결과에 대한 사용자 지정 심각도 설정을 선택적으로 지정할 수 있습니다. 심각도는 식별자의 감지 기준과 일치하는 텍스트 발생 횟수를 기반으로 할 수 있습니다. 이러한 설정을 지정하지 않으면 Macie는 식별자가 생성하는 모든 조사 결과에 중간 심각도를 자동으로 할당합니다. 심각도는 식별자의 감지 기준과 일치하는 텍스트의 발생 횟수에 따라 달라지지 않습니다.
이러한 설정과 기타 설정에 대한 자세한 내용은 사용자 지정 데이터 식별자에 대한 구성 옵션 섹션을 참조하세요.
사용자 지정 데이터 식별자를 생성하려면
Amazon Macie 콘솔 또는 Amazon Macie API를 사용하여 사용자 지정 데이터 식별자를 생성할 수 있습니다.
- Console
-
다음 단계에 따라 Amazon Macie 콘솔을 사용하여 사용자 지정 데이터 식별자를 생성합니다.
사용자 지정 데이터 식별자를 생성하려면
https://console.aws.amazon.com/macie/에서 Amazon Macie 콘솔을 엽니다.
-
탐색 창의 설정에서 사용자 지정 데이터 식별자를 선택합니다.
-
생성(Create)을 선택합니다.
-
이름에서 사용자 지정 데이터 식별자의 이름을 입력합니다. 이름은 최대 128자까지 포함할 수 있습니다.
-
설명에 사용자 지정 데이터 식별자에 대한 간략한 설명을 선택적으로 입력합니다. 설명은 512자까지 포함할 수 있습니다.
사용자 지정 데이터 식별자의 이름 또는 설명에 민감한 데이터를 포함하지 마세요. 계정의 다른 사용자는 Macie에서 수행할 수 있는 작업에 따라 이름 또는 설명에 액세스할 수 있습니다.
-
정규 표현식의 경우, 일치시킬 텍스트 패턴을 정의하는 정규 표현식(정규식)을 입력합니다. Regex는 최대 512자까지 포함할 수 있습니다.
Macie는 펄 호환 정규 표현식(PCRE) 라이브러리에서 제공하는 패턴 구문의 하위 집합을 지원합니다. 자세한 내용과 팁은 사용자 지정 데이터 식별자에 대한 감지 기준을 참조하세요.
-
키워드의 경우, 최대 50개의 문자 시퀀스(쉼표로 구분)를 선택적으로 입력하여 정규식 패턴과 일치하는 텍스트 근처에 있어야 하는 특정 텍스트를 정의합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 이러한 키워드 중 하나의 최대 일치 거리 내에 있는 경우에만 결과에 발생을 포함합니다. 각 키워드는 3~90개의 UTF-8 문자를 포함할 수 있습니다. 키워드는 대/소문자를 구분하지 않습니다
-
단어 무시의 경우 결과에서 제외할 특정 텍스트를 정의하는 최대 10개의 문자 시퀀스(쉼표로 구분)를 선택적으로 입력합니다.
Macie는 텍스트가 정규식 패턴과 일치하지만 이러한 무시 단어 중 하나가 포함된 경우 결과에서 발생을 제외합니다. 각 단어 무시는 4~90개의 UTF-8 문자를 포함할 수 있습니다. 단어 무시는 대/소문자를 구분합니다.
-
최대 일치 거리의 경우, 키워드의 끝 및 정규식 패턴과 일치하는 텍스트 끝 사이에 존재할 수 있는 최대 문자 수를 선택적으로 입력합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 전체 키워드의이 거리 내에 있는 경우에만 결과에 발생을 포함합니다. 거리는 1~300자일 수 있습니다. 기본 거리는 50자입니다.
-
심각도의 경우 사용자 지정 데이터 식별자가 생성하는 민감한 데이터 조사 결과의 심각도를 결정하는 방법을 선택합니다.
-
모든 조사 결과에 중간 심각도를 자동으로 할당하려면 일치하는 개수에 대해 중간 심각도 사용(기본값)을 선택합니다. 이 옵션을 사용하면 Macie는 영향을 받는 S3 객체에 탐지 기준과 일치하는 텍스트가 한 번 이상 포함되어 있는지 여부에 대해 조사 결과에 중간 심각도를 자동으로 할당합니다.
-
지정한 발생 횟수 임곗값을 기반으로 심각도를 할당하려면 사용자 지정 설정을 사용하여 심각도 확인을 선택합니다. 그런 다음 발생 임곗값 및 심각도 수준 옵션을 사용하여 선택한 심각도의 조사 결과를 생성하기 위해 S3 객체에 존재해야 하는 최소 일치 개수를 지정합니다.
Macie가 지원하는 각 심각도 수준인 낮음(가장 심각하지 않음), 보통, 높음(가장 심각함)에 대해 최대 세 개의 발생 임계값을 지정할 수 있습니다. 두 개 이상 지정하는 경우, 임곗값은 심각도에 따라 오름차순으로 낮음에서 높음으로 이동해야 합니다. S3 객체에 최소 임계값보다 적은 발생 횟수가 포함된 경우 Macie는 결과를 생성하지 않습니다.
-
(선택 사항) 태그 에서 태그 추가를 선택한 다음 사용자 지정 데이터 식별자에 할당할 태그를 50개까지 입력합니다.
Atag는 사용자가 정의하여 특정 유형의 AWS 리소스에 할당하는 레이블입니다. 각 태그는 필수 태그 키와 선택적 태그 값으로 구성됩니다. 태그를 사용하면 용도, 소유자, 환경 또는 기타 기준과 같은 다양한 방법으로 리소스를 식별, 분류, 관리하는 데 도움이 됩니다. 자세한 내용은 Macie 리소스 태그 지정(을)를 참조하세요.
-
(선택 사항) 평가의 경우, 샘플 데이터란에 최대 1,000자를 입력한 다음 테스트를 선택하여 탐지 기준을 테스트합니다. Macie는 샘플 데이터를 평가하여 기준과 일치하는 텍스트의 발생 횟수를 보고합니다. 이 단계를 원하는 만큼 반복하여 기준을 세분화하고 최적화할 수 있습니다.
샘플 데이터를 사용하여 감지 기준을 테스트하고 구체화하는 것이 좋습니다. 사용자 지정 데이터 식별자는 민감한 데이터 검색 작업에서 사용되므로 사용자 지정 데이터 식별자를 생성한 후에는 변경할 수 없습니다. 이렇게 하면 민감한 데이터 조사 결과 및 검색 결과에 대한 변경할 수 없는 기록을 보유할 수 있습니다.
-
마쳤으면 제출을 선택합니다.
Macie는 설정을 테스트하여 정규식을 컴파일할 수 있는지 확인합니다. 설정 또는 정규식에 문제가 있는 경우 Macie는 문제를 설명하는 오류를 표시합니다. 문제를 해결한 후 사용자 지정 데이터 식별자를 저장할 수 있습니다.
- API
-
에는 각 에 대한 기본 할당량(이전에는 제한이라고 함)이 있습니다. 또는 AWS Command Line Interface (AWS CLI)를 사용하는 경우 create-custom-data-identifier 명령을 실행합니다.
사용자 지정 데이터 식별자를 생성하기 전에 샘플 데이터로 감지 기준을 테스트하고 구체화하는 것이 좋습니다. 사용자 지정 데이터 식별자는 민감한 데이터 검색 작업에서 사용되므로 사용자 지정 데이터 식별자를 생성한 후에는 변경할 수 없습니다. 이렇게 하면 민감한 데이터 조사 결과 및 검색 결과에 대한 변경할 수 없는 기록을 보유할 수 있습니다.
프로그래밍 방식으로 기준을 테스트하려면 Amazon Macie API의 TestCustomDataIdentifier 작업을 사용할 수 있습니다. 이 작업은 감지 기준으로 샘플 데이터를 평가하기 위한 환경을 제공합니다. 를 사용하는 경우 test-custom-data-identifier 명령을 실행하여 기준을 테스트할 AWS CLI수 있습니다.
사용자 지정 데이터 식별자를 생성할 준비가 되면 다음 파라미터를 사용하여 감지 기준을 정의합니다.
-
regex
- 일치시킬 텍스트 패턴을 정의하는 정규식(정규식)을 지정합니다. Regex는 최대 512자까지 포함할 수 있습니다.
Macie는 펄 호환 정규 표현식(PCRE) 라이브러리에서 제공하는 패턴 구문의 하위 집합을 지원합니다. 자세한 내용과 팁은 사용자 지정 데이터 식별자에 대한 감지 기준을 참조하세요.
-
keywords
- 선택적으로 정규식 패턴과 일치하는 텍스트와 근접해야 하는 1~50개의 문자 시퀀스(키워드)를 지정합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 이러한 키워드 중 하나의 최대 일치 거리 내에 있는 경우에만 결과에 발생을 포함합니다. 각 키워드는 3~90개의 UTF-8 문자를 포함할 수 있습니다. 키워드는 대/소문자를 구분하지 않습니다
-
maximumMatchDistance
- 선택적으로 키워드 끝과 정규식 패턴과 일치하는 텍스트 끝 사이에 존재할 수 있는 최대 문자 수를 지정합니다. 를 사용하는 경우 maximum-match-distance
파라미터를 AWS CLI사용하여이 값을 지정합니다.
Macie는 텍스트가 정규식 패턴과 일치하고 텍스트가 전체 키워드의이 거리 내에 있는 경우에만 결과에 발생을 포함합니다. 거리는 1~300자일 수 있습니다. 기본 거리는 50자입니다.
-
ignoreWords
- 선택적으로 결과에서 제외할 1~10개의 문자 시퀀스(단어 무시)를 지정합니다. 를 사용하는 경우 ignore-words
파라미터를 AWS CLI사용하여 이러한 문자 시퀀스를 지정합니다.
Macie는 텍스트가 정규식 패턴과 일치하지만 이러한 무시 단어 중 하나가 포함된 경우 결과에서 발생을 제외합니다. 각 단어 무시는 4~90개의 UTF-8 문자를 포함할 수 있습니다. 단어 무시는 대/소문자를 구분합니다.
사용자 지정 데이터 식별자가 생성하는 민감한 데이터 조사 결과의 심각도를 지정하려면 severityLevels
파라미터를 사용하거나를 사용하는 경우 AWS CLIseverity-levels
파라미터를 사용합니다.
-
모든 결과에 MEDIUM
심각도를 자동으로 할당하려면이 파라미터를 생략합니다. 그런 다음 Macie는 기본 설정을 사용합니다. 기본적으로 영향을 받는 S3 객체에 감지 기준과 일치하는 텍스트가 하나 이상 포함된 경우 Macie는 결과에 MEDIUM
심각도를 할당합니다.
-
지정한 발생 임계값을 기반으로 심각도를 할당하려면 지정된 심각도로 결과를 생성하기 위해 S3 객체에 존재해야 하는 최소 일치 항목 수를 지정합니다.
Macie가 지원하는 각 심각도 수준에 대해 하나씩 최대 3개의 발생 임계값을 지정할 수 있습니다. LOW
(가장 심각하지 않음), MEDIUM
또는 HIGH
(가장 심각함). 둘 이상을 지정하는 경우 임계값은 심각도에 따라 오름차순으로에서 LOW
로 이동해야 합니다HIGH
. S3 객체에 최소 임계값보다 적은 발생 횟수가 포함된 경우 Macie는 결과를 생성하지 않습니다.
추가 파라미터를 사용하여 사용자 지정 데이터 식별자의 이름 및 태그와 같은 기타 설정을 지정합니다. 이러한 설정에 민감한 데이터를 포함하지 마세요. 계정의 다른 사용자는 Macie에서 수행할 수 있는 작업에 따라 이러한 값에 액세스할 수 있습니다.
요청을 제출하면 Macie는 설정을 테스트하고 정규식을 컴파일할 수 있는지 확인합니다. 설정 또는 정규식에 문제가 있는 경우 요청이 실패하고 Macie는 문제를 설명하는 메시지를 반환합니다. 요청이 성공하면 다음과 비슷한 출력이 수신됩니다.
{
"customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
여기서는 생성된 사용자 지정 데이터 식별자의 고유 식별자(ID)를 customDataIdentifierId
지정합니다.
나중에 사용자 지정 데이터 식별자에 대한 설정을 검색하고 검토하려면 GetCustomDataIdentifier 작업을 사용하거나를 사용하는 경우 get-custom-data-identifier 명령을 AWS CLI실행합니다. id
파라미터에 사용자 지정 데이터 식별자의 ID를 지정합니다.
다음 예제에서는를 사용하여 사용자 지정 데이터 식별자를 AWS CLI 생성하는 방법을 보여줍니다. 이 예제에서는 특정 구문을 사용하고 지정된 키워드와 근접한 직원 IDs를 감지하도록 설계된 사용자 지정 데이터 식별자를 생성합니다. 또한이 예제에서는 식별자가 생성하는 결과에 대한 사용자 지정 심각도 설정을 정의합니다.
이 예제는 Linux, macOS 또는 Unix용으로 포맷되었으며, 가독성을 높이기 위해 백슬래시(\) 줄 연속 문자를 사용합니다.
$
aws macie2 create-custom-data-identifier \
--name "EmployeeIDs
" \
--regex "[A-Z]-\d{8}
" \
--keywords '["employee","employee ID"
]' \
--maximum-match-distance 20
\
--severity-levels '[{"occurrencesThreshold":1
,"severity":"LOW
"},{"occurrencesThreshold":50
,"severity":"MEDIUM
"},{"occurrencesThreshold":100
,"severity":"HIGH
"}]' \
--description "Detects employee IDs in proximity of a keyword.
" \
--tags '{"Stack
":"Production
"}'
이 예제는 Microsoft Windows용으로 포맷되었으며 가독성을 높이기 위해 캐럿(^) 줄 연속 문자를 사용합니다.
C:\>
aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs
" ^
--regex "[A-Z]-\d{8}
" ^
--keywords "[\"employee
\",\"employee ID
\"]" ^
--maximum-match-distance 20
^
--severity-levels "[{\"occurrencesThreshold\":1
,\"severity\":\"LOW
\"},{\"occurrencesThreshold\":50
,\"severity\":\"MEDIUM
\"},{\"occurrencesThreshold\":100
,\"severity\":\"HIGH
\"}]" ^
--description "Detects employee IDs in proximity of a keyword.
" ^
--tags={\"Stack
\":\"Production
\"}
위치:
-
EmployeeIDs
는 사용자 지정 데이터 식별자의 이름입니다.
-
[A-Z]-\d{8}
는 일치시킬 텍스트 패턴의 정규식입니다.
-
employee
및 employee ID
는 정규식 패턴과 일치하는 텍스트 근처에 있어야 하는 키워드입니다.
-
20
는 키워드의 끝과 정규식 패턴과 일치하는 텍스트의 끝 사이에 존재할 수 있는 최대 문자 수입니다.
-
description
는 사용자 지정 데이터 식별자에 대한 간략한 설명을 지정합니다.
-
severity-levels
는 사용자 지정 데이터 식별자가 생성하는 조사 결과의 심각도에 대한 사용자 지정 발생 임계값을 정의합니다. LOW
1~49건, MEDIUM
50~99건, HIGH
100건 이상입니다.
-
Stack
는 사용자 지정 데이터 식별자에 할당할 태그의 태그 키입니다. Production
는 지정된 태그 키의 태그 값입니다.
사용자 지정 데이터 식별자를 생성한 후 이를 사용하도록 민감한 데이터 검색 작업을 생성 및 구성하거나 민감한 데이터 자동 검색을 위한 설정에 추가할 수 있습니다.