관리형 데이터 식별자에 대한 키워드 요구 사항 - Amazon Macie

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

관리형 데이터 식별자에 대한 키워드 요구 사항

관리형 데이터 식별자를 사용하여 특정 유형의 민감한 데이터를 탐지하기 위해 Amazon Macie는 데이터 근처에 키워드가 있어야 합니다. 특정 유형의 데이터에 해당하는 경우 이 섹션의 참조 항목에서 해당 데이터에 대한 키워드 요구 사항을 나타냅니다.

키워드가 특정 유형의 데이터와 인접해야 하는 경우 키워드는 일반적으로 데이터로부터 30자 이내(포함) 이내여야 합니다. 추가 근접성 요구 사항은 Amazon Simple Storage Service(S3) 객체의 스토리지 형식에 따라 달라집니다.

구조화된 열 기반 데이터

열 기반 데이터의 경우 키워드는 동일한 값의 일부이거나 값을 저장하는 열 또는 필드의 이름에 포함되어야 합니다. Microsoft Excel 통합 문서, CSV 파일 및 TSV 파일이 여기에 해당합니다.

예를 들어 필드 값에 SSN과 미국 사회보장번호(SSN) 구문을 사용하는 9자리 숫자가 모두 포함된 경우 Macie는 필드에서 SSN을 감지할 수 있습니다. 마찬가지로 열 이름에 SSN이 포함된 경우 Macie는 열의 각 SSN을 감지할 수 있습니다. Macie는 해당 열의 값을 키워드 SSN과 가까운 위치에 있는 것으로 취급합니다.

구조화된 레코드 기반 데이터

레코드 기반 데이터의 경우 키워드는 값이 같거나 값을 저장하는 필드 또는 배열의 경로에 있는 요소 이름에 포함되거나 요소 이름에 포함되어야 합니다. Apache Avro 객체 컨테이너, Apache Parquet 파일, JSON 파일 및 JSON 행 파일이 여기에 해당합니다.

예를 들어 필드 값에 AWS 보안 액세스 키의 구문을 사용하는 자격 증명과 문자 시퀀스가 모두 포함된 경우 Macie는 필드의 키를 감지할 수 있습니다. 마찬가지로 필드 경로가 인 경우 $.credentials.aws.keyMacie는 필드에서 AWS 보안 액세스 키를 감지할 수 있습니다. Macie는 필드의 값을 키워드 보안 인증 정보과 가까운 위치에 있는 것으로 취급합니다.

비정형 데이터

비정형 데이터의 경우 키워드는 일반적으로 데이터의 30자 이내(포함)여야 합니다. 추가 근접성 요구 사항은 없습니다. CSV, JSON, JSON Lines 및 TSV 파일을 제외한 Adobe Portable Document Format 형식 파일, Microsoft Word 문서, 이메일 메시지 및 바이너리가 아닌 텍스트 파일이 여기에 해당합니다. 여기에는 이러한 유형의 파일에 테이블 또는 XML과 같은 모든 구조화된 데이터가 포함됩니다.

키워드는 대/소문자를 구분하지 않습니다 또한 키워드에 공백이 포함된 경우 Macie는 공백을 포함하지 않거나 공백 대신 밑줄(_) 또는 하이픈(-)이 포함된 유사 키워드를 자동으로 찾습니다. 경우에 따라 Macie는 키워드의 일반적인 변형을 해결하기 위해 키워드를 확장하거나 축약하기도 합니다.

키워드가 컨텍스트를 제공하고 Macie가 특정 유형의 민감한 데이터를 감지하는 데 어떻게 도움이 되는지에 대한 데모를 보려면 다음 동영상을 시청하세요.