

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 托管数据标识符的关键字需求
<a name="managed-data-identifiers-keywords"></a>

为了使用托管数据标识号检测某些类型的敏感数据，Amazon Macie 要求关键字的位置必须靠近数据。如果特定类型的数据属于这种情况，此部分中的参考主题将说明该数据的特定关键字要求。

如果关键字必须靠近特定类型的数据，则该关键字通常必须在 30 个字符以内（含）数据。其他邻近要求因 Amazon Simple Storage Service (Amazon S3) 对象的文件类型或存储格式而异。

**结构化柱状数据**  
对于列式数据，关键字必须是相同值的一部分或在存储值的列或字段的名称中。这种情况包括 Microsoft Excel 工作簿、CSV 文件和 TSV 文件。  
例如，如果某个字段的值同时包含 *SSN* 和使用美国社会安全号码 (SSN) 语法的九位数字，则 Macie 可以在该字段中检测到 SSN。同样，如果列名包含 *SSN*，Macie 可以检测该列中的每个 SSN。Macie 将该列中的值视为与关键字 *SSN* 接近。

**基于记录的结构化数据**  
对于基于记录的数据，关键字必须是相同值的一部分，或者是在存储值的字段或数组路径中元素的名称中。这种情况包括 Apache Avro 对象容器、Apache Parquet 文件、JSON 文件和 JSON Lines 文件。  
例如，如果字段的值同时包含*凭据*和使用私有访问 AWS 密钥语法的字符序列，则 Macie 可以检测该字段中的密钥。同样，如果字段的路径是`$.credentials.aws.key`，则 Macie 可以在该字段中检测到私有访问 AWS 密钥。Macie 将该字段中的值视为与关键字*凭证*相近。

**非结构化数据**  
对于非结构化数据，关键字通常必须与数据 30 个字符以内（含）。没有任何额外的邻近要求。这种情况包括 Adobe 便携式文档格式文件、Microsoft Word 文档、电子邮件消息和非二进制文本文件（CSV、JSON、JSON Lines 和 TSV 文件除外）。这包括这些类型的文件中的任何结构化数据，例如表或 XML。

关键字不区分大小写。此外，如果关键字包含空格，Macie 会自动匹配不包含空格的变体，或包含下划线 (\_) 或连字符 (-) 而不是空格的关键字变体。在某些情况下，Macie 还会扩展或缩写关键字以应对该关键字的常见变体。

要演示关键字如何提供上下文并帮助 Macie 检测特定类型的敏感数据，请观看以下视频：


