翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
マネージドデータ識別子のキーワード要件
マネージドデータ識別子を使用して特定のタイプの機密データを検出するには、Amazon Macie ではデータの近くにあるキーワードが必要です。特定のタイプのデータに当てはまる場合、このセクションのリファレンストピックでは、そのデータのキーワード要件を示します。
キーワードが特定のタイプのデータの近くにある必要がある場合は、通常、キーワードはデータから 30 文字以内 (包括的) になければなりません。追加の近接要件は、Amazon Simple Storage Service (Amazon S3) オブジェクトのファイルタイプまたはストレージ形式によって異なります。
- 構造化された列指向データ
-
列指向データでは、キーワードは同じ値の一部であるか、値を格納する列またはフィールドの名前内にある必要があります。これは、Microsoft Excel ワークブック、CSV ファイル、および TSV ファイルに当てはまります。
たとえば、フィールドの値に SSN と米国社会保障番号 (SSN) の構文を使用する 9 桁の番号の両方が含まれている場合、Macie はフィールド内の SSN を検出できます。同様に、列の名前に SSN が含まれている場合、Macie は列内の各 SSN を検出できます。Macie は、その列内の値を、キーワード SSN の近くにあるものとして扱います。
- 構造化レコードベースのデータ
-
レコードベースのデータでは、キーワードは同じ値の一部であるか、値を格納するフィールドまたは配列へのパス内の要素の名前内にある必要があります。これは Apache Avro オブジェクトコンテナ、Apache Parquet ファイル、JSON ファイル、および JSON Lines ファイルに当てはまります。
例えば、 フィールドの値に シー AWS クレットアクセスキーの構文を使用する認証情報と文字シーケンスの両方が含まれている場合、Macie は フィールドでキーを検出できます。同様に、フィールドへのパスが の場合
$.credentials.aws.key
、Macie は フィールドで AWS シークレットアクセスキーを検出できます。Macie は、そのフィールド内の値を、キーワード credentials (認証情報) の近くにあるものとして扱います。 - Unstructured data (非構造化データ)
-
非構造化データの場合、キーワードは通常、データの 30 文字以内 (包括的) である必要があります。追加の近接要件はありません。これは、Adobe ポータブルドキュメント形式ファイル、Microsoft Word ドキュメント、E メールメッセージ、および CSV、JSON、JSON Lines、および TSV ファイル以外の非バイナリテキストファイルに当てはまります。これには、これらのタイプのファイル内のテーブルや XML などの構造化データが含まれます。
キーワードでは大文字と小文字が区別されません。さらに、キーワードにスペースが含まれている場合、Macie は、スペースを含まないキーワードのバリエーションや、スペースではなくアンダースコア (_) またはハイフン (-) を含むキーワードのバリエーションを自動的に照合します。場合によっては、Macie はキーワードの一般的なバリエーションに対処するためにキーワードを拡張または短縮します。
キーワードがコンテキストを提供し、Macie が特定のタイプの機密データを検出するのにどのように役立つかについては、以下の動画をご覧ください。