Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Erstellen einer benutzerdefinierten Datenkennung
<a name="cdis-create"></a>

Eine *benutzerdefinierte Daten-ID* ist eine Reihe von Kriterien, die Sie definieren, um sensible Daten in Amazon Simple Storage Service (Amazon S3) -Objekten zu erkennen. Wenn Sie eine benutzerdefinierte Daten-ID erstellen, geben Sie einen regulären Ausdruck (*Regex*) an, der ein Textmuster definiert, mit dem in einem S3-Objekt abgeglichen werden soll. Sie können auch Zeichenfolgen und eine Näherungsregel angeben, um die Ergebnisse zu verfeinern. Bei den Zeichenfolgen kann es sich um: *Schlüsselwörter*, d. h. Wörter oder Ausdrücke, die in der Nähe von Text stehen müssen, der dem regulären Ausdruck entspricht, oder um *Wörter ignorieren, bei denen es sich um Wörter* oder Ausdrücke handelt, die aus den Ergebnissen ausgeschlossen werden sollen. Durch die Verwendung benutzerdefinierter Datenkennungen können Sie die von Amazon Macie [bereitgestellten verwalteten Datenkennungen](managed-data-identifiers.md) ergänzen und sensible Daten erkennen, die die speziellen Szenarien, das geistige Eigentum oder die firmeneigenen Daten Ihres Unternehmens widerspiegeln.

Beispielsweise haben viele Unternehmen eine spezifische Syntax für Mitarbeiter. IDs Eine solche Syntax könnte lauten: ein Großbuchstabe, der angibt, ob es sich bei einem Mitarbeiter um einen Vollzeit- (*F*) oder Teilzeitbeschäftigten (*P*) handelt, gefolgt von einem Bindestrich (—), gefolgt von einer achtstelligen Sequenz, die den Mitarbeiter identifiziert. *Beispiele sind: *F—12345678* für einen Vollzeitbeschäftigten und P—87654321 für einen Teilzeitbeschäftigten.* Um Mitarbeiter zu finden, die diese Syntax verwenden IDs , können Sie einen benutzerdefinierten Datenbezeichner erstellen, der den folgenden regulären Ausdruck angibt:. `[A-Z]-\d{8}` Um die Analyse zu verfeinern und Fehlalarme zu vermeiden, können Sie den Bezeichner auch so konfigurieren, dass er Schlüsselwörter (`employee`und`employee ID`) und einen maximalen Übereinstimmungsabstand von 20 Zeichen verwendet. Mit diesen Kriterien schließen die Ergebnisse Text ein, der mit der Regex übereinstimmt, wenn der Text nach dem Schlüsselwort *Mitarbeiter* oder *Mitarbeiter-ID* steht und der gesamte Text innerhalb von 20 Zeichen vor einem dieser Schlüsselwörter steht.

Sehen Sie sich das folgende Video an, um zu zeigen, wie Stichwörter Ihnen helfen können, vertrauliche Daten zu finden und Fehlalarme zu vermeiden:


Zusätzlich zu den Erkennungskriterien können Sie optional benutzerdefinierte Einstellungen für den Schweregrad von Ergebnissen angeben, die eine benutzerdefinierte Daten-ID hervorruft. Der Schweregrad kann auf der Anzahl der Textvorkommen basieren, die den Erkennungskriterien der Kennung entsprechen. Wenn Sie diese Einstellungen nicht angeben, weist Macie allen Ergebnissen, die die Kennung liefert, automatisch den Schweregrad *Mittel* zu. Der Schweregrad ändert sich nicht, je nachdem, wie oft Text vorkommt, der den Erkennungskriterien der Kennung entspricht.

Ausführliche Informationen zu diesen und anderen Einstellungen finden Sie unter[Konfigurationsoptionen für benutzerdefinierte Datenbezeichner](cdis-options.md).

**So erstellen Sie einen benutzerdefinierten Datenbezeichner**  
Sie können mithilfe der Amazon Macie-Konsole oder der Amazon Macie Macie-API eine benutzerdefinierte Daten-ID erstellen.

------
#### [ Console ]

Gehen Sie wie folgt vor, um mithilfe der Amazon Macie Macie-Konsole eine benutzerdefinierte Daten-ID zu erstellen.

**Um eine benutzerdefinierte Daten-ID zu erstellen**

1. Öffnen Sie die Amazon Macie Macie-Konsole unter [https://console.aws.amazon.com/macie/](https://console.aws.amazon.com/macie/).

1. Wählen Sie im Navigationsbereich unter **Einstellungen** die Option **Benutzerdefinierte Datenkennungen** aus.

1. Wählen Sie **Erstellen** aus.

1. Geben Sie **unter Name** einen Namen für den benutzerdefinierten Datenbezeichner ein. Der Name darf maximal 128 Zeichen enthalten.

1. Geben Sie unter **Beschreibung** optional eine kurze Beschreibung der benutzerdefinierten Daten-ID ein. Die Beschreibung darf maximal 512 Zeichen enthalten.
**Anmerkung**  
Vermeiden Sie es, vertrauliche Daten in den Namen oder die Beschreibung einer benutzerdefinierten Daten-ID aufzunehmen. Andere Benutzer Ihres Kontos können möglicherweise auf den Namen oder die Beschreibung zugreifen, je nachdem, welche Aktionen sie in Macie ausführen dürfen.

1. Geben Sie für **Reguläre Ausdrücke** den regulären Ausdruck (*Regex*) ein, der das passende Textmuster definiert. Der reguläre Ausdruck kann bis zu 512 Zeichen enthalten.

   Macie unterstützt eine Teilmenge der Mustersyntax, die von der Bibliothek [Perl Compatible Regular Expressions](https://www.pcre.org/) (PCRE) bereitgestellt wird. Weitere Informationen und Tipps finden Sie unter [Erkennungskriterien für](cdis-options.md#cdis-detection-criteria) benutzerdefinierte Datenbezeichner.

1. Geben Sie für **Schlüsselwörter** optional bis zu 50 Zeichenfolgen (durch Kommas getrennt) ein, um bestimmten Text zu definieren, der sich in der Nähe von Text befinden muss, der dem Regex-Muster entspricht.

   Macie nimmt ein Vorkommen nur dann in die Ergebnisse auf, wenn der Text dem Regex-Muster entspricht und sich der Text innerhalb der maximalen Übereinstimmungsdistanz zu einem dieser Schlüsselwörter befindet. Jedes Schlüsselwort kann 3—90 UTF-8-Zeichen enthalten. Bei Schlüsselwörtern muss die Groß- und Kleinschreibung nicht beachtet werden.

1. Geben Sie für **Wörter ignorieren** optional bis zu 10 Zeichenfolgen (durch Kommas getrennt) ein, die bestimmten Text definieren, der aus den Ergebnissen ausgeschlossen werden soll.

   Macie schließt ein Vorkommen aus den Ergebnissen aus, wenn der Text dem Regex-Muster entspricht, aber eines dieser Ignorierwörter enthält. Jedes Ignorierwort kann 4—90 UTF-8-Zeichen enthalten. Die zu ignorierenden Wörter unterscheiden zwischen Groß- und Kleinschreibung.

1. Geben Sie für **Maximaler Übereinstimmungsabstand** optional die maximale Anzahl von Zeichen ein, die zwischen dem Ende eines Schlüsselworts und dem Ende des Textes, der dem Regex-Muster entspricht, bestehen können.

   Macie nimmt ein Vorkommen nur dann in die Ergebnisse auf, wenn der Text dem Regex-Muster entspricht und sich der Text innerhalb dieser Entfernung von einem vollständigen Schlüsselwort befindet. Die Entfernung kann 1—300 Zeichen betragen. Die Standardentfernung beträgt 50 Zeichen.

1. Wählen Sie **unter Schweregrad** aus, wie der Schweregrad der Ergebnisse sensibler Daten bestimmt werden soll, die anhand der benutzerdefinierten Daten-ID ermittelt werden:
   + Um allen Ergebnissen automatisch den Schweregrad *Mittel* zuzuweisen, wählen Sie **Mittleren Schweregrad für eine beliebige Anzahl von Treffern verwenden (Standard)**. Mit dieser Option weist Macie einem Ergebnis automatisch den Schweregrad *Mittel* zu, wenn das betroffene S3-Objekt ein oder mehrere Textvorkommen enthält, die den Erkennungskriterien entsprechen.
   + Um den Schweregrad auf der Grundlage der von Ihnen angegebenen Schwellenwerte für Ereignisse zuzuweisen, wählen Sie „**Benutzerdefinierte Einstellungen zur Bestimmung des Schweregrads verwenden**“. Geben Sie anschließend mit den Optionen **Schwellenwert für Vorkommen** und **Schweregrad** die Mindestanzahl von Übereinstimmungen an, die in einem S3-Objekt vorhanden sein müssen, um ein Ergebnis mit einem ausgewählten Schweregrad zu erhalten.

     Sie können bis zu drei Schwellenwerte für Vorkommen angeben, einen für jeden von Macie unterstützten Schweregrad: *Niedrig* (am wenigsten schwerwiegend), *Mittel* oder *Hoch* (am schwersten). **Wenn Sie mehr als einen angeben, müssen die Schwellenwerte nach Schweregrad aufsteigend angeordnet sein, d. h. von Niedrig bis Hoch.** Wenn ein S3-Objekt weniger Vorkommen als der niedrigste Schwellenwert enthält, erstellt Macie kein Ergebnis.

1. (Optional) Wählen Sie für **Tags** die Option **Tag hinzufügen** aus und geben Sie dann bis zu 50 Tags ein, die dem benutzerdefinierten Datenbezeichner zugewiesen werden sollen.

   Ein *Tag* ist eine Bezeichnung, die Sie definieren und bestimmten Ressourcentypen AWS zuweisen. Jedes Tag besteht aus einem erforderlichen Tag-Schlüssel und einem optionalen Tag-Wert. Tags können Ihnen dabei helfen, Ressourcen auf verschiedene Arten zu identifizieren, zu kategorisieren und zu verwalten (z. B. nach Zweck, Besitzer, Umgebung oder anderen Kriterien). Weitere Informationen hierzu finden Sie unter [Macie-Ressourcen taggen](tagging-resources.md).

1. (Optional) Geben Sie für **Evaluieren** bis zu 1.000 Zeichen in das Feld **Beispieldaten** ein, und wählen Sie dann **Test** aus, um die Erkennungskriterien zu testen. Macie wertet die Beispieldaten aus und gibt an, wie oft Text vorkommt, der den Kriterien entspricht. Sie können diesen Schritt beliebig oft wiederholen, um die Kriterien zu verfeinern und zu optimieren.
**Anmerkung**  
Es wird dringend empfohlen, die Erkennungskriterien anhand von Beispieldaten zu testen und zu verfeinern. Da benutzerdefinierte Datenbezeichner bei Aufträgen zur Erkennung vertraulicher Daten verwendet werden, können Sie eine benutzerdefinierte Daten-ID nicht mehr ändern, nachdem Sie sie erstellt haben. Dadurch wird sichergestellt, dass Ihnen ein unveränderlicher Verlauf von Erkenntnissen für sensible Daten und Ermittlungsergebnissen zur Verfügung steht.  
Da Macie bei der Verarbeitung strukturierter Datensätze zusätzliche Logik anwendet, kann die im Feld **Auswerten** zurückgegebene Trefferzahl in bestimmten Fällen von den Ergebnissen der Jobs abweichen.

1. Wenn Sie fertig sind, klicken Sie auf **Submit** (Absenden).

Macie testet die Einstellungen und stellt sicher, dass es die Regex kompilieren kann. Wenn es ein Problem mit einer Einstellung oder der Regex gibt, zeigt Macie einen Fehler an, der das Problem beschreibt. Nachdem Sie alle Probleme behoben haben, können Sie die benutzerdefinierte Daten-ID speichern.

------
#### [ API ]

Verwenden Sie die Amazon Macie Macie-API, um programmgesteuert eine benutzerdefinierte Daten-ID zu erstellen. [CreateCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers.html) Oder, wenn Sie die AWS Command Line Interface (AWS CLI) verwenden, führen Sie den Befehl aus. [create-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/create-custom-data-identifier.html)

**Anmerkung**  
Bevor Sie einen benutzerdefinierten Datenbezeichner erstellen, empfehlen wir dringend, die zugehörigen Erkennungskriterien anhand von Beispieldaten zu testen und zu verfeinern. Da benutzerdefinierte Datenbezeichner bei Aufträgen zur Erkennung vertraulicher Daten verwendet werden, können Sie eine benutzerdefinierte Daten-ID nicht mehr ändern, nachdem Sie sie erstellt haben. Dadurch wird sichergestellt, dass Ihnen ein unveränderlicher Verlauf von Erkenntnissen für sensible Daten und Ermittlungsergebnissen zur Verfügung steht.  
Um die Kriterien programmgesteuert zu testen, können Sie den [TestCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-test.html)Betrieb der Amazon Macie Macie-API verwenden. Dieser Vorgang bietet eine Umgebung für die Auswertung von Probendaten mit Erkennungskriterien. Wenn Sie den verwenden AWS CLI, können Sie den [test-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/test-custom-data-identifier.html)Befehl ausführen, um die Kriterien zu testen.

Wenn Sie bereit sind, den benutzerdefinierten Datenbezeichner zu erstellen, verwenden Sie die folgenden Parameter, um die Erkennungskriterien zu definieren:
+ `regex`— Geben Sie den regulären Ausdruck (*Regex*) an, der das passende Textmuster definiert. Der reguläre Ausdruck kann bis zu 512 Zeichen enthalten.

  Macie unterstützt eine Teilmenge der Mustersyntax, die von der Bibliothek [Perl Compatible Regular Expressions](https://www.pcre.org/) (PCRE) bereitgestellt wird. Weitere Informationen und Tipps finden Sie unter [Erkennungskriterien für](cdis-options.md#cdis-detection-criteria) benutzerdefinierte Datenbezeichner.
+ `keywords`— Geben Sie optional 1—50 Zeichenfolgen (*Schlüsselwörter*) an, die sich in der Nähe von Text befinden müssen, der dem Regex-Muster entspricht.

  Macie nimmt ein Vorkommen nur dann in die Ergebnisse auf, wenn der Text dem Regex-Muster entspricht und sich der Text innerhalb der maximalen Übereinstimmungsdistanz zu einem dieser Schlüsselwörter befindet. Jedes Schlüsselwort kann 3—90 UTF-8-Zeichen enthalten. Bei Schlüsselwörtern muss die Groß- und Kleinschreibung nicht beachtet werden.
+ `maximumMatchDistance`— Geben Sie optional die maximale Anzahl von Zeichen an, die zwischen dem Ende eines Schlüsselworts und dem Ende des Textes, der dem Regex-Muster entspricht, existieren können. Wenn Sie den verwenden AWS CLI, verwenden Sie den `maximum-match-distance` Parameter, um diesen Wert anzugeben.

  Macie nimmt ein Vorkommen nur dann in die Ergebnisse auf, wenn der Text dem Regex-Muster entspricht und sich der Text innerhalb dieser Entfernung von einem vollständigen Schlüsselwort befindet. Die Entfernung kann 1—300 Zeichen betragen. Die Standardentfernung beträgt 50 Zeichen.
+ `ignoreWords`— Geben Sie optional 1—10 Zeichenfolgen (*Wörter ignorieren*) an, die aus den Ergebnissen ausgeschlossen werden sollen. Wenn Sie den verwenden AWS CLI, verwenden Sie den `ignore-words` Parameter, um diese Zeichenfolgen anzugeben.

  Macie schließt ein Vorkommen aus den Ergebnissen aus, wenn der Text dem Regex-Muster entspricht, aber eines dieser Ignorierwörter enthält. Jedes Ignorierwort kann 4—90 UTF-8-Zeichen enthalten. Die zu ignorierenden Wörter unterscheiden zwischen Groß- und Kleinschreibung.

Verwenden Sie den Parameter oder, falls Sie den verwenden, den folgenden `severityLevels` Parameter, um den Schweregrad der Ergebnisse vertraulicher Daten anzugeben, die der AWS CLI benutzerdefinierte Datenbezeichner hervorruft: `severity-levels`
+ Um allen Ergebnissen automatisch den `MEDIUM` Schweregrad zuzuweisen, lassen Sie diesen Parameter weg. Macie verwendet dann die Standardeinstellung. Standardmäßig weist Macie einem Ergebnis den `MEDIUM` Schweregrad zu, wenn das betroffene S3-Objekt ein oder mehrere Textvorkommen enthält, die den Erkennungskriterien entsprechen.
+ Um den Schweregrad auf der Grundlage der von Ihnen angegebenen Schwellenwerte für Vorkommen zuzuweisen, geben Sie die Mindestanzahl von Übereinstimmungen an, die in einem S3-Objekt vorhanden sein müssen, um ein Ergebnis mit einem bestimmten Schweregrad zu erhalten.

  Sie können bis zu drei Schwellenwerte für Vorkommen angeben, einen für jeden Schweregrad, den Macie unterstützt: `LOW` (am wenigsten schwerwiegend) oder `HIGH` (am schwersten). `MEDIUM` Wenn Sie mehr als einen angeben, müssen die Schwellenwerte in aufsteigender Reihenfolge nach Schweregrad angegeben werden, wobei von bis zu gewechselt wird. `LOW` `HIGH` Wenn ein S3-Objekt weniger Vorkommen als der niedrigste Schwellenwert enthält, erstellt Macie keinen Befund.

Verwenden Sie zusätzliche Parameter, um einen Namen und andere Einstellungen, wie z. B. Tags, für den benutzerdefinierten Datenbezeichner anzugeben. Vermeiden Sie es, sensible Daten in diese Einstellungen aufzunehmen. Andere Benutzer Ihres Kontos können möglicherweise auf diese Werte zugreifen, je nachdem, welche Aktionen sie in Macie ausführen dürfen.

Wenn Sie Ihre Anfrage einreichen, testet Macie die Einstellungen und stellt sicher, dass es die Regex kompilieren kann. Wenn es ein Problem mit einer Einstellung oder der Regex gibt, schlägt die Anfrage fehl und Macie gibt eine Meldung zurück, die das Problem beschreibt. Wenn die Anfrage erfolgreich ist, erhalten Sie eine Ausgabe, die der folgenden ähnelt:

```
{
    "customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
```

Where `customDataIdentifierId` gibt den eindeutigen Bezeichner (ID) für den benutzerdefinierten Datenbezeichner an, der erstellt wurde.

Um anschließend die Einstellungen für den benutzerdefinierten Datenbezeichner abzurufen und zu überprüfen, verwenden Sie den [GetCustomDataIdentifier](https://docs.aws.amazon.com/macie/latest/APIReference/custom-data-identifiers-id.html)Vorgang oder, falls Sie den verwenden AWS CLI, führen Sie den [get-custom-data-identifier](https://docs.aws.amazon.com/cli/latest/reference/macie2/get-custom-data-identifier.html)Befehl aus. Geben Sie für den `id` Parameter die ID der benutzerdefinierten Daten-ID an.

Die folgenden Beispiele zeigen, wie Sie mit AWS CLI dem eine benutzerdefinierte Daten-ID erstellen können. In den Beispielen wird eine benutzerdefinierte Daten-ID erstellt, mit der Mitarbeiter erkannt werden können IDs , die eine bestimmte Syntax verwenden und sich in der Nähe eines bestimmten Schlüsselworts befinden. In den Beispielen werden auch benutzerdefinierte Einstellungen für den Schweregrad der Ergebnisse definiert, die sich aus der Kennung ergeben.

Dieses Beispiel ist für Linux, macOS oder Unix formatiert und verwendet den umgekehrten Schrägstrich (\$1) zur Verbesserung der Lesbarkeit.

```
$ aws macie2 create-custom-data-identifier \
--name "EmployeeIDs" \
--regex "[A-Z]-\d{8}" \
--keywords '["employee","employee ID"]' \
--maximum-match-distance 20 \
--severity-levels '[{"occurrencesThreshold":1,"severity":"LOW"},{"occurrencesThreshold":50,"severity":"MEDIUM"},{"occurrencesThreshold":100,"severity":"HIGH"}]' \
--description "Detects employee IDs in proximity of a keyword." \
--tags '{"Stack":"Production"}'
```

Dieses Beispiel ist für Microsoft Windows formatiert und verwendet das Zeilenfortsetzungszeichen Caret (^), um die Lesbarkeit zu verbessern.

```
C:\> aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs" ^
--regex "[A-Z]-\d{8}" ^
--keywords "[\"employee\",\"employee ID\"]" ^
--maximum-match-distance 20 ^
--severity-levels "[{\"occurrencesThreshold\":1,\"severity\":\"LOW\"},{\"occurrencesThreshold\":50,\"severity\":\"MEDIUM\"},{\"occurrencesThreshold\":100,\"severity\":\"HIGH\"}]" ^
--description "Detects employee IDs in proximity of a keyword." ^
--tags={\"Stack\":\"Production\"}
```

Wobei Folgendes gilt:
+ `EmployeeIDs`ist der Name des benutzerdefinierten Datenbezeichners.
+ `[A-Z]-\d{8}`ist der reguläre Ausdruck für das passende Textmuster.
+ `employee`und `employee ID` sind Schlüsselwörter, die sich in der Nähe von Text befinden müssen, der dem Regex-Muster entspricht.
+ `20`ist die maximale Anzahl von Zeichen, die zwischen dem Ende eines Schlüsselworts und dem Ende des Textes, der dem Regex-Muster entspricht, existieren können.
+ `description`gibt eine kurze Beschreibung des benutzerdefinierten Datenbezeichners an.
+ `severity-levels`definiert benutzerdefinierte Schwellenwerte für den Schweregrad der Ergebnisse, die der benutzerdefinierte Datenbezeichner hervorruft: `LOW` für 1—49 Vorkommen, `MEDIUM` für 50—99 Vorkommen und für 100 oder mehr Vorkommen. `HIGH`
+ `Stack`ist der Tag-Schlüssel des Tags, das der benutzerdefinierten Daten-ID zugewiesen werden soll. `Production`ist der Tag-Wert für den angegebenen Tag-Schlüssel.

------

Nachdem Sie den benutzerdefinierten Datenbezeichner erstellt haben, können Sie [Discovery-Jobs für sensible Daten erstellen und konfigurieren](discovery-jobs-create.md), um ihn zu verwenden, oder [ihn zu Ihren Einstellungen für die automatische Erkennung vertraulicher Daten hinzufügen](discovery-asdd-account-configure.md).