Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen
Nachdem Sie Ihre Daten vorbereitet haben, können Sie JSON Schemadateien für jeden Datentyp erstellen, den Sie importieren. Diese Dateien beschreiben die Struktur und den Inhalt Ihrer Daten, einschließlich der Spaltennamen und ihrer Datentypen.
Sie verwenden JSON Schemadateien, wenn Sie ein Amazon Personalize Personalize-Schema in Erstellen eines Schemas und eines Datensatzes erstellen. In Amazon Personalize ist ein Schema eine Ressource, die es Amazon Personalize ermöglicht, die Daten zu analysieren, wenn Sie sie in Ihren Datensatz importieren. Sie erstellen ein Schema für jeden Datensatz, den Sie verwenden.
Für benutzerdefinierte Ressourcen gelten für jeden Datensatz spezifische Schemaanforderungen. Bei Domain-Datensatzgruppen bestimmt die von Ihnen gewählte Domain Ihre Datensatz- und Schemaanforderungen. Jede Domain hat ein Standardschema für jeden Datensatztyp. Wenn Sie einen Datensatz erstellen, können Sie entweder das vorhandene Domänenschema verwenden oder ein neues erstellen, indem Sie das vorhandene Standardschema ändern. Verwenden Sie das Standardschema als Leitfaden dafür, welche Daten für Ihre Domain importiert werden sollen.
Die folgenden Abschnitte enthalten benutzerdefinierte Anforderungen und Domänenanforderungen für die Erstellung einer JSON Schemadatei für jeden Datensatztyp.
Themen
Anforderungen an die Schemaformatierung
Wenn Sie ein Schema für einen Datensatz in einer Domain-Datensatzgruppe oder einer benutzerdefinierten Datensatzgruppe erstellen, müssen Sie die folgenden Richtlinien beachten:
-
Sie müssen das Schema im Avro-Format
definieren. Informationen zu den Avro-Datentypen, die wir unterstützen, finden Sie unter. Schema-Datentypen -
Ein Schema hat einen Namensschlüssel, dessen Wert dem Datensatztyp entsprechen muss.
-
Die Schemafelder können in beliebiger Reihenfolge erscheinen, müssen jedoch der Reihenfolge der entsprechenden Spaltenüberschriften in Ihrer CSV Datei entsprechen.
-
Bei Schemas muss es sich um flache JSON Dateien ohne verschachtelte Strukturen handeln. Ein Feld kann beispielsweise nicht mehreren Unterfeldern übergeordnet sein.
-
Amazon Personalize Personalize-Schemas unterstützen keine komplexen Typen wie Arrays und Maps.
-
Schemafelder müssen eindeutige alphanumerische Namen haben. Sie können beispielsweise nicht gleichzeitig ein
GENRES_FIELD_1
Feld und einGENRESFIELD1
Feld hinzufügen. -
Sie müssen Pflichtfelder als ihre erforderlichen Datentypen definieren. Für reservierte kategoriale Zeichenfolgenfelder muss das
categorical
Attribut auf gesetzt seintrue
, während reservierte Zeichenkettenfelder nicht kategorisch sein können. Die Schlüsselwörter dürfen nicht in Ihren Daten enthalten sein. -
Wenn Sie Ihr eigenes Metadatenfeld vom Typ hinzufügen
string
und möchten, dass Amazon Personalize es beim Training verwendet, muss es dascategorical
Attribut oder dastextual
Attribut enthalten (nur Artikelschemas unterstützen Felder mit dem Textattribut). -
Amazon Personalize verwendet beim Training oder Filtern von Empfehlungen keine
boolean
Typdaten. Damit Amazon Personalize beim Training oder Filtern boolesche Daten verwendet, verwenden Sie ein Feld vom Typ String und verwenden Sie die Werte"True"
und"False"
in Ihren Daten. Oder Sie können den Typ int oder long und die Werte und verwenden.0
1
-
Textfelder müssen vom Typ sein
string
und dastextual
Attribut muss auf gesetzt seintrue
. Weitere Hinweise zu unstrukturierten Textdaten finden Sie unter. Unstrukturierte Textmetadaten
Für Datensätze mit Domänen-Datensatzgruppen gelten zusätzliche Anforderungen, die sowohl auf der Domäne als auch auf dem Datensatztyp basieren. Für Datensätze mit benutzerdefinierten Datensatzgruppen gelten je nach Typ zusätzliche Anforderungen.
Schema-Datentypen
Amazon Personalize Personalize-Schemas unterstützen die folgenden Avro-Typen für Felder:
-
float
-
double
-
int
-
long
-
Zeichenfolge
-
Boolesch
-
Null
Einige erforderliche und reservierte Felder unterstützen Nulldaten. Wenn Sie einem Feld einen null
Typ hinzufügen, können Sie unvollständige Daten (z. B. Metadaten mit leeren Werten) verwenden, um Empfehlungen zu generieren. Informationen darüber, welche Felder Nulldaten unterstützen, finden Sie im Thema Schemaanforderungen für Ihre Domain: VIDEO_ON_ DEMAND Datensätze und SchemasECOMMERCEDatensätze und Schemas, oderBenutzerdefinierte Datensätze und Schemas. Das folgende Beispiel zeigt, wie ein Nulltyp für ein GENDER Feld hinzugefügt wird.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }