Erstellen eines Schemas und eines Datensatzes - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines Schemas und eines Datensatzes

Nachdem Sie eine Datensatzgruppe erstellt haben, können Sie ein Amazon Personalize und einen Datensatz für jeden Datentyp, den Sie importieren, erstellen. Ein Schema informiert Amazon Personalize über die Struktur Ihrer Daten und ermöglicht Amazon Personalize, die Daten zu analysieren. Wenn Sie ein Schema in Amazon Personalize erstellen, verwenden Sie die JSON Datei, in JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen der Sie es erstellt haben.

Ein Datensatz ist ein Container für Trainingsdaten in Amazon Personalize. Verschiedene Datensatztypen haben unterschiedliche Anforderungen. Sie erstellen für jeden Datentyp, den Sie importieren, einen Datensatz. Informationen zu den verschiedenen Arten von Datensätzen und zur Vorbereitung Ihrer Daten finden Sie unterVorbereiten von Trainingsdaten für Amazon Personalize.

Sie können Schemas und Datensätze mit der Amazon Personalize Personalize-Konsole, AWS Command Line Interface (AWS CLI) oder erstellen. AWS SDKs Sie können in einer Domain-Datensatzgruppe keine Ressourcen für die nächste beste Aktion, einschließlich der Datensätze „Aktionen“ und „Aktionsinteraktionen“, erstellen.

Wichtig

Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen. Wenn Sie jedoch neue Spalten hinzufügen, können Sie das Schema eines Datensatzes durch ein neues ersetzen. Weitere Informationen finden Sie unter Das Schema eines Datensatzes ersetzen, um neue Spalten hinzuzufügen.

Einen Datensatz und ein Schema erstellen (Konsole)

Wenn dies Ihr erster Datensatz in Ihrer Datensatzgruppe ist, ist Ihr erster Datensatztyp ein Datensatz mit Artikelinteraktionen. Um Ihren Datensatz mit Artikelinteraktionen in der Konsole zu erstellen, geben Sie den Datensatznamen und anschließend ein JSON Schema im Avro-Format an. Wenn es nicht Ihr erster Datensatz in dieser Datensatzgruppe ist, wählen Sie den Datensatztyp und geben Sie dann einen Namen und ein Schema an.

Informationen zu den Anforderungen von Amazon Personalize Personalize-Datensätzen finden Sie unter. Vorbereiten von Trainingsdaten für Amazon Personalize Wenn Sie den Vorgang gerade abgeschlossen haben Eine Amazon Personalize Personalize-Datensatzgruppe erstellen und bereits dabei sind, Ihren Datensatz zu erstellen, fahren Sie mit Schritt 4 dieses Verfahrens fort.

Um einen Datensatz und ein Schema zu erstellen
  1. Falls Sie dies noch nicht getan haben, folgen Sie den Anweisungen unter, JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen um eine JSON Schemadatei zu erstellen, die Ihre Daten umreißt.

  2. Öffnen Sie zu https://console.aws.amazon.com/personalize/Hause die Amazon Personalize Personalize-Konsole und melden Sie sich bei Ihrem Konto an.

  3. Wählen Sie auf der Seite Datensatzgruppen die Datensatzgruppe aus, in Eine Amazon Personalize Personalize-Datensatzgruppe erstellen der Sie sie erstellt haben.

  4. In Schritt 1. Datensätze erstellen und Daten importieren, wählen Sie Datensatz erstellen und wählen Sie den Typ des zu erstellenden Datensatzes aus.

  5. Wählen Sie Daten direkt in Amazon Personalize Personalize-Datensätze importieren und dann Weiter.

  6. Geben Sie unter Datensatzdetails für Datensatzname einen Namen für Ihren Datensatz an.

  7. Wählen Sie für Datensatzschema entweder Neues Schema erstellen oder Bestehendes Schema verwenden aus.

  8. Wenn Sie ein vorhandenes Schema verwenden, wählen Sie das zu verwendende bestehende Schema aus. Wenn Sie ein neues Schema erstellen, geben Sie dem Schema einen Namen und fügen Sie das Schema einJSON, das Ihren Daten entspricht. Sie haben diese Datei in erstelltJSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen.

  9. Fügen Sie für Tags optional beliebige Tags hinzu. Weitere Informationen zum Taggen von Amazon Personalize Personalize-Ressourcen finden Sie unter. Taggen von Amazon Personalize Personalize-Ressourcen

  10. Wählen Sie Weiter und folgen Sie den Anweisungen unter, um Ihre Trainingsdaten in Amazon Personalize Personalize-Datensätze importieren Daten zu importieren.

Einen Datensatz und ein Schema erstellen (AWS CLI)

Um einen Datensatz und ein Schema mit dem zu erstellen AWS CLI, verwenden Sie den create-schema Befehl (der die CreateSchema API Operation verwendet) und dann create-dataset (der die CreateDataset API Operation verwendet).

Um ein Schema und einen Datensatz zu erstellen
  1. Falls Sie dies noch nicht getan haben, folgen Sie den Anweisungen unter, JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen um eine JSON Schemadatei zu erstellen, die Ihre Daten umreißt.

  2. Erstellen Sie ein Schema in Amazon Personalize, indem Sie den folgenden Befehl ausführen. Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen. schemaNameErsetzen Sie es durch den Namen des Schemas und file://SchemaName.json ersetzen Sie es durch den Speicherort Ihrer JSON Datei. Das Beispiel zeigt die Datei als Teil des aktuellen Ordners. Wenn Sie ein Schema für einen Datensatz in einer Domain-Datensatzgruppe erstellen, fügen Sie den domain Parameter hinzu und setzen Sie ihn auf ECOMMERCE oderVIDEO_ON_DEMAND. Weitere Informationen zu APIfinden Sie unter CreateSchema.

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    Das Schema Amazon Resource Name (ARN) wird angezeigt, wie im folgenden Beispiel gezeigt:

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. Erstellen Sie ein leeres Dataset, indem Sie den folgenden Befehl ausführen. Geben Sie die Datensatzgruppe Amazon Resource Name (ARN) von Eine Datensatzgruppe erstellen (AWS CLI) und das Schema ARN aus dem vorherigen Schritt an. Die Werte für den Datensatztyp können InteractionsUsers,Items,Actions, oder seinAction_Interactions. Weitere Informationen zu APIfinden Sie unter CreateDataset.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    Der Datensatz ARN wird angezeigt, wie im folgenden Beispiel gezeigt.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. Notieren Sie den Datensatz ARN für die spätere Verwendung. Nachdem Sie einen Datensatz erstellt haben, können Sie Ihre Trainingsdaten importieren. Siehe Trainingsdaten in Amazon Personalize Personalize-Datensätze importieren.

Einen Datensatz und ein Schema erstellen (AWS SDKs)

Um einen Datensatz und ein Schema mit dem zu erstellen AWS SDKs, definieren Sie zunächst ein Schema im Avro-Format und fügen es mithilfe der CreateSchema Operation zu Amazon Personalize hinzu. Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen. Erstellen Sie dann mithilfe der CreateDataset Operation einen Datensatz.

Um ein Schema und einen Datensatz zu erstellen
  1. Falls Sie dies noch nicht getan haben, folgen Sie den Anweisungen unter, JSONSchemadateien für Amazon Personalize Personalize-Schemas erstellen um eine JSON Schemadatei zu erstellen, die Ihre Daten umreißt.

  2. Erstellen Sie ein Schema in Amazon Personalize mit dem folgenden Code. Geben Sie den Namen für Ihr Schema und den Dateipfad für Ihre JSON Schemadatei an. Wenn Sie ein Schema für einen Datensatz in einer Domain-Dataset-Gruppe erstellen, fügen Sie den domain Parameter hinzu und setzen Sie ihn auf ECOMMERCE oderVIDEO_ON_DEMAND. Weitere Informationen zu APIfinden Sie unter CreateSchema.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from "node:fs"; const schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = "TEST"; // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: "NAME" /* required */, schema: mySchema /* required */, }; export const run = async () => { try { const response = await personalizeClient.send( new CreateSchemaCommand(createSchemaParam), ); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Amazon Personalize gibt das ARN des neuen Schemas zurück. Nehmen Sie es auf, weil Sie es im nächsten Schritt benötigen werden.

  3. Erstellen Sie mithilfe der CreateDataset Operation einen Datensatz. Der folgende Code zeigt, wie ein Datensatz erstellt wird. Geben Sie den Amazon-Ressourcennamen (ARN) Ihrer Datensatzgruppe, das Schema ARN aus dem vorherigen Schritt und den Datensatztyp an. Die Werte für den Datensatztyp können InteractionsUsers,Items,Actions, oder seinAction_Interactions. Hinweise zu den verschiedenen Typen von Datensätzen finden Sie unterVorbereiten von Trainingsdaten für Amazon Personalize.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: "DATASET_GROUP_ARN" /* required */, datasetType: "DATASET_TYPE" /* required */, name: "NAME" /* required */, schemaArn: "SCHEMA_ARN" /* required */, }; export const run = async () => { try { const response = await personalizeClient.send( new CreateDatasetCommand(createDatasetParam), ); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Nachdem Sie einen Datensatz erstellt haben, können Sie Ihre Trainingsdaten importieren. Siehe Trainingsdaten in Amazon Personalize Personalize-Datensätze importieren.