Creazione di uno schema e di un set di dati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di uno schema e di un set di dati

Dopo aver creato un gruppo di set di dati, sei pronto per creare uno schema Amazon Personalize e un set di dati per ogni tipo di dati che stai importando. Uno schema indica ad Amazon Personalize la struttura dei dati e consente ad Amazon Personalize di analizzare i dati. Quando crei uno schema in Amazon Personalize, usi il JSON file in cui lo hai creato. Creazione di JSON file di schema per schemi Amazon Personalize

Un set di dati è un contenitore per i dati di addestramento in Amazon Personalize. Tipi di set di dati diversi hanno requisiti diversi. Crei un set di dati per ogni tipo di dati che stai importando. Per informazioni sui diversi tipi di set di dati e su come preparare i dati, consulta. Preparazione dei dati di formazione per Amazon Personalize

Puoi creare schemi e set di dati con la console Amazon Personalize, AWS Command Line Interface (AWS CLI), oppure AWS SDKs. Non è possibile creare le migliori risorse di azione successive, inclusi i set di dati Actions e Action Interactions, in un gruppo di set di dati di dominio.

Importante

Dopo aver creato uno schema, non è possibile apportare modifiche allo schema. Tuttavia, se aggiungi nuove colonne, puoi sostituire lo schema di un set di dati con uno nuovo. Per ulteriori informazioni, consulta Sostituzione dello schema di un set di dati per aggiungere nuove colonne.

Creazione di un set di dati e di uno schema (console)

Se questo è il primo set di dati nel gruppo di set di dati, il primo tipo di set di dati sarà un set di dati sulle interazioni tra elementi. Per creare il set di dati sulle interazioni degli elementi nella console, specifica il nome del set di dati e quindi specifica uno schema in formato Avro. JSON Se non è il primo set di dati in questo gruppo di set di dati, scegli il tipo di set di dati e quindi specifica un nome e uno schema.

Per informazioni sui requisiti dei set di dati di Amazon Personalize, consulta. Preparazione dei dati di formazione per Amazon Personalize Se hai appena completato Creazione di un gruppo di set di dati Amazon Personalize e stai già creando il set di dati, vai al passaggio 4 di questa procedura.

Per creare un set di dati e uno schema
  1. Se non l'hai già fatto, segui le istruzioni Creazione di JSON file di schema per schemi Amazon Personalize per creare un JSON file di schema che descriva i tuoi dati.

  2. Apri la console Amazon Personalize a https://console.aws.amazon.com/personalize/casa e accedi al tuo account.

  3. Nella pagina dei gruppi di set di dati, scegli il gruppo di set di dati in cui hai creato. Creazione di un gruppo di set di dati Amazon Personalize

  4. Nel passaggio 1. Crea set di dati e importa dati scegli Crea set di dati e scegli il tipo di set di dati da creare.

  5. Scegli Importa i dati direttamente nei set di dati di Amazon Personalize e scegli Avanti.

  6. Nei dettagli del set di dati, per Nome del set di dati, specifica un nome per il set di dati.

  7. Per lo schema del set di dati, scegli Crea un nuovo schema o Usa uno schema esistente.

  8. Se utilizzi uno schema esistente, scegli lo schema esistente da utilizzare. Se stai creando un nuovo schema, assegna un nome allo schema e incolla lo schema JSON che corrisponde ai tuoi dati. Hai creato questo file inCreazione di JSON file di schema per schemi Amazon Personalize.

  9. Per i tag, aggiungi facoltativamente qualsiasi tag. Per ulteriori informazioni sull'etichettatura delle risorse Amazon Personalize, consulta. Etichettare le risorse di Amazon Personalize

  10. Scegli Avanti e segui le istruzioni Importazione di dati di formazione nei set di dati di Amazon Personalize per importare i dati.

Creazione di un set di dati e di uno schema (AWS CLI)

Per creare un set di dati e uno schema utilizzando il AWS CLI, si utilizza il create-schema comando (che utilizza l'CreateSchemaAPIoperazione) e quindi create-dataset (che utilizza l'CreateDatasetAPIoperazione).

Per creare uno schema e un set di dati
  1. Se non l'hai già fatto, segui le istruzioni in basso Creazione di JSON file di schema per schemi Amazon Personalize per creare un JSON file di schema che descriva i tuoi dati.

  2. Crea uno schema in Amazon Personalize eseguendo il seguente comando. Dopo aver creato uno schema, non puoi apportare modifiche allo schema. Sostituiscilo schemaName con il nome dello schema e sostituiscilo file://SchemaName.json con la posizione del JSON file. L'esempio illustra il file come appartenente alla cartella corrente. Se state creando uno schema per un set di dati in un gruppo di set di dati Domain, aggiungete il domain parametro e impostatelo su o. ECOMMERCE VIDEO_ON_DEMAND Per ulteriori informazioni suAPI, vedere. CreateSchema

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    Viene visualizzato lo schema Amazon Resource Name (ARN), come illustrato nell'esempio seguente:

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. Creare un gruppo di set di dati vuoto eseguendo il seguente comando. Fornisci il gruppo di set di dati Amazon Resource Name (ARN) Creazione di un gruppo di set di dati (AWS CLI) e lo schema ARN del passaggio precedente. I valori del tipo di set di dati possono essereInteractions,Users, ItemsActions, o. Action_Interactions Per ulteriori informazioni suAPI, vedereCreateDataset.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    Il set di dati ARN viene visualizzato, come illustrato nell'esempio seguente.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. Registra il set di dati ARN per un uso successivo. Dopo aver creato un set di dati, sei pronto per importare i dati di allenamento. Per informazioni, consulta Importazione di dati di formazione nei set di dati di Amazon Personalize.

Creazione di un set di dati e di uno schema (AWS SDKs)

Per creare un set di dati e uno schema utilizzando il AWS SDKs, devi prima definire uno schema in formato Avro e aggiungerlo ad Amazon Personalize utilizzando l'CreateSchemaoperazione. Dopo aver creato uno schema, non puoi apportare modifiche allo schema. Quindi crea un set di dati utilizzando l'CreateDatasetoperazione.

Per creare uno schema e un set di dati
  1. Se non l'hai già fatto, segui le istruzioni Creazione di JSON file di schema per schemi Amazon Personalize per creare un JSON file di schema che descriva i tuoi dati.

  2. Crea uno schema in Amazon Personalize con il codice seguente. Specificate il nome dello schema e il percorso del JSON file dello schema. Se state creando uno schema per un set di dati in un gruppo di set di dati di dominio, aggiungete il domain parametro e impostatelo su o. ECOMMERCE VIDEO_ON_DEMAND Per ulteriori informazioni suAPI, vedere. CreateSchema

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from 'fs'; let schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = 'TEST' // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: 'NAME', /* required */ schema: mySchema /* required */ }; export const run = async () => { try { const response = await personalizeClient.send(new CreateSchemaCommand(createSchemaParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Amazon Personalize restituisce il ARN nuovo schema. Registralo perché ti servirà nel passaggio successivo.

  3. Crea un set di dati utilizzando l'CreateDatasetoperazione. Il codice seguente mostra come creare un set di dati. Specificate l'Amazon Resource Name (ARN) del gruppo di set di dati, lo schema ARN del passaggio precedente e specificate il tipo di set di dati. I valori del tipo di set di dati possono essereInteractions,, UsersItems, Actions o. Action_Interactions Per informazioni sui diversi tipi di set di dati, vedere. Preparazione dei dati di formazione per Amazon Personalize

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: 'DATASET_GROUP_ARN', /* required */ datasetType: 'DATASET_TYPE', /* required */ name: 'NAME', /* required */ schemaArn: 'SCHEMA_ARN' /* required */ } export const run = async () => { try { const response = await personalizeClient.send(new CreateDatasetCommand(createDatasetParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Dopo aver creato un set di dati, sei pronto per importare i dati di allenamento. Per informazioni, consulta Importazione di dati di formazione nei set di dati di Amazon Personalize.