Criação de um esquema e um conjunto de dados - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de um esquema e um conjunto de dados

Depois de criar um grupo de conjuntos de dados, você estará pronto para criar um esquema do Amazon Personalize e um conjunto de dados para cada tipo de dados que você está importando. Um esquema informa ao Amazon Personalize sobre a estrutura dos seus dados e permite que o Amazon Personalize analise os dados. Ao criar um esquema no Amazon Personalize, você usa JSON o arquivo em que você criou. Criação de JSON arquivos de esquema para esquemas do Amazon Personalize

Um conjunto de dados é um contêiner para dados de treinamento no Amazon Personalize. Diferentes tipos de conjuntos de dados têm requisitos diferentes. Você cria um conjunto de dados para cada tipo de dado que está importando. Para obter informações sobre os diferentes tipos de conjuntos de dados e como preparar seus dados, consultePreparando dados de treinamento para o Amazon Personalize.

Você pode criar esquemas e conjuntos de dados com o console Amazon Personalize, AWS Command Line Interface (AWS CLI), ou AWS SDKs. Você não pode criar os próximos melhores recursos de ação, incluindo conjuntos de dados de ações e interações de ações, em um grupo de conjuntos de dados de domínio.

Importante

Depois de criar um esquema, não é possível fazer alterações no esquema. No entanto, se você adicionar novas colunas, poderá substituir o esquema de um conjunto de dados por um novo. Para obter mais informações, consulte Substituindo o esquema de um conjunto de dados para adicionar novas colunas.

Criar um conjunto de dados e um esquema (console)

Se esse for o primeiro conjunto de dados do grupo, o primeiro tipo de conjunto de dados será de interações com itens. Para criar seu conjunto de dados de interações de itens no console, especifique o nome do conjunto de dados e, em seguida, especifique um JSON esquema no formato Avro. Se não for seu primeiro conjunto de dados nesse grupo de conjuntos de dados, escolha o tipo de conjunto de dados e, em seguida, especifique um nome e um esquema.

Para obter informações sobre os requisitos dos conjuntos de dados do Amazon Personalize, consulte. Preparando dados de treinamento para o Amazon Personalize Se você acabou de concluir Criação de um grupo de conjuntos de dados do Amazon Personalize e já estiver criando o conjunto de dados, vá para a etapa 4 deste procedimento.

Para criar um conjunto de dados e um esquema
  1. Se ainda não o fez, siga as instruções em Criação de JSON arquivos de esquema para esquemas do Amazon Personalize para criar um JSON arquivo de esquema que descreva seus dados.

  2. Abra o console Amazon Personalize em https://console.aws.amazon.com/personalize/casa e faça login na sua conta.

  3. Na página Grupos de conjuntos de dados, escolha o grupo de conjuntos de dados que você criou em Criação de um grupo de conjuntos de dados do Amazon Personalize.

  4. Na Etapa 1. Crie conjuntos de dados e importe dados, escolha Criar conjunto de dados e escolha o tipo de conjunto de dados a ser criado.

  5. Escolha Importar dados diretamente para os conjuntos de dados do Amazon Personalize e depois Próximo.

  6. Em Detalhes do conjunto de dados, para Nome do conjunto de dados, especifique um nome para o conjunto de dados.

  7. Para Esquema do conjunto de dados, escolha Criar um novo esquema ou Usar um esquema existente.

  8. Se você estiver usando um esquema existente, escolha o esquema existente a ser usado. Se você estiver criando um novo esquema, dê um nome ao esquema e cole o esquema JSON que corresponda aos seus dados. Você criou esse arquivo emCriação de JSON arquivos de esquema para esquemas do Amazon Personalize.

  9. Para Tags, é possível adicionar quaisquer tags. Para obter mais informações sobre recursos de atribuição de tags do Amazon Personalize, consulte Usar tags nos recursos do Amazon Personalize.

  10. Escolha Avançar e siga as instruções em Importação de dados de treinamento para conjuntos de dados do Amazon Personalize para importar seus dados.

Criação de um conjunto de dados e um esquema (AWS CLI)

Para criar um conjunto de dados e um esquema usando o AWS CLI, você usa o create-schema comando the (que usa a CreateSchema API operação) e depois create-dataset (que usa a CreateDataset API operação).

Para criar um esquema e um conjunto de dados
  1. Se ainda não o fez, siga as instruções em Criação de JSON arquivos de esquema para esquemas do Amazon Personalize para criar um JSON arquivo de esquema que descreva seus dados.

  2. Crie um esquema no Amazon Personalize executando o seguinte comando. Depois de criar um esquema, não é possível fazer alterações no esquema. schemaNameSubstitua pelo nome do esquema e file://SchemaName.json substitua pelo local do seu JSON arquivo. O exemplo mostra o arquivo como pertencente à pasta atual. Se estiver criando um esquema para um conjunto de dados em um grupo de conjuntos de dados de domínio, adicione o parâmetro domain e defina-o como ECOMMERCE ou VIDEO_ON_DEMAND. Para obter mais informações sobre oAPI, consulteCreateSchema.

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    O esquema Amazon Resource Name (ARN) é exibido, conforme mostrado no exemplo a seguir:

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. Crie um conjunto de dados vazio executando o seguinte comando. Forneça o grupo de conjuntos de dados Amazon Resource Name (ARN) Criação de um grupo de conjuntos de dados (AWS CLI) e o esquema ARN da etapa anterior. Os valores de tipo de conjunto de dados podem ser Interactions, Users, Items, Actions ou Action_Interactions. Para obter mais informações sobre oAPI, consulteCreateDataset.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    O conjunto de dados ARN é exibido, conforme mostrado no exemplo a seguir.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. Registre o conjunto de dados ARN para uso posterior. Depois de criar um conjunto de dados, estará tudo pronto para importar os dados de treinamento. Consulte Importação de dados de treinamento para conjuntos de dados do Amazon Personalize.

Criação de um conjunto de dados e um esquema (AWS SDKs)

Para criar um conjunto de dados e um esquema usando o AWS SDKs, primeiro você define um esquema no formato Avro e o adiciona ao Amazon Personalize usando a operação. CreateSchema Depois de criar um esquema, não é possível fazer alterações no esquema. Em seguida, crie um conjunto de dados usando a operação CreateDataset.

Para criar um esquema e um conjunto de dados
  1. Se ainda não o fez, siga as instruções em Criação de JSON arquivos de esquema para esquemas do Amazon Personalize para criar um JSON arquivo de esquema que descreva seus dados.

  2. Crie um esquema no Amazon Personalize com o código a seguir. Especifique o nome do esquema e o caminho do arquivo do esquemaJSON. Se estiver criando um esquema para um conjunto de dados em um grupo de conjuntos de dados de domínio, adicione o parâmetro domain e defina-o como ECOMMERCE ou VIDEO_ON_DEMAND. Para obter mais informações sobre oAPI, consulteCreateSchema.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from 'fs'; let schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = 'TEST' // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: 'NAME', /* required */ schema: mySchema /* required */ }; export const run = async () => { try { const response = await personalizeClient.send(new CreateSchemaCommand(createSchemaParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    O Amazon Personalize retorna o ARN do novo esquema. Grave-o, pois ele será necessário na próxima etapa.

  3. Crie um conjunto de dados usando a operação CreateDataset. O código a seguir mostra como criar um conjunto de dados. Especifique o Amazon Resource Name (ARN) do seu grupo de conjuntos de dados, o esquema ARN da etapa anterior e especifique o tipo de conjunto de dados. Os valores de tipo de conjunto de dados podem ser Interactions, Users, Items, Actions ou Action_Interactions. Para obter informações sobre os diferentes tipos de conjuntos de dados, consulte Preparando dados de treinamento para o Amazon Personalize.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: 'DATASET_GROUP_ARN', /* required */ datasetType: 'DATASET_TYPE', /* required */ name: 'NAME', /* required */ schemaArn: 'SCHEMA_ARN' /* required */ } export const run = async () => { try { const response = await personalizeClient.send(new CreateDatasetCommand(createDatasetParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Depois de criar um conjunto de dados, estará tudo pronto para importar os dados de treinamento. Consulte Importação de dados de treinamento para conjuntos de dados do Amazon Personalize.