Processar dados e importá-los para o Amazon Personalize - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Processar dados e importá-los para o Amazon Personalize

Quando terminar de analisar e transformar seus dados, você poderá processá-los e importá-los para o Amazon Personalize.

  • Processamento de dados — O processamento dos dados aplica sua transformação a todo o conjunto de dados e os envia para um destino especificado por você. Nesse caso, você especifica um bucket do Amazon S3.

  • Importação de dados para o Amazon Personalize — Para importar dados processados para o Amazon Personalize, você executa um notebook Jupyter fornecido no Studio Classic. SageMaker Esse caderno cria seus conjuntos de dados do Amazon Personalize e importa seus dados para eles.

Processar dados

Antes de importar dados para o Amazon Personalize, você deverá aplicar sua transformação em todo o conjunto de dados e enviá-lo para um bucket do Amazon S3. Para fazer isso, crie um nó de destino com o destino definido como um bucket do Amazon S3 e, em seguida, inicie uma tarefa de processamento para a transformação.

Para step-by-step obter instruções sobre como especificar um destino e iniciar um trabalho de processo, consulte Iniciar trabalhos de processamento com alguns cliques usando o Amazon SageMaker Data Wrangler. Ao adicionar um destino, selecione Amazon S3. Você usará esse local ao importar os dados processados para o Amazon Personalize.

Ao terminar de processar seus dados, você poderá importá-los do bucket do Amazon S3 para o Amazon Personalize.

Importar dados para o Amazon Personalize

Depois de processar seus dados, você poderá importá-los para o Amazon Personalize. Para importar dados processados para o Amazon Personalize, você executa um notebook Jupyter fornecido no Studio Classic. SageMaker Esse caderno cria seus conjuntos de dados do Amazon Personalize e importa seus dados para eles.

Para importar dados processados para o Amazon Personalize
  1. Para a transformação que você deseja exportar, selecione Exportar para e selecione Amazon Personalize (via caderno Jupyter).

  2. Modifique o caderno para especificar o bucket do Amazon S3 que você usou como destino de dados para a tarefa de processamento. Opcionalmente, especifique o domínio do seu grupo de conjuntos de dados. Por padrão, o caderno cria um grupo de conjuntos de dados personalizado.

  3. Examine as células do caderno que criam o esquema. Verifique se os campos do esquema têm os tipos e atributos esperados antes de executar a célula.

    • Verifique se, nos campos que oferecem suporte a dados nulos, há null na lista de tipos. O exemplo a seguir mostra como adicionar null para um campo.

      { "name": "GENDER", "type": [ "null", "string" ], "categorical": true }
    • Verifique se os campos categóricos têm o atributo categórico definido como verdadeiro. O exemplo a seguir mostra como marcar um campo como categórico.

      { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true }
    • Verifique se os campos textuais têm o atributo textual definido como verdadeiro. O exemplo a seguir mostra como marcar um campo como textual.

      { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }
  4. Execute o caderno para criar um esquema, criar um conjunto de dados e importar seus dados para o conjunto de dados do Amazon Personalize. Você executa o notebook da mesma forma que faria com um notebook fora do SageMaker Studio Classic. Para obter informações sobre como executar cadernos Jupyter, consulte Execução de código. Para obter informações sobre notebooks no SageMaker Studio Classic, consulte Use Amazon SageMaker Notebooks no Amazon SageMaker Developer Guide.

    Depois de concluir o caderno, se você tiver importado dados de interações, poderá criar recomendadores ou atributos personalizados. Ou você pode repetir o processo com um conjunto de dados de itens ou de usuários.