Memproses data dan mengimpornya ke Amazon Personalize - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memproses data dan mengimpornya ke Amazon Personalize

Ketika Anda selesai menganalisis dan mengubah data Anda, Anda siap untuk memprosesnya dan mengimpornya ke Amazon Personalize.

  • Memproses data — Memproses data menerapkan transformasi Anda ke seluruh kumpulan data Anda dan mengeluarkannya ke tujuan yang Anda tentukan. Dalam hal ini Anda menentukan bucket Amazon S3.

  • Mengimpor data ke Amazon Personalize — Untuk mengimpor data yang diproses ke Amazon Personalize, Anda menjalankan Notebook Jupyter yang disediakan di Studio Classic. SageMaker Notebook ini membuat kumpulan data Amazon Personalize Anda dan mengimpor data Anda ke dalamnya.

Pemrosesan data

Sebelum mengimpor data ke Amazon Personalize, Anda harus menerapkan transformasi ke seluruh kumpulan data dan mengeluarkannya ke bucket Amazon S3. Untuk melakukannya, Anda membuat node tujuan dengan tujuan disetel ke bucket Amazon S3, lalu meluncurkan pekerjaan pemrosesan untuk transformasi.

Untuk step-by-step petunjuk tentang menentukan tujuan dan meluncurkan pekerjaan proses, lihat Meluncurkan pekerjaan pemrosesan dengan beberapa klik menggunakan Amazon SageMaker Data Wrangler. Saat Anda menambahkan tujuan, pilih Amazon S3. Anda akan menggunakan lokasi ini saat mengimpor data yang diproses ke Amazon Personalize.

Setelah selesai memproses data, Anda siap mengimpornya dari bucket Amazon S3 ke Amazon Personalize.

Mengimpor data ke Amazon Personalize

Setelah Anda memproses data Anda, Anda siap untuk mengimpornya ke Amazon Personalize. Untuk mengimpor data yang diproses ke Amazon Personalize, Anda menjalankan Notebook Jupyter yang disediakan di Studio Classic. SageMaker Notebook ini membuat kumpulan data Amazon Personalize Anda dan mengimpor data Anda ke dalamnya.

Untuk mengimpor data yang diproses ke Amazon Personalize
  1. Untuk transformasi yang ingin Anda ekspor, pilih Ekspor ke dan pilih Amazon Personalize (via Jupyter Notebook).

  2. Ubah buku catatan untuk menentukan bucket Amazon S3 yang Anda gunakan sebagai tujuan data untuk pekerjaan pemrosesan. Secara opsional tentukan domain untuk grup kumpulan data Anda. Secara default, notebook membuat grup dataset kustom.

  3. Tinjau sel notebook yang membuat skema. Verifikasi bahwa bidang skema memiliki tipe dan atribut yang diharapkan sebelum menjalankan sel.

    • Verifikasi bahwa bidang yang mendukung data nol telah null tercantum dalam daftar jenis. Contoh berikut menunjukkan cara menambahkan null untuk bidang.

      { "name": "GENDER", "type": [ "null", "string" ], "categorical": true }
    • Verifikasi bahwa bidang kategoris memiliki atribut kategoris disetel ke true. Contoh berikut menunjukkan cara menandai bidang kategoris.

      { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true }
    • Verifikasi bahwa bidang tekstual memiliki atribut tekstual disetel ke true. Contoh berikut menunjukkan cara menandai bidang sebagai tekstual.

      { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }
  4. Jalankan buku catatan untuk membuat skema, dan membuat kumpulan data, dan impor data Anda ke dalam kumpulan data Amazon Personalize. Anda menjalankan notebook seperti halnya notebook di luar SageMaker Studio Classic. Untuk informasi tentang menjalankan notebook Jupyter, lihat Menjalankan Kode. Untuk informasi tentang buku catatan di SageMaker Studio Classic, lihat Menggunakan SageMaker Notebook Amazon di Panduan SageMaker Pengembang Amazon.

    Setelah Anda menyelesaikan buku catatan, jika Anda mengimpor data interaksi, Anda siap untuk membuat pemberi rekomendasi atau sumber daya khusus. Atau Anda dapat mengulangi prosesnya dengan kumpulan data item atau kumpulan data pengguna.