Mempersiapkan dan mengimpor data massal menggunakan Amazon SageMaker Data Wrangler - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mempersiapkan dan mengimpor data massal menggunakan Amazon SageMaker Data Wrangler

penting

Saat Anda menggunakan Data Wrangler, Anda dikenakan SageMaker biaya. Untuk daftar lengkap biaya dan harga, lihat tab Data Wrangler dari harga Amazon SageMaker . Untuk menghindari biaya tambahan, setelah selesai, matikan instans Data Wrangler Anda. Untuk informasi selengkapnya, lihat Matikan Data Wrangler.

Setelah membuat grup kumpulan data, Anda dapat menggunakan Amazon SageMaker Data Wrangler (Data Wrangler) untuk mengimpor data dari 40+ sumber ke kumpulan data Amazon Personalize. Data Wrangler adalah fitur Amazon SageMaker Studio Classic yang menyediakan end-to-end solusi untuk mengimpor, menyiapkan, mengubah, dan menganalisis data. Anda tidak dapat menggunakan Data Wrangler untuk menyiapkan dan mengimpor data ke dalam kumpulan data Tindakan atau kumpulan data interaksi Tindakan.

Saat Anda menggunakan Data Wrangler untuk menyiapkan dan mengimpor data, Anda menggunakan aliran data. Aliran data mendefinisikan serangkaian langkah persiapan data pembelajaran mesin, dimulai dengan mengimpor data. Setiap kali Anda menambahkan langkah ke alur Anda, Data Wrangler mengambil tindakan pada data Anda, seperti mengubahnya atau menghasilkan visualisasi.

Berikut ini adalah beberapa langkah yang dapat Anda tambahkan ke alur Anda untuk menyiapkan data untuk Amazon Personalize:

  • Wawasan: Anda dapat menambahkan Amazon Personalisasi langkah-langkah wawasan tertentu ke alur Anda. Wawasan ini dapat membantu Anda mempelajari tentang data Anda dan tindakan apa yang dapat Anda ambil untuk memperbaikinya.

  • Visualisasi: Anda dapat menambahkan langkah-langkah visualisasi untuk menghasilkan grafik seperti histogram dan plot pencar. Grafik dapat membantu Anda menemukan masalah dalam data Anda, seperti outlier atau nilai yang hilang.

  • Transformasi: Anda dapat menggunakan Amazon Personalize langkah-langkah transformasi spesifik dan umum untuk memastikan data Anda memenuhi persyaratan Amazon Personalize. Transformasi Amazon Personalize membantu Anda memetakan kolom data ke kolom yang diperlukan tergantung pada jenis dataset Amazon Personalize.

Jika Anda harus meninggalkan Data Wrangler sebelum mengimpor data ke Amazon Personalize, Anda dapat kembali ke tempat yang Anda tinggalkan dengan memilih jenis kumpulan data yang sama saat meluncurkan Data Wrangler dari konsol Amazon Personalize. Atau Anda dapat mengakses Data Wrangler langsung melalui SageMaker Studio Classic.

Kami menyarankan Anda mengimpor data dari Data Wrangler ke Amazon Personalize sebagai berikut. Langkah transformasi, visualisasi, dan analisis bersifat opsional, dapat diulang, dan dapat diselesaikan dalam urutan apa pun.

  1. Siapkan izin - Siapkan izin untuk Amazon Personalisasi SageMaker dan peran layanan. Dan siapkan izin untuk pengguna Anda.

  2. Luncurkan Data Wrangler di SageMaker Studio Classic dari konsol Amazon Personalize - Gunakan konsol Amazon Personalize untuk mengonfigurasi domain dan meluncurkan Data Wrangler SageMaker di Studio Classic. SageMaker

  3. Impor data Anda ke Data Wrangler - Impor data dari 40+ sumber ke Data Wrangler. Sumber termasuk AWS layanan, seperti Amazon Redshift, AmazonEMR, atau Amazon Athena, dan pihak ke-3 seperti Snowflake atau. DataBricks

  4. Ubah data Anda - Gunakan Data Wrangler untuk mengubah data Anda agar memenuhi persyaratan Amazon Personalize.

  5. Memvisualisasikan dan menganalisis data Anda - Gunakan Data Wrangler untuk memvisualisasikan data Anda dan menganalisisnya melalui Amazon Personalisasi wawasan tertentu.

  6. Memproses dan mengimpor data ke Amazon Personalize - Gunakan notebook SageMaker Studio Classic Jupyter untuk mengimpor data yang diproses ke Amazon Personalize.

Informasi tambahan

Sumber daya berikut memberikan informasi tambahan tentang penggunaan Amazon SageMaker Data Wrangler dan Amazon Personalize.