Langkah 2: Membuat Pelatihan Datasource - Amazon Machine Learning

Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihatApa itu Amazon Machine Learning.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Langkah 2: Membuat Pelatihan Datasource

Setelah Anda meng-uploadbanking.csvlokasi Amazon Simple Storage Service (Amazon S3), Anda menggunakannya untuk membuat sumber data pelatihan. Sumber data adalah objek Amazon Machine Learning (Amazon ML) yang berisi lokasi data input dan metadata penting tentang data input Anda. Amazon IL menggunakan sumber data untuk operasi seperti pelatihan dan evaluasi model ML-nya.

Untuk membuat sumber data, berikan yang berikut ini:

  • Lokasi Amazon S3 dari data Anda untuk mengakses data

  • Skema, yang mencakup nama-nama atribut dalam data dan jenis masing-masing atribut (Numeric, Text, Categical, or Binary)

  • Nama atribut yang berisi jawaban yang Anda inginkan Amazon MLnya untuk memprediksi, atribut target

catatan

Sumber data tidak benar-benar menyimpan data Anda, itu hanya mereferensikannya. Hindari memindahkan atau mengubah file yang tersimpan di Amazon S3. Jika Anda memindahkan atau mengubahnya, Amazon XML tidak dapat mengaksesnya untuk membuat model ML-nya, menghasilkan evaluasi, atau menghasilkan prediksi.

Untuk membuat sumber data pelatihan
  1. Buka konsol Amazon Machine Learning dihttps://console.aws.amazon.com/machinelearning/.

  2. Pilih Mulai.

    catatan

    Tutorial ini mengasumsikan bahwa ini adalah pertama kalinya Anda menggunakan Amazon ML-nya. Jika Anda telah menggunakan Amazon ML-nya sebelumnya, Anda dapat menggunakanBuat...daftar drop down di dasbor Amazon MLuntuk membuat datasource baru.

  3. PadaMemulai dengan Amazon Machine Learninghalaman, pilihLuncurkan.

    Amazon Machine Learning interface with "Launch" button highlighted for standard setup.
  4. PadaData Masukanhalaman, untukDimana data Anda berada? , pastikan bahwaS3dipilih.

    Radio button selection between S3 and Redshift options, with S3 selected.
  5. UntukLokasi S3, ketik lokasi lengkapbanking.csv File dari Langkah 1: Siapkan Data Anda. Misalnya:bucket Anda/banking.csv. Amazon IL menambahkan s3://ke nama bucket Anda untuk Anda.

  6. UntukNama sumber data, jenisBanking Data 1.

    S3 location input field and Datasource name field for entering banking data information.
  7. MemiilihVerifikasi.

  8. DiIzin S3kotak dialog, pilihya.

    Dialog box asking to grant Amazon Machine Learning read permission for S3 location.
  9. Jika Amazon L dapat mengakses dan membaca file data di lokasi S3, Anda akan melihat halaman yang mirip dengan berikut ini. Tinjau properti, lalu pilihLanjutkan.

    Validation success message with datasource details including name, location, and file information.

Selanjutnya, Anda membuat skema. SEBUAHskemaadalah informasi yang diperlukan Amazon ML-nya untuk menafsirkan data input untuk model MLnya, termasuk nama atribut dan jenis data yang ditugaskannya, dan nama-nama atribut khusus. Ada dua cara untuk menyediakan Amazon MLnya dengan skema:

  • Berikan file skema terpisah saat Anda mengunggah data Amazon S3 Anda.

  • Izinkan Amazon ML-menyimpulkan jenis atribut dan membuat skema untuk Anda.

Dalam tutorial ini, kita akan meminta Amazon ML-nya untuk menyimpulkan skema.

Untuk informasi selengkapnya tentang membuat file skema terpisah, lihatMembuat Skema Data untuk Amazon.

Untuk memungkinkan Amazon ML-menyimpulkan skema
  1. PadaSkemahalaman, Amazon IL menunjukkan skema yang disimpulkan. Tinjau jenis data yang disimpulkan Amazon ML-nya untuk atribut. Adalah penting bahwa atribut ditetapkan jenis data yang benar untuk membantu Amazon ML-menelan data dengan benar dan untuk mengaktifkan pemrosesan fitur yang benar pada atribut.

    • Atribut yang hanya memiliki dua negara yang mungkin, seperti ya atau tidak, harus ditandai sebagaiBiner.

    • Atribut yang merupakan angka atau string yang digunakan untuk menunjukkan kategori harus ditandai sebagaiKategoris.

    • Atribut yang jumlah numerik yang urutannya berarti harus ditandai sebagaiNumerik.

    • Atribut yang string yang ingin Anda perlakukan sebagai kata-kata yang dibatasi oleh spasi harus ditandai sebagaiText.

    Data table showing fields like age, campaign, and contact with their data types and sample values.
  2. Dalam tutorial ini, Amazon L telah mengidentifikasi jenis data dengan benar untuk semua atribut, jadi pilihlahLanjutkan.

Selanjutnya, pilih atribut target.

Ingat bahwa target adalah atribut yang harus dipelajari oleh model ML-nya. Atributymenunjukkan apakah seseorang telah berlangganan kampanye di masa lalu: 1 (ya) atau 0 (tidak).

catatan

Pilih atribut target hanya jika Anda akan menggunakan sumber data untuk pelatihan dan mengevaluasi model ML-nya.

Untuk memilih y sebagai atribut target
  1. Di kanan bawah tabel, pilih panah tunggal untuk maju ke halaman terakhir dari tabel, di mana atribut bernamaymuncul.

    Navigation buttons for a paginated table, with the last page arrow highlighted.
  2. DiTargetkolom, pilihy.

    Checkbox in Target column next to variable 'y' with Binary data type.

    Amazon MLnya mengkonfirmasikanydipilih sebagai target Anda.

  3. Pilih Continue (Lanjutkan).

  4. PadaID barishalaman, untukApakah data Anda berisi pengenal?, pastikan bahwaTidak, default, dipilih.

  5. MemiilihTinjau, dan kemudian pilihLanjutkan.

Setelah Anda memiliki sumber data pelatihan, Anda siapmembuat model Anda.