Gunakan Amazon SageMaker Ground Truth untuk Label Data - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan Amazon SageMaker Ground Truth untuk Label Data

Untuk melatih model pembelajaran mesin, Anda memerlukan kumpulan data berlabel besar, berkualitas tinggi. Ground Truth membantu Anda membangun kumpulan data pelatihan berkualitas tinggi untuk model pembelajaran mesin Anda. Dengan Ground Truth, Anda dapat menggunakan pekerja dari Amazon Mechanical Turk, perusahaan vendor yang Anda pilih, atau tenaga kerja pribadi internal bersama dengan pembelajaran mesin untuk memungkinkan Anda membuat kumpulan data berlabel. Anda dapat menggunakan output dataset berlabel dari Ground Truth untuk melatih model Anda sendiri. Anda juga dapat menggunakan output sebagai kumpulan data pelatihan untuk SageMaker model Amazon.

Bergantung pada aplikasi ML Anda, Anda dapat memilih salah satu tipe tugas bawaan Ground Truth agar pekerja membuat jenis label tertentu untuk data Anda. Anda juga dapat membuat alur kerja pelabelan khusus untuk menyediakan UI dan alat Anda sendiri kepada pekerja yang memberi label pada data Anda. Untuk mempelajari lebih lanjut tentang Ground Truth bawaan tipe tugas, lihatJenis Tugas Bawaan. Untuk mempelajari cara membuat alur kerja pelabelan kustom, lihat. Membuat Alur Kerja Pelabelan Kustom

Untuk mengotomatiskan pelabelan kumpulan data pelatihan Anda, Anda dapat secara opsional menggunakan pelabelan data otomatis, proses Ground Truth yang menggunakan pembelajaran mesin untuk memutuskan data mana yang perlu diberi label oleh manusia. Pelabelan data otomatis dapat mengurangi waktu pelabelan dan upaya manual yang diperlukan. Untuk informasi selengkapnya, lihat Otomatiskan Pelabelan Data. Untuk membuat alur kerja pelabelan kustom, lihat. Membuat Alur Kerja Pelabelan Kustom

Gunakan alat bawaan atau kustom untuk menetapkan tugas pelabelan untuk kumpulan data pelatihan Anda. Template UI pelabelan adalah halaman web yang digunakan Ground Truth untuk menyajikan tugas dan instruksi kepada pekerja Anda. SageMaker Konsol menyediakan templat bawaan untuk pelabelan data. Anda dapat menggunakan template ini untuk memulai, atau Anda dapat membuat tugas dan instruksi Anda sendiri dengan menggunakan komponen HTML 2.0 kami. Untuk informasi selengkapnya, lihat Membuat Alur Kerja Pelabelan Kustom.

Gunakan tenaga kerja pilihan Anda untuk memberi label pada kumpulan data Anda. Anda dapat memilih tenaga kerja Anda dari:

  • Tenaga kerja Amazon Mechanical Turk terdiri dari lebih dari 500.000 kontraktor independen di seluruh dunia.

  • Tenaga kerja pribadi yang Anda buat dari karyawan atau kontraktor Anda untuk menangani data dalam organisasi Anda.

  • Perusahaan vendor yang dapat Anda temukan di AWS Marketplace yang mengkhususkan diri dalam layanan pelabelan data.

Untuk informasi selengkapnya, lihat Membuat dan Mengelola Tenaga Kerja.

Anda menyimpan kumpulan data Anda di bucket Amazon S3. Bucket berisi tiga hal: Data yang akan diberi label, file manifes masukan yang digunakan Ground Truth untuk membaca file data, dan file manifes keluaran. File output berisi hasil pekerjaan pelabelan. Untuk informasi selengkapnya, lihat Gunakan Data Input dan Output.

Acara dari pekerjaan pelabelan Anda muncul di Amazon CloudWatch di bawah /aws/sagemaker/LabelingJobs grup. CloudWatch menggunakan nama pekerjaan pelabelan sebagai nama untuk aliran log.

Apakah Anda Pengguna Pertama Kali Ground Truth?

Jika Anda adalah pengguna pertama kali Ground Truth, kami sarankan Anda melakukan hal berikut:

  1. Baca Memulai —Bagian ini memandu Anda melalui pengaturan pekerjaan pelabelan Ground Truth pertama Anda.

  2. Jelajahi topik lainnya —Tergantung pada kebutuhan Anda, lakukan hal berikut:

    • Jelajahi tipe tugas bawaan — Gunakan tipe tugas bawaan untuk merampingkan proses pembuatan pekerjaan pelabelan. Lihat Jenis Tugas Bawaan untuk mempelajari lebih lanjut tentang tipe tugas bawaan Ground Truth.

    • Kelola tenaga kerja pelabelan Anda —Buat tim kerja baru dan kelola tenaga kerja Anda yang ada. Untuk informasi selengkapnya, lihat Membuat dan Mengelola Tenaga Kerja.

    • Pelajari tentang pekerjaan pelabelan streaming — Buat pekerjaan pelabelan streaming dan kirim objek kumpulan data baru ke pekerja secara real time menggunakan pekerjaan pelabelan yang terus berjalan. Pekerja terus menerima objek data baru untuk diberi label selama pekerjaan pelabelan aktif dan objek baru dikirim ke sana. Untuk mempelajari selengkapnya, lihat Pekerjaan Pelabelan Streaming Ground Truth.

  3. Lihat Reference—Bagian ini menjelaskan operasi untuk mengotomatiskan operasi Ground Truth.