Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat kumpulan data pelatihan dan uji dengan gambar
Anda dapat memulai dengan proyek yang memiliki satu kumpulan data, atau proyek yang memiliki kumpulan data pelatihan dan pengujian terpisah. Jika Anda memulai dengan satu kumpulan data, Amazon Rekognition Custom Labels membagi kumpulan data Anda selama pelatihan untuk membuat kumpulan data pelatihan (80%) dan kumpulan data pengujian (% 20) untuk proyek Anda. Mulailah dengan satu kumpulan data jika Anda ingin Label Kustom Rekognition Amazon memutuskan di mana gambar digunakan untuk pelatihan dan pengujian. Untuk kontrol penuh atas pelatihan, pengujian, dan penyetelan kinerja, kami menyarankan Anda memulai proyek Anda dengan kumpulan data pelatihan dan pengujian terpisah.
Anda dapat membuat kumpulan data pelatihan dan pengujian untuk proyek dengan mengimpor gambar dari salah satu lokasi berikut:
Jika Anda memulai proyek dengan kumpulan data pelatihan dan pengujian terpisah, Anda dapat menggunakan lokasi sumber yang berbeda untuk setiap kumpulan data.
Tergantung dari mana Anda mengimpor gambar, gambar Anda mungkin tidak berlabel. Misalnya, gambar yang diimpor dari komputer lokal tidak diberi label. Gambar yang diimpor dari file manifes Amazon SageMaker Ground Truth diberi label. Anda dapat menggunakan konsol Amazon Rekognition Custom Labels untuk menambahkan, mengubah, dan menetapkan label. Untuk informasi selengkapnya, lihat Pelabelan gambar.
Jika gambar diunggah dengan kesalahan, gambar hilang, atau label hilang dari gambar, bacaMendebug pelatihan model yang gagal.
Untuk informasi selengkapnya tentang kumpulan data, lihat. Mengelola set data
Buat kumpulan data pelatihan dan uji () SDK
Anda dapat menggunakan AWS SDK untuk membuat kumpulan data pelatihan dan pengujian.
CreateDataset
Operasi ini memungkinkan Anda menentukan tag secara opsional saat membuat kumpulan data baru, untuk tujuan mengkategorikan dan mengelola sumber daya Anda.
Dataset pelatihan
Anda dapat menggunakan AWS SDK untuk membuat kumpulan data pelatihan dengan cara berikut.
-
Gunakan CreateDatasetdengan file manifes format Amazon Sagemaker yang Anda berikan. Untuk informasi selengkapnya, lihat Membuat file manifes. Untuk kode sampel, lihat Membuat kumpulan data dengan file manifes SageMaker Ground Truth () SDK.
-
Gunakan
CreateDataset
untuk menyalin kumpulan data Label Kustom Amazon Rekognition yang ada. Untuk kode sampel, lihat Membuat dataset menggunakan dataset yang ada (SDK). -
Buat dataset kosong dengan
CreateDataset
dan tambahkan entri dataset di lain waktu dengan. UpdateDatasetEntries Untuk membuat kumpulan data kosong, lihatMenambahkan dataset ke proyek. Untuk menambahkan gambar ke kumpulan data, lihatMenambahkan lebih banyak gambar (SDK). Anda perlu menambahkan entri dataset sebelum Anda dapat melatih model.
Uji dataset
Anda dapat menggunakan AWS SDK untuk membuat kumpulan data pengujian dengan cara berikut:
-
Gunakan CreateDatasetdengan file manifes format Amazon Sagemaker yang Anda berikan. Untuk informasi selengkapnya, lihat Membuat file manifes. Untuk kode sampel, lihat Membuat kumpulan data dengan file manifes SageMaker Ground Truth () SDK.
-
Gunakan
CreateDataset
untuk menyalin kumpulan data Label Kustom Amazon Rekognition yang ada. Untuk kode sampel, lihat Membuat dataset menggunakan dataset yang ada (SDK). -
Buat dataset kosong dengan
CreateDataset
dan tambahkan entri dataset di lain waktu dengan.UpdateDatasetEntries
Untuk membuat kumpulan data kosong, lihatMenambahkan dataset ke proyek. Untuk menambahkan gambar ke kumpulan data, lihatMenambahkan lebih banyak gambar (SDK). Anda perlu menambahkan entri dataset sebelum Anda dapat melatih model. -
Pisahkan kumpulan data pelatihan menjadi kumpulan data pelatihan dan pengujian terpisah. Pertama buat dataset pengujian kosong dengan
CreateDataset
. Kemudian pindahkan 20% entri kumpulan data pelatihan ke dalam kumpulan data pengujian dengan menelepon. DistributeDatasetEntries Untuk membuat kumpulan data kosong, lihatMenambahkan dataset ke proyek (SDK). Untuk membagi kumpulan data pelatihan, lihatMendistribusikan kumpulan data pelatihan (SDK).