Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Anda dapat menggunakan konsol Amazon SageMaker AI untuk memilih sebagian dari kumpulan data Anda untuk pelabelan. Data harus disimpan dalam bucket Amazon S3. Anda memiliki tiga opsi:
-
Gunakan dataset lengkap.
-
Pilih sampel kumpulan data yang dipilih secara acak.
-
Tentukan subset dari kumpulan data menggunakan kueri.
Opsi berikut tersedia di bagian Pekerjaan pelabelan di konsol SageMaker AI
Gunakan Dataset Lengkap
Bila Anda memilih untuk menggunakan Dataset lengkap, Anda harus menyediakan file manifes untuk objek data Anda. Anda dapat menyediakan jalur bucket Amazon S3 yang berisi file manifes atau menggunakan konsol SageMaker AI untuk membuat file. Untuk mempelajari cara membuat file manifes menggunakan konsol, lihatMengotomatiskan pengaturan data untuk pekerjaan pelabelan.
Pilih Sampel Acak
Saat Anda ingin memberi label subset acak dari data Anda, pilih Sampel acak. Dataset disimpan di bucket Amazon S3 yang ditentukan di bidang lokasi kumpulan data Input.
Setelah Anda menentukan persentase objek data yang ingin Anda sertakan dalam sampel, pilih Buat subset. SageMaker AI secara acak memilih objek data untuk pekerjaan pelabelan Anda. Setelah objek dipilih, pilih Gunakan subset ini.
SageMaker AI membuat file manifes untuk objek data yang dipilih. Ini juga memodifikasi nilai di bidang lokasi dataset Input untuk menunjuk ke file manifes baru.
Tentukan Subset
Amazon S3 Select
Amazon S3 Select tidak lagi tersedia untuk pelanggan baru. Pelanggan Amazon S3 Select yang sudah ada dapat terus menggunakan fitur seperti biasa. Untuk mempelajari selengkapnya lihat, Cara mengoptimalkan kueri data Anda di Amazon
Anda dapat menentukan subset objek data menggunakan kueri Amazon SELECT
S3 pada nama file objek.
SELECT
Pernyataan query SQL didefinisikan untuk Anda. Anda memberikan WHERE
klausa untuk menentukan objek data mana yang harus dikembalikan.
Untuk informasi selengkapnya tentang SELECT
pernyataan Amazon S3, lihat Memilih Konten dari Objek.
Pilih Buat subset untuk memulai pemilihan, lalu pilih Gunakan subset ini untuk menggunakan data yang dipilih.
SageMaker AI membuat file manifes untuk objek data yang dipilih. Ini juga memperbarui nilai di bidang lokasi kumpulan data Input untuk menunjuk ke file manifes baru.