Verifikasi dan penyesuaian label - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Verifikasi dan penyesuaian label

Ketika label pada kumpulan data perlu divalidasi, Amazon SageMaker Ground Truth menyediakan fungsionalitas agar pekerja memverifikasi bahwa label sudah benar atau menyesuaikan label sebelumnya. Jenis pekerjaan ini terbagi dalam dua kategori berbeda:

  • Verifikasi label — Pekerja menunjukkan apakah label yang ada benar, atau menilai kualitasnya, dan dapat menambahkan komentar untuk menjelaskan alasan mereka. Pekerja tidak akan dapat memodifikasi atau menyesuaikan label.

    Jika Anda membuat pekerjaan penyesuaian atau verifikasi label cloud titik 3D atau bingkai video, Anda dapat memilih untuk membuat atribut kategori label (tidak didukung untuk segmentasi semantik cloud titik 3D) dan atribut bingkai dapat diedit oleh pekerja.

  • Penyesuaian label — Pekerja menyesuaikan anotasi sebelumnya dan, jika ada, label kategori dan atribut bingkai untuk memperbaikinya.

Jenis tugas bawaan Ground Truth berikut mendukung pekerjaan penyesuaian dan pelabelan verifikasi:

  • Kotak pembatas

  • Segmentasi semantik

  • Deteksi objek awan titik 3D, pelacakan objek awan titik 3D, dan segmentasi semantik awan titik 3D

  • Semua deteksi objek bingkai video dan jenis tugas pelacakan objek bingkai video - kotak pembatas, polyline, poligon, dan titik kunci

Tip

Untuk pekerjaan verifikasi pelabelan cloud titik 3D dan bingkai video, Anda disarankan untuk menambahkan atribut kategori label baru atau atribut bingkai ke pekerjaan pelabelan. Pekerja dapat menggunakan atribut ini untuk memverifikasi label individual atau seluruh frame. Untuk mempelajari lebih lanjut tentang kategori label dan atribut bingkai, lihat Antarmuka pengguna pekerja (UI) awan titik 3D dan Antarmuka pengguna pekerja (UI) bingkai video.

Anda dapat memulai pekerjaan verifikasi dan penyesuaian label menggunakan konsol SageMaker AI atauAPI.

Perhatian dan pertimbangan

Untuk mendapatkan perilaku yang diharapkan saat membuat pekerjaan verifikasi atau penyesuaian label, verifikasi data input Anda dengan cermat.

  • Jika Anda menggunakan data gambar, verifikasi bahwa file manifes Anda berisi informasi warna heksadesimalRGB.

  • Untuk menghemat biaya pemrosesan, filter data Anda untuk memastikan Anda tidak menyertakan objek yang tidak diinginkan dalam manifes input pekerjaan pelabelan Anda.

  • Tambahkan izin Amazon S3 yang diperlukan untuk memastikan data input Anda diproses dengan benar.

Saat Anda membuat pekerjaan pelabelan penyesuaian atau verifikasi menggunakan Ground TruthAPI, Anda harus menggunakan pekerjaan pelabelan yang berbeda LabelAttributeName dari pekerjaan pelabelan asli.

Persyaratan informasi warna untuk pekerjaan segmentasi semantik

Untuk mereproduksi informasi warna dengan benar dalam tugas verifikasi atau penyesuaian, alat ini memerlukan informasi RGB warna heksadesimal dalam manifes (misalnya, # FFFFFF untuk putih). Saat Anda menyiapkan verifikasi Segmentasi Semantik atau pekerjaan penyesuaian, alat memeriksa manifes untuk menentukan apakah informasi ini ada. Jika tidak dapat menemukannya, Amazon SageMaker Ground Truth menampilkan pesan kesalahan dan penyiapan pekerjaan berakhir.

Dalam iterasi sebelumnya dari alat Segmentasi Semantik, informasi warna kategori tidak dihasilkan dalam format RGB heksadesimal ke manifes keluaran. Fitur itu diperkenalkan ke manifes keluaran pada saat yang sama alur kerja verifikasi dan penyesuaian diperkenalkan. Oleh karena itu, manifes keluaran lama tidak kompatibel dengan alur kerja baru ini.

Filter data Anda sebelum memulai pekerjaan

Amazon SageMaker Ground Truth memproses semua objek dalam manifes masukan Anda. Jika Anda memiliki kumpulan data berlabel sebagian, Anda mungkin ingin membuat manifes kustom menggunakan kueri Amazon S3 Select pada manifes input Anda. Objek yang tidak berlabel gagal secara individual, tetapi mereka tidak menyebabkan pekerjaan gagal, dan mereka mungkin dikenakan biaya pemrosesan. Memfilter objek yang tidak ingin Anda verifikasi mengurangi biaya Anda.

Jika Anda membuat pekerjaan verifikasi menggunakan konsol, Anda dapat menggunakan alat pemfilteran yang disediakan di sana. Jika Anda membuat pekerjaan menggunakanAPI, membuat pemfilteran data Anda bagian dari alur kerja Anda jika diperlukan.