Pekerjaan Pelabelan Rantai - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pekerjaan Pelabelan Rantai

Amazon SageMaker Ground Truth dapat menggunakan kembali kumpulan data dari pekerjaan sebelumnya dengan dua cara: kloning dan rantai.

Kloning menyalin pengaturan pekerjaan pelabelan sebelumnya dan memungkinkan Anda membuat perubahan tambahan sebelum menyetelnya untuk dijalankan.

Chaining tidak hanya menggunakan pengaturan pekerjaan sebelumnya, tetapi juga hasilnya. Ini memungkinkan Anda untuk melanjutkan pekerjaan yang tidak lengkap dan menambahkan label atau objek data ke pekerjaan yang diselesaikan. Chaining adalah operasi yang lebih kompleks.

Untuk pemrosesan data:

  • Kloning menggunakan manifes masukan pekerjaan sebelumnya, dengan modifikasi opsional, sebagai manifes masukan pekerjaan baru.

  • Chaining menggunakan manifes keluaran pekerjaan sebelumnya sebagai manifes masukan pekerjaan baru.

Chaining berguna saat Anda perlu:

  • Lanjutkan pekerjaan pelabelan yang dihentikan secara manual.

  • Lanjutkan pekerjaan pelabelan yang gagal di tengah pekerjaan, setelah memperbaiki masalah.

  • Beralih ke pelabelan data otomatis setelah memberi label secara manual pada bagian pekerjaan (atau sebaliknya).

  • Tambahkan lebih banyak objek data ke pekerjaan yang sudah selesai dan mulai pekerjaan dari sana.

  • Tambahkan anotasi lain ke pekerjaan yang sudah selesai. Misalnya, Anda memiliki kumpulan frasa yang diberi label untuk topik, lalu ingin menjalankan set lagi, mengkategorikannya berdasarkan audiens tersirat topik.

Di Amazon SageMaker Ground Truth, Anda dapat mengonfigurasi pekerjaan pelabelan berantai dengan konsol atau. API

Istilah Kunci: Nama Atribut Label

Nama atribut label (LabelAttributeNamein theAPI) adalah string yang digunakan sebagai kunci untuk pasangan kunci-nilai yang dibentuk dengan label yang diberikan pekerja ke objek data.

Aturan berikut berlaku untuk nama atribut label:

  • Itu tidak bisa berakhir dengan-metadata.

  • Nama-nama source dan source-ref dipesan dan tidak dapat digunakan.

  • Untuk pekerjaan pelabelan segmentasi semantik,, itu harus diakhiri dengan. -ref Untuk semua pekerjaan pelabelan lainnya, itu tidak bisa berakhir dengan-ref. Jika Anda menggunakan konsol untuk membuat pekerjaan, Amazon SageMaker Ground Truth secara otomatis menambahkan -ref ke semua nama atribut label kecuali untuk pekerjaan segmentasi semantik.

  • Untuk pekerjaan pelabelan berantai, jika Anda menggunakan nama atribut label yang sama dari pekerjaan asal dan Anda mengonfigurasi pekerjaan berantai untuk menggunakan pelabelan otomatis, maka jika itu dalam mode pelabelan otomatis kapan saja, Ground Truth menggunakan model dari pekerjaan asal.

Dalam manifes keluaran, nama atribut label muncul mirip dengan berikut ini.

"source-ref": "<S3 URI>", "<label attribute name>": { "annotations": [{ "class_id": 0, "width": 99, "top": 87, "height": 62, "left": 175 }], "image_size": [{ "width": 344, "depth": 3, "height": 234 }] }, "<label attribute name>-metadata": { "job-name": "<job name>", "class-map": { "0": "<label attribute name>" }, "human-annotated": "yes", "objects": [{ "confidence": 0.09 }], "creation-date": "<timestamp>", "type": "groundtruth/object-detection" }

Jika Anda membuat pekerjaan di konsol dan tidak secara eksplisit menetapkan nilai nama atribut label, Ground Truth menggunakan nama pekerjaan sebagai nama atribut label untuk pekerjaan tersebut.

Memulai Chained Job (Konsol)

Pilih pekerjaan pelabelan yang dihentikan, gagal, atau selesai dari daftar pekerjaan Anda yang ada. Ini memungkinkan menu Tindakan.

Dari menu Tindakan, pilih Rantai.

Panel Ikhtisar Pekerjaan

Di panel Job overview, nama Job baru ditetapkan berdasarkan judul pekerjaan dari mana Anda merantai yang satu ini. Anda bisa mengubahnya.

Anda juga dapat menentukan nama atribut label yang berbeda dari nama pekerjaan pelabelan.

Jika Anda merantai dari pekerjaan yang sudah selesai, nama atribut label menggunakan nama pekerjaan baru yang Anda konfigurasikan. Untuk mengubah nama, pilih kotak centang.

Jika Anda merantai dari pekerjaan yang dihentikan atau gagal, nama atribut label akan digunakan untuk nama pekerjaan tempat Anda dirantai. Sangat mudah untuk melihat dan mengedit nilai karena kotak centang nama dicentang.

Pertimbangan penamaan label atribut
  • Default menggunakan label atribut nama Ground Truth telah dipilih. Semua objek data tanpa data yang terhubung ke nama atribut label diberi label.

  • Menggunakan nama atribut label yang tidak ada dalam manifes menyebabkan pekerjaan memproses semua objek dalam kumpulan data.

Lokasi dataset input dalam kasus ini secara otomatis dipilih sebagai manifes keluaran dari pekerjaan yang dirantai. Bidang input tidak tersedia, jadi Anda tidak dapat mengubahnya.

Menambahkan objek data ke pekerjaan pelabelan

Anda tidak dapat menentukan file manifes alternatif. Edit manifes keluaran secara manual dari pekerjaan sebelumnya untuk menambahkan item baru sebelum memulai pekerjaan berantai. Amazon S3 URI membantu Anda menemukan tempat Anda menyimpan manifes di bucket Amazon S3 Anda. Unduh file manifes dari sana, edit secara lokal di komputer Anda, lalu unggah versi baru untuk menggantinya. Pastikan Anda tidak memperkenalkan kesalahan selama pengeditan. Kami menyarankan Anda menggunakan JSON linter untuk memeriksaJSON. Banyak editor teks populer dan IDEs memiliki plugin linter yang tersedia.

Memulai Chained Job () API

Prosedurnya hampir sama dengan menyiapkan pekerjaan pelabelan baru denganCreateLabelingJob, kecuali untuk dua perbedaan utama:

  • Lokasi manifes: Daripada menggunakan manifes asli Anda dari pekerjaan sebelumnya, nilai untuk ManifestS3Uri dalam DataSource harus mengarah ke Amazon S3 URI dari manifes keluaran dari pekerjaan pelabelan sebelumnya.

  • Nama atribut label: Mengatur LabelAttributeName nilai yang benar penting di sini. Ini adalah bagian kunci dari pasangan kunci-nilai di mana data pelabelan adalah nilainya. Contoh kasus penggunaan meliputi:

    • Menambahkan label baru atau lebih spesifik ke pekerjaan yang diselesaikan - Tetapkan nama atribut label baru.

    • Melabeli item yang tidak berlabel dari pekerjaan sebelumnya — Gunakan nama atribut label dari pekerjaan sebelumnya.

Gunakan Dataset Berlabel Sebagian

Anda bisa mendapatkan beberapa manfaat rantai jika Anda menggunakan augmented manifest yang telah diberi label sebagian. Centang kotak centang Nama atribut Label dan atur nama agar cocok dengan nama dalam manifes Anda.

Jika Anda menggunakanAPI, instruksinya sama dengan instruksi untuk memulai pekerjaan berantai. Namun, pastikan untuk mengunggah manifes Anda ke bucket Amazon S3 dan menggunakannya alih-alih menggunakan manifes keluaran dari pekerjaan sebelumnya.

Nilai nama atribut Label dalam manifes harus sesuai dengan pertimbangan penamaan yang dibahas sebelumnya.