Memetakan status alur kerja - AWS Step Functions

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memetakan status alur kerja

Gunakan Map status untuk menjalankan serangkaian langkah alur kerja untuk setiap item dalam kumpulan data. Iterasi Map status berjalan secara paralel, yang memungkinkan untuk memproses kumpulan data dengan cepat. Mapstatus dapat menggunakan berbagai jenis input, termasuk JSON array, daftar objek Amazon S3, atau file. CSV

Step Functions menyediakan dua jenis mode pemrosesan untuk menggunakan Map status dalam alur kerja Anda: Mode sebaris dan mode Terdistribusi.

Tip

Untuk menerapkan contoh alur kerja yang menggunakan Map status ke Akun AWS, lihat Modul 5 - Status Pilihan dan Status Peta AWS Step Functions Lokakarya.

Mode pemrosesan status peta

Step Functions menyediakan mode pemrosesan berikut untuk Map status tergantung pada bagaimana Anda ingin memproses item dalam kumpulan data.

  • Inline - Mode konkurensi terbatas. Dalam mode ini, setiap iterasi Map status berjalan dalam konteks alur kerja yang berisi status. Map Step Functions menambahkan riwayat eksekusi iterasi ini ke riwayat eksekusi alur kerja induk. Secara default, Map status berjalan dalam mode Inline.

    Dalam mode ini, Map status hanya menerima JSON array sebagai input. Selain itu, mode ini mendukung hingga 40 iterasi bersamaan.

    Untuk informasi selengkapnya, lihat Menggunakan status Peta dalam mode Inline dalam alur kerja Step Functions.

  • Didistribusikan - Mode konkurensi tinggi. Dalam mode ini, Map status menjalankan setiap iterasi sebagai eksekusi alur kerja anak, yang memungkinkan konkurensi tinggi hingga 10.000 eksekusi alur kerja anak paralel. Setiap eksekusi alur kerja anak memiliki riwayat eksekusi terpisah sendiri dari alur kerja induk.

    Dalam mode ini, Map status dapat menerima JSON array atau sumber data Amazon S3, seperti CSV file, sebagai inputnya.

    Untuk informasi selengkapnya, lihat Mode terdistribusi.

Mode yang harus Anda gunakan tergantung pada bagaimana Anda ingin memproses item dalam kumpulan data. Gunakan Map status dalam mode Inline jika riwayat eksekusi alur kerja Anda tidak akan melebihi 25.000 entri, atau jika Anda tidak memerlukan lebih dari 40 iterasi bersamaan.

Gunakan Map status dalam mode Terdistribusi saat Anda perlu mengatur beban kerja paralel skala besar yang memenuhi kombinasi kondisi berikut:

  • Ukuran dataset Anda melebihi 256 KB.

  • Riwayat peristiwa eksekusi alur kerja melebihi 25.000 entri.

  • Anda memerlukan konkurensi lebih dari 40 iterasi paralel.

Mode sebaris dan perbedaan mode Terdistribusi

Tabel berikut menyoroti perbedaan antara mode Inline dan Distributed.

Modus sebaris Mode terdistribusi
Supported data sources

Menerima JSON array yang diteruskan dari langkah sebelumnya dalam alur kerja sebagai input.

Menerima sumber data berikut sebagai masukan:

  • JSONarray diteruskan dari langkah sebelumnya dalam alur kerja

  • JSONberkas di bucket Amazon S3 yang berisi array

  • CSVberkas dalam ember Amazon S3

  • Daftar objek Amazon S3

  • Inventaris Amazon S3

Map iterations

Dalam mode ini, setiap iterasi Map status berjalan dalam konteks alur kerja yang berisi status. Map Step Functions menambahkan riwayat eksekusi iterasi ini ke riwayat eksekusi alur kerja induk.

Dalam mode ini, Map status menjalankan setiap iterasi sebagai eksekusi alur kerja anak, yang memungkinkan konkurensi tinggi hingga 10.000 eksekusi alur kerja anak paralel. Setiap eksekusi alur kerja anak memiliki riwayat eksekusi terpisah sendiri dari alur kerja induk.

Maximum concurrency for parallel iterations

Memungkinkan Anda menjalankan hingga 40 iterasi serempak mungkin.

Memungkinkan Anda menjalankan hingga 10.000 eksekusi alur kerja anak paralel untuk memproses jutaan item data sekaligus.

Input payload and event history sizes

Memberlakukan batas 256 KB pada ukuran muatan input dan 25.000 entri dalam riwayat peristiwa eksekusi.

Memungkinkan Anda mengatasi batasan ukuran payload karena Map status dapat membaca input langsung dari sumber data Amazon S3.

Dalam mode ini, Anda juga dapat mengatasi batasan riwayat eksekusi karena eksekusi alur kerja anak yang dimulai oleh Map status mempertahankan histori eksekusi mereka sendiri dan terpisah dari riwayat eksekusi alur kerja induk.

Monitoring and observability

Anda dapat meninjau riwayat eksekusi alur kerja dari konsol atau dengan menjalankan tindakan. GetExecutionHistory API

Anda juga dapat melihat riwayat eksekusi melalui CloudWatch dan X-Ray.

Saat Anda menjalankan Map status dalam mode Distributed, Step Functions akan membuat resource Map Run. Map Run mengacu pada serangkaian eksekusi alur kerja anak yang memulai status Peta Terdistribusi. Anda dapat melihat Map Run di konsol Step Functions. Anda juga dapat memanggil DescribeMapRun API tindakan. Map Run juga memancarkan metrik ke. CloudWatch

Untuk informasi selengkapnya, lihat Melihat eksekusi Distributed Map Run di Step Functions.