Throughput terlalu lambat - Layanan Terkelola untuk Apache Flink

Amazon Managed Service untuk Apache Flink sebelumnya dikenal sebagai Amazon Kinesis Data Analytics untuk Apache Flink.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Throughput terlalu lambat

Jika aplikasi Anda tidak memproses data streaming yang masuk dengan cukup cepat, aplikasi akan berperforma buruk dan menjadi tidak stabil. Bagian ini menjelaskan gejala dan langkah pemecahan masalah untuk kondisi ini.

Gejala

Kondisi ini dapat memiliki gejala berikut:

  • Jika sumber data untuk aplikasi Anda adalah aliran Kinesis, metrik millisbehindLatest aliran terus meningkat.

  • Jika sumber data untuk aplikasi Anda adalah MSK klaster Amazon, metrik lag konsumen klaster akan terus meningkat. Untuk informasi selengkapnya, lihat Pemantauan Lag Konsumen di Panduan Pengembang Amazon MSK.

  • Jika sumber data untuk aplikasi Anda adalah layanan atau sumber yang berbeda, periksa metrik atau data lag konsumen yang tersedia.

Penyebab dan solusi

Ada banyak penyebab untuk throughput aplikasi yang lambat. Jika aplikasi Anda tidak mengikuti input, periksa hal berikut:

  • Jika lag throughput melonjak, lalu menurun, periksa apakah aplikasi dimulai ulang. Aplikasi Anda akan berhenti memproses input saat dimulai ulang, menyebabkan lonjakan lag. Untuk informasi selengkapnya tentang kegagalan aplikasi, lihat Aplikasi dimulai ulang.

  • Jika lag throughput konsisten, periksa untuk melihat apakah performa aplikasi Anda dioptimalkan. Untuk informasi tentang mengoptimalkan performa aplikasi, lihat Memecahkan masalah kinerja.

  • Jika lag throughput tidak melonjak, tetapi terus meningkat, dan performa aplikasi Anda dioptimalkan, Anda harus meningkatkan sumber daya aplikasi Anda. Untuk informasi tentang peningkatan sumber daya aplikasi, lihat Menerapkan penskalaan aplikasi di Managed Service untuk Apache Flink.

  • Jika aplikasi Anda membaca dari cluster Kafka di Wilayah yang berbeda dan FlinkKafkaConsumer atau KafkaSource sebagian besar menganggur (tinggi idleTimeMsPerSecond atau rendahCPUUtilization) meskipun kelambatan konsumen tinggi, Anda dapat meningkatkan nilainyareceive.buffer.byte, seperti 2097152. Untuk informasi selengkapnya, lihat bagian lingkungan latensi tinggi di MSKKonfigurasi khusus.

Untuk langkah-langkah pemecahan masalah untuk throughput lambat atau lag konsumen yang meningkat di sumber aplikasi, lihat Memecahkan masalah kinerja.