Kesalahan umum dan pemecahan masalah - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kesalahan umum dan pemecahan masalah

Kesalahan AWS Batch sering terjadi pada tingkat aplikasi atau disebabkan oleh konfigurasi instans yang tidak memenuhi persyaratan pekerjaan spesifik Anda. Masalah lain termasuk pekerjaan yang macet dalam RUNNABLE status atau lingkungan komputasi yang macet dalam suatu INVALID keadaan. Untuk informasi selengkapnya tentang pemecahan masalah pekerjaan yang macet dalam RUNNABLE status, lihat. Pekerjaan terjebak dalam RUNNABLE status Untuk informasi tentang pemecahan masalah lingkungan komputasi dalam suatu INVALID status, lihat. INVALIDlingkungan komputasi

  • Periksa CPU kuota Amazon EC2 Spot v — Verifikasi bahwa kuota layanan Anda saat ini memenuhi persyaratan pekerjaan. Misalnya, misalkan kuota layanan Anda saat ini adalah 256 vCPUs dan pekerjaan membutuhkan 10.000vCPUs. Kemudian, kuota layanan tidak memenuhi persyaratan pekerjaan. Untuk informasi selengkapnya dan petunjuk pemecahan masalah, lihat Kuota EC2 layanan Amazon dan Bagaimana cara meningkatkan kuota layanan Amazon saya? EC2resources .

  • Pekerjaan gagal sebelum aplikasi berjalan — Beberapa pekerjaan mungkin gagal karena DockerTimeoutError kesalahan atau CannotPullContainerError kesalahan. Untuk informasi pemecahan masalah, lihat Bagaimana cara mengatasi kesalahan "DockerTimeoutError" di? AWS Batch.

  • Alamat IP tidak mencukupi — Jumlah alamat IP di subnet VPC dan Anda dapat membatasi jumlah instance yang dapat Anda buat. Gunakan Classless Inter-Domain Routing (CIDRs) untuk memberikan lebih banyak alamat IP daripada yang diperlukan untuk menjalankan beban kerja Anda. Jika perlu, Anda juga dapat membangun dedicated VPC dengan ruang alamat yang besar. Misalnya, Anda dapat membuat VPC dengan multiple CIDRs in 10.x.0.0/16 dan subnet di setiap Availability Zone dengan a CIDR of. 10.x.y.0/17 Dalam contoh ini, x adalah antara 1-4 dan y adalah 0 atau 128. Konfigurasi ini menyediakan 36.000 alamat IP di setiap subnet.

    VPC diagram showing 6 private subnets with different CIDR ranges across 3 Availability Zones.
  • Verifikasi bahwa instans terdaftar di Amazon EC2 — Jika Anda melihat instans Anda di EC2 konsol Amazon, tetapi tidak ada instans penampung Amazon Elastic Container Service di ECS klaster Amazon Anda, ECS agen Amazon mungkin tidak diinstal pada Amazon Machine Image (). AMI ECSAgen Amazon, EC2 Data Amazon di AndaAMI, atau templat peluncuran mungkin juga tidak dikonfigurasi dengan benar. Untuk mengisolasi akar penyebab, buat EC2 instance Amazon terpisah atau sambungkan ke instance yang ada menggunakanSSH. Untuk informasi selengkapnya, lihat konfigurasi agen ECS penampung Amazon, Lokasi File ECS Log Amazon, danMenghitung sumber daya AMIs.

  • Tinjau AWS Dasbor — Tinjau AWS Dasbor untuk memverifikasi bahwa status pekerjaan yang diharapkan dan bahwa skala lingkungan komputasi seperti yang diharapkan. Anda juga dapat meninjau log pekerjaan CloudWatch.

  • Verifikasi bahwa instance Anda dibuat — Jika instance dibuat, itu berarti lingkungan komputasi Anda diskalakan seperti yang diharapkan. Jika instance Anda tidak dibuat, cari subnet terkait di lingkungan komputasi Anda untuk diubah. Untuk selengkapnya, lihat Memverifikasi aktivitas penskalaan untuk grup Auto Scaling.

    Kami juga menyarankan Anda memverifikasi bahwa instans Anda dapat memenuhi persyaratan pekerjaan terkait Anda. Misalnya, pekerjaan mungkin memerlukan 1 TiB memori, tetapi lingkungan komputasi menggunakan jenis instance C5 yang terbatas pada memori 192 GB.

  • Verifikasi bahwa instans Anda diminta oleh AWS Batch — Periksa riwayat grup Auto Scaling untuk memverifikasi bahwa instans Anda diminta oleh. AWS Batch Ini adalah indikasi bagaimana Amazon EC2 mencoba memperoleh instance. Jika Anda menerima kesalahan yang menyatakan Amazon EC2 Spot tidak dapat memperoleh instance di Availability Zone tertentu, ini mungkin karena Availability Zone tidak menawarkan keluarga instance tertentu.

  • Verifikasi bahwa instans terdaftar dengan Amazon ECS — Jika Anda melihat instance di EC2 konsol Amazon, tetapi tidak ada instans ECS penampung Amazon di ECS klaster Amazon, ECS agen Amazon mungkin tidak diinstal pada Amazon Machine Image (). AMI Selain itu, ECS Agen Amazon, EC2 Data Amazon di AndaAMI, atau templat peluncuran mungkin tidak dikonfigurasi dengan benar. Untuk mengisolasi akar penyebab, buat EC2 instance Amazon terpisah atau sambungkan ke instance yang ada menggunakanSSH. Untuk informasi selengkapnya, lihat file konfigurasi CloudWatch agen: bagian Log, Lokasi File ECS Log Amazon, danMenghitung sumber daya AMIs.

  • Buka tiket dukungan — Jika Anda masih mengalami masalah setelah beberapa pemecahan masalah dan memiliki rencana dukungan, buka tiket dukungan. Di tiket dukungan, pastikan untuk menyertakan informasi tentang masalah, spesifikasi beban kerja, konfigurasi, dan hasil pengujian. Untuk informasi selengkapnya, lihat Bandingkan AWS Support Paket.

  • Tinjau AWS Batch dan HPC forum — Untuk informasi lebih lanjut, lihat AWS Batchdan HPCforum.

  • Tinjau Dasbor Pemantauan AWS Batch Waktu Proses — Dasbor ini menggunakan arsitektur tanpa server untuk menangkap peristiwa dari AmazonECS, AWS Batch dan Amazon EC2 untuk memberikan wawasan tentang pekerjaan dan instance. Untuk informasi selengkapnya, lihat Solusi Dasbor Pemantauan AWS Batch Runtime.