SageMaker Manajer AI Edge - AWS IoT Greengrass

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

SageMaker Manajer AI Edge

penting

SageMaker AI Edge Manager dihentikan pada 26 April 2024. Untuk informasi selengkapnya tentang melanjutkan penerapan model Anda ke perangkat edge, lihat SageMaker AI Edge Manager end of life.

Komponen Amazon SageMaker AI Edge Manager (aws.greengrass.SageMakerEdgeManager) menginstal biner agen SageMaker AI Edge Manager.

SageMaker AI Edge Manager menyediakan manajemen model untuk perangkat edge sehingga Anda dapat mengoptimalkan, mengamankan, memantau, dan memelihara model pembelajaran mesin pada armada perangkat edge. Komponen SageMaker AI Edge Manager menginstal dan mengelola siklus hidup agen SageMaker AI Edge Manager di perangkat inti Anda. Anda juga dapat menggunakan SageMaker AI Edge Manager untuk mengemas dan menggunakan model yang dikompilasi SageMaker AI Neo sebagai komponen model pada perangkat inti Greengrass. Untuk informasi selengkapnya tentang penggunaan agen SageMaker AI Edge Manager di perangkat inti Anda, lihatGunakan Amazon SageMaker AI Edge Manager di perangkat inti Greengrass.

SageMaker Komponen AI Edge Manager v1.3.x menginstal biner agen Edge Manager v1.20220822.836f3023. Untuk informasi lebih lanjut tentang agen Edge Manager versi biner, lihat Agen Manajer Edge.

catatan

Komponen SageMaker AI Edge Manager hanya tersedia dalam hal berikut Wilayah AWS:

  • AS Timur (Ohio)

  • AS Timur (Virginia Utara)

  • US West (Oregon)

  • EU (Frankfurt)

  • EU (Ireland)

  • Asia Pasifik (Tokyo)

Versi

Komponen ini memiliki versi berikut:

  • 1.3.x

  • 1.2.x

  • 1.1.x

  • 1.0.x

Tipe

Komponen ini adalah komponen generik (aws.greengrass.generic). Inti Greengrass menjalankan skrip siklus hidup komponen.

Untuk informasi selengkapnya, lihat Jenis komponen.

Sistem operasi

Komponen ini dapat diinstal pada perangkat inti yang menjalankan sistem operasi berikut:

  • Linux

  • Windows

Persyaratan

Komponen ini memiliki persyaratan sebagai berikut:

  • Perangkat inti Greengrass yang berjalan di Amazon Linux 2, platform Linux berbasis Debian (x86_64 atau Armv8), atau Windows (x86_64). Jika Anda tidak memilikinya, lihat Tutorial: Memulai dengan AWS IoT Greengrass V2.

  • Python 3.6 atau yang lebih baru, termasuk pip untuk versi Python Anda, diinstal pada perangkat inti anda.

  • Peran perangkat Greengrass yang dikonfigurasi dengan berikut ini:

    • Hubungan kepercayaan yang memungkinkan credentials.iot.amazonaws.com dan sagemaker.amazonaws.com untuk mengambil peran, seperti yang ditunjukkan dalam contoh IAM kebijakan berikut.

      { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "credentials.iot.amazonaws.com" }, "Action": "sts:AssumeRole" }, { "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": "sts:AssumeRole" } ] }
    • Kebijakan yang AmazonSageMakerEdgeDeviceFleetPolicyIAMdikelola.

    • s3:PutObjectTindakan, seperti yang ditunjukkan dalam contoh IAM kebijakan berikut.

      { "Version": "2012-10-17", "Statement": [ { "Action": [ "s3:PutObject" ], "Resource": [ "*" ], "Effect": "Allow" } ] }
  • Bucket Amazon S3 yang dibuat sama Akun AWS dan Wilayah AWS sebagai perangkat inti Greengrass Anda. SageMaker AI Edge Manager memerlukan bucket S3 untuk membuat armada perangkat edge, dan menyimpan data sampel dari inferensi yang berjalan di perangkat Anda. Untuk informasi selengkapnya tentang pembuatan bucket S3, lihat Memulai Amazon S3.

  • Armada perangkat SageMaker AI edge yang menggunakan alias AWS IoT peran yang sama dengan perangkat inti Greengrass Anda. Untuk informasi selengkapnya, lihat Buat armada perangkat edge.

  • Perangkat inti Greengrass Anda terdaftar sebagai perangkat edge di armada perangkat AI Edge Anda. SageMaker Nama perangkat tepi harus cocok dengan nama AWS IoT benda untuk perangkat inti Anda. Untuk informasi selengkapnya, lihat Daftarkan perangkat inti Greengrass Anda.

Titik akhir dan port

Komponen ini harus dapat melakukan permintaan keluar ke titik akhir dan port berikut, selain titik akhir dan port yang diperlukan untuk operasi dasar. Untuk informasi selengkapnya, lihat Izinkan lalu lintas perangkat melalui proxy atau firewall.

Titik Akhir Port Wajib Deskripsi

edge.sagemaker.region.amazonaws.com

443 Ya

Periksa status pendaftaran perangkat dan kirim metrik ke SageMaker AI.

*.s3.amazonaws.com

443 Ya

Unggah data tangkapan ke bucket S3 yang Anda tentukan.

Anda dapat mengganti * dengan nama setiap bucket tempat Anda mengunggah data.

Dependensi

Saat Anda menerapkan komponen, gunakan AWS IoT Greengrass juga versi dependensinya yang kompatibel. Ini berarti bahwa Anda harus memenuhi persyaratan untuk komponen dan semua dependensinya untuk berhasil men-deploy komponen. Bagian ini berisi daftar dependensi untuk versi yang dirilis dari komponen ini dan kendala versi semantik yang menentukan versi komponen untuk setiap dependensi. Anda juga dapat melihat dependensi untuk setiap versi komponen di konsol AWS IoT Greengrass tersebut. Pada halaman detail komponen, cari daftar Dependensi.

1.3.5 and 1.3.6

Tabel berikut mencantumkan dependensi untuk versi 1.3.5 dan 1.3.6 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.13.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.3.4

Tabel berikut mencantumkan dependensi untuk versi 1.3.4 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.12.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.3.3

Tabel berikut mencantumkan dependensi untuk versi 1.3.3 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.11.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.3.2

Tabel berikut mencantumkan dependensi untuk versi 1.3.2 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.10.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.3.1

Tabel berikut mencantumkan dependensi untuk versi 1.3.1 komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.9.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.1.1 - 1.3.0

Tabel berikut mencantumkan dependensi untuk versi 1.1.1 - 1.3.0 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.8.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.1.0

Tabel berikut mencantumkan dependensi untuk versi 1.1.0 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.6.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.0.3

Tabel berikut mencantumkan dependensi untuk versi 1.0.3 komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.5.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.0.1 and 1.0.2

Tabel berikut mencantumkan dependensi untuk versi 1.0.1 dan 1.0.2 dari komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.4.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras
1.0.0

Tabel berikut mencantumkan dependensi untuk versi 1.0.0 komponen ini.

Dependensi Versi yang kompatibel Jenis dependensi
Inti Greengrass >=2.0.0 <2.3.0 Lunak
Layanan pertukaran Token >=0.0.0 Keras

Untuk informasi selengkapnya tentang dependensi komponen, lihat referensi resep komponen.

Konfigurasi

Komponen ini menyediakan parameter konfigurasi berikut yang dapat Anda sesuaikan ketika Anda men-deploy komponen.

catatan

Bagian ini menjelaskan parameter konfigurasi yang Anda tetapkan dalam komponen. Untuk informasi selengkapnya tentang konfigurasi SageMaker AI Edge Manager yang sesuai, lihat Agen Manajer Edge di Panduan Pengembang Amazon SageMaker AI.

DeviceFleetName

Nama armada perangkat SageMaker AI Edge Manager yang berisi perangkat inti Greengrass Anda.

Anda harus menentukan nilai untuk parameter ini dalam pembaruan konfigurasi ketika Anda men-deploy komponen ini.

BucketName

Nama bucket S3 yang padanya Anda unggah data inferensi yang ditangkap. Nama bucket harus berisi string sagemaker.

Jika Anda mengatur CaptureDataDestination ke Cloud, atau jika Anda mengatur CaptureDataPeriodicUpload ke true, Anda harus menentukan nilai untuk parameter ini di pembaruan konfigurasi saat Anda men-deploy komponen ini.

catatan

Capture data adalah fitur SageMaker AI yang Anda gunakan untuk mengunggah input inferensi, hasil inferensi, dan data inferensi tambahan ke bucket S3 atau direktori lokal untuk analisis masa depan. Untuk informasi selengkapnya tentang penggunaan data pengambilan dengan SageMaker AI Edge Manager, lihat Mengelola Model di Panduan Pengembang Amazon SageMaker AI.

CaptureDataBatchSize

(Opsional) Ukuran batch permintaan data tangkapan yang ditangani agen. Nilai ini harus lebih kecil dari ukuran buffer yang Anda tentukan di CaptureDataBufferSize. Kami merekomendasikan agar Anda tidak melebihi setengah ukuran buffer.

Agen menangani batch permintaan ketika jumlah permintaan dalam buffer memenuhi jumlah CaptureDataBatchSize, atau ketika interval CaptureDataPushPeriodSeconds berlalu, mana yang terjadi lebih dahulu.

Default: 10

CaptureDataBufferSize

(Opsional) Jumlah maksimum permintaan data tangkapan yang disimpan dalam buffer.

Default: 30

CaptureDataDestination

(Opsional) Tujuan di mana Anda menyimpan data yang diambil. Parameter ini dapat memiliki nilai berikut:

  • Cloud—Mengunggah data yang ditangkap ke bucket S3 yang Anda tentukan di BucketName.

  • Disk—Menuliskan data yang ditangkap pada direktori kerja komponen.

Jika Anda menentukan Disk, Anda juga dapat memilih untuk mengunggah data yang diambil secara berkala ke bucket S3 dengan menetapkan CaptureDataPeriodicUpload ke true.

Default: Cloud

CaptureDataPeriodicUpload

(Opsional) Nilai string yang menentukan apakah akan secara berkala meng-upload data yang ditangkap. Nilai yang didukung adalah true dan false.

Atur parameter ini ke true jika Anda mengatur CaptureDataDestination ke Disk, dan Anda juga ingin agen untuk secara berkala meng-upload data yang diambil bucket S3 Anda.

Default: false

CaptureDataPeriodicUploadPeriodSeconds

(Opsional) Interval dalam hitungan detik saat agen SageMaker AI Edge Manager mengunggah data yang diambil ke bucket S3. Gunakan parameter ini jika Anda mengatur CaptureDataPeriodicUpload ke true.

Default: 8

CaptureDataPushPeriodSeconds

(Opsional) Interval dalam hitungan detik di mana agen SageMaker AI Edge Manager menangani sekumpulan permintaan data pengambilan dari buffer.

Agen menangani batch permintaan ketika jumlah permintaan dalam buffer memenuhi jumlah CaptureDataBatchSize, atau ketika interval CaptureDataPushPeriodSeconds berlalu, mana yang terjadi lebih dahulu.

Default: 4

CaptureDataBase64EmbedLimit

(Opsional) Ukuran maksimum dalam byte data yang diambil yang diunggah agen SageMaker AI Edge Manager.

Default: 3072

FolderPrefix

(Opsional) Nama folder tempat agen menulis data yang ditangkap. Jika Anda mengatur CaptureDataDestination keDisk, agen membuat folder di direktori yang ditentukan olehCaptureDataDiskPath. Jika Anda mengatur CaptureDataDestination ke Cloud, atau jika Anda mengatur CaptureDataPeriodicUpload ke true, agen akan membuat folder di bucket S3 Anda.

Default: sme-capture

CaptureDataDiskPath

Fitur ini tersedia di v1.1.0 dan versi yang lebih baru dari komponen SageMaker AI Edge Manager.

(Opsional) Jalur ke folder tempat agen membuat folder data yang diambil. Jika Anda menyetel CaptureDataDestination keDisk, agen akan membuat folder data yang diambil di direktori ini. Jika Anda tidak menentukan nilai ini, agen akan membuat folder data yang diambil di direktori kerja komponen. Gunakan FolderPrefix parameter untuk menentukan nama folder data yang diambil.

Default: /greengrass/v2/work/aws.greengrass.SageMakerEdgeManager/capture

LocalDataRootPath

Fitur ini tersedia di v1.2.0 dan versi yang lebih baru dari komponen SageMaker AI Edge Manager.

(Opsional) Jalur tempat komponen ini menyimpan data berikut pada perangkat inti:

  • Database lokal untuk data runtime saat Anda menyetel DbEnable ketrue.

  • SageMaker Model yang dikompilasi AI Neo yang diunduh komponen ini secara otomatis saat Anda DeploymentEnable menyetelnya. true

Default: /greengrass/v2/work/aws.greengrass.SageMakerEdgeManager

DbEnable

(Opsional) Anda dapat mengaktifkan komponen ini untuk menyimpan data runtime dalam database lokal untuk menyimpan data, jika komponen gagal atau perangkat kehilangan daya.

Database ini membutuhkan 5 MB penyimpanan pada sistem file perangkat inti.

Default: false

DeploymentEnable

Fitur ini tersedia di v1.2.0 dan versi yang lebih baru dari komponen SageMaker AI Edge Manager.

(Opsional) Anda dapat mengaktifkan komponen ini untuk secara otomatis mengambil model yang dikompilasi SageMaker AI Neo dari yang Anda unggah ke Amazon S3. Setelah Anda mengunggah model baru ke Amazon S3, gunakan SageMaker AI Studio atau SageMaker AI API untuk menyebarkan model baru ke perangkat inti ini. Saat mengaktifkan fitur ini, Anda dapat menerapkan model baru ke perangkat inti tanpa perlu membuat AWS IoT Greengrass penerapan.

penting

Untuk menggunakan fitur ini, Anda harus mengatur DbEnable ketrue. Fitur ini menggunakan database lokal untuk melacak model yang diambil dari file. AWS Cloud

Default: false

DeploymentPollInterval

Fitur ini tersedia di v1.2.0 dan versi yang lebih baru dari komponen SageMaker AI Edge Manager.

(Opsional) Jumlah waktu (dalam menit) di mana komponen ini memeriksa model baru untuk diunduh. Opsi ini berlaku saat Anda menyetel DeploymentEnable ketrue.

Default: 1440 (1 hari)

DLRBackendOptions

Fitur ini tersedia di v1.2.0 dan versi yang lebih baru dari komponen SageMaker AI Edge Manager.

(Opsional) Bendera DLR runtime untuk disetel di DLR runtime yang digunakan komponen ini. Anda dapat mengatur bendera berikut:

  • TVM_TENSORRT_CACHE_DIR- Aktifkan caching model TensorRT. Tentukan jalur absolut ke folder yang ada yang memiliki izin baca/tulis.

  • TVM_TENSORRT_CACHE_DISK_SIZE_MB— Menetapkan batas atas folder cache model TensorRT. Ketika ukuran direktori tumbuh melampaui batas ini, mesin cache yang paling sedikit digunakan dihapus. Nilai defaultnya adalah 512 MB.

Misalnya, Anda dapat menyetel parameter ini ke nilai berikut untuk mengaktifkan caching model TensorRT dan membatasi ukuran cache hingga 800 MB.

TVM_TENSORRT_CACHE_DIR=/data/secured_folder/trt/cache; TVM_TENSORRT_CACHE_DISK_SIZE_MB=800
SagemakerEdgeLogVerbose

(Opsional) Nilai string yang menentukan apakah akan mengaktifkan pencatatan debug. Nilai yang didukung adalah true dan false.

Default: false

UnixSocketName

(Opsional) Lokasi deskriptor file soket SageMaker AI Edge Manager pada perangkat inti.

Default: /tmp/aws.greengrass.SageMakerEdgeManager.sock

contoh Contoh: Pembaruan gabungan konfigurasi

Contoh konfigurasi berikut menentukan bahwa perangkat inti adalah bagian dari MyEdgeDeviceFleet dan bahwa agen menulis data pengambilan baik ke perangkat dan ke bucket S3. Konfigurasi ini juga memungkinkan pencatatan debug.

{ "DeviceFleetName": "MyEdgeDeviceFleet", "BucketName": "amzn-s3-demo-bucket", "CaptureDataDestination": "Disk", "CaptureDataPeriodicUpload": "true", "SagemakerEdgeLogVerbose": "true" }

Berkas log lokal

Komponen ini menggunakan file log berikut.

Linux
/greengrass/v2/logs/aws.greengrass.SageMakerEdgeManager.log
Windows
C:\greengrass\v2\logs\aws.greengrass.SageMakerEdgeManager.log
Untuk melihat log komponen ini
  • Jalankan perintah berikut pada perangkat inti untuk melihat file log komponen ini secara real time. Ganti /greengrass/v2 atau C:\greengrass\v2 dengan jalur ke folder AWS IoT Greengrass root.

    Linux
    sudo tail -f /greengrass/v2/logs/aws.greengrass.SageMakerEdgeManager.log
    Windows (PowerShell)
    Get-Content C:\greengrass\v2\logs\aws.greengrass.SageMakerEdgeManager.log -Tail 10 -Wait

Changelog

Tabel berikut menjelaskan perubahan dalam setiap versi komponen.

Versi

Perubahan

1.3.6

Versi diperbarui untuk Greengrass nucleus 2.12.5 rilis.

1.3.5

Versi diperbarui untuk Greengrass nucleus versi 2.12.0 rilis.

1.3.4

Versi diperbarui untuk Greengrass nucleus versi 2.11.0 rilis.

1.3.3

Versi diperbarui untuk Greengrass nucleus versi 2.10.0 rilis.

1.3.2

Versi diperbarui untuk Greengrass nucleus versi 2.9.0 rilis.

1.3.1

Versi diperbarui untuk Greengrass nucleus versi 2.8.0 rilis.

1.3.0

Fitur baru
  • Menambahkan dukungan untuk manajemen ukuran disk cache TensorRT.

    • Menambahkan TVM_TENSORRT_CACHE_DISK_SIZE_MB flag opsional ke DLRBackendOptions parameter untuk mengatur batas ukuran untuk model cache pada disk.

Perbaikan
  • Memberikan konkurensi prediksi yang lebih baik. Ini membantu untuk mendapatkan penggunaan mesin akselerator perangkat yang lebih baik, sepertiGPUs.

1.2.0

Fitur baru
  • Menambahkan dukungan untuk komponen ini untuk secara otomatis mengambil model yang dikompilasi SageMaker AI Neo yang Anda unggah ke Amazon S3. Saat mengaktifkan fitur ini, Anda dapat menerapkan model baru ke perangkat inti tanpa perlu membuat AWS IoT Greengrass penerapan.

  • Menambahkan dukungan untuk database cadangan yang digunakan komponen ini untuk menyimpan data runtime, jika komponen gagal atau perangkat kehilangan daya.

  • Menambahkan dukungan bagi Anda untuk mengonfigurasi flag DLR runtime saat Anda mengonfigurasi komponen ini.

1.1.1

Versi diperbarui untuk Greengrass nucleus versi 2.7.0 rilis.

1.1.0

Fitur baru
  • Menambahkan dukungan untuk perangkat inti Greengrass yang menjalankan Amazon Linux 2.

  • Menambahkan parameter CaptureDataDiskPath konfigurasi baru. Anda dapat menggunakan parameter ini untuk menentukan jalur folder data yang diambil pada perangkat Anda.

Perbaikan bug dan peningkatan
  • Versi diperbarui untuk Greengrass nucleus versi 2.5.0 rilis.

1.0.3

Versi diperbarui untuk Greengrass nucleus versi 2.4.0 rilis.

1.0.2

Perbaikan bug dan peningkatan

Memperbarui skrip instalasi dalam siklus hidup komponen. Perangkat inti Anda sekarang harus memiliki Python 3.6 atau yang lebih baru, termasuk pip untuk versi Python Anda, yang diinstal pada perangkat sebelum Anda men-deploy komponen ini.

1.0.1

Versi yang diperbarui untuk rilis inti Greengrass versi 2.3.0.

1.0.0

Versi awal.