Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Migrasikan sumber daya ke Operator terbaru
Kami menghentikan pengembangan dan dukungan teknis dari versi asli SageMaker Operator untuk Kubernetes
Jika saat ini Anda menggunakan SageMaker Operator untuk Kubernetes versi v1.2.2
atau di bawah ini, kami sarankan untuk
Untuk jawaban atas pertanyaan umum di akhir dukungan versi asli SageMaker Operator untuk Kubernetes, lihat Mengumumkan Akhir Dukungan Versi Asli Operator SageMaker AI untuk Kubernetes
Gunakan langkah-langkah berikut untuk memigrasikan sumber daya Anda dan menggunakan ACK untuk melatih, menyetel, dan menerapkan model pembelajaran mesin dengan Amazon SageMaker AI.
catatan
Operator SageMaker AI terbaru untuk Kubernetes tidak kompatibel ke belakang.
Daftar Isi
Prasyarat
Agar berhasil memigrasikan sumber daya ke Operator SageMaker AI terbaru untuk Kubernetes, Anda harus melakukan hal berikut:
-
Instal Operator SageMaker AI terbaru untuk Kubernetes. Lihat Penyiapan
di Machine Learning dengan ACK SageMaker AI Controller untuk step-by-step petunjuk. -
Jika Anda menggunakanSumber daya HostingAutoscalingPolicy, instal Application Auto Scaling Operator yang baru. Lihat Penyiapan
di Beban Kerja SageMaker AI Skala dengan Application Auto Scaling untuk petunjuk. step-by-step Langkah ini opsional jika Anda tidak menggunakan HostingAutoScalingPolicy sumber daya.
Jika izin dikonfigurasi dengan benar, maka pengontrol layanan ACK SageMaker AI dapat menentukan spesifikasi dan status AWS sumber daya dan merekonsiliasi sumber daya seolah-olah pengontrol ACK awalnya membuatnya.
Mengadopsi sumber daya
Operator SageMaker AI baru untuk Kubernetes menyediakan kemampuan untuk mengadopsi sumber daya yang awalnya tidak dibuat oleh pengontrol layanan ACK. Untuk informasi selengkapnya, lihat Mengadopsi Sumber AWS Daya yang Ada
Langkah-langkah berikut menunjukkan bagaimana Operator SageMaker AI baru untuk Kubernetes dapat mengadopsi titik akhir AI yang ada SageMaker . Simpan sampel berikut ke file bernamaadopt-endpoint-sample.yaml
.
apiVersion: services.k8s.aws/v1alpha1 kind: AdoptedResource metadata: name: adopt-endpoint-sample spec: aws: # resource to adopt, not created by ACK nameOrID: xgboost-endpoint kubernetes: group: sagemaker.services.k8s.aws kind: Endpoint metadata: # target K8s CR name name: xgboost-endpoint
Kirim sumber daya khusus (CR) menggunakankubectl apply
:
kubectl apply -f adopt-endpoint-sample.yaml
Gunakan kubectl describe
untuk memeriksa kondisi status sumber daya yang Anda adopsi.
kubectl describe adoptedresource adopt-endpoint-sample
Verifikasi bahwa ACK.Adopted
kondisinyaTrue
. Outputnya akan terlihat mirip dengan contoh berikut:
--- kind: AdoptedResource metadata: annotations: kubectl.kubernetes.io/last-applied-configuration: '{"apiVersion":"services.k8s.aws/v1alpha1","kind":"AdoptedResource","metadata":{"annotations":{},"name":"xgboost-endpoint","namespace":"default"},"spec":{"aws":{"nameOrID":"xgboost-endpoint"},"kubernetes":{"group":"sagemaker.services.k8s.aws","kind":"Endpoint","metadata":{"name":"xgboost-endpoint"}}}}' creationTimestamp: '2021-04-27T02:49:14Z' finalizers: - finalizers.services.k8s.aws/AdoptedResource generation: 1 name: adopt-endpoint-sample namespace: default resourceVersion: '12669876' selfLink: "/apis/services.k8s.aws/v1alpha1/namespaces/default/adoptedresources/adopt-endpoint-sample" uid: 35f8fa92-29dd-4040-9d0d-0b07bbd7ca0b spec: aws: nameOrID: xgboost-endpoint kubernetes: group: sagemaker.services.k8s.aws kind: Endpoint metadata: name: xgboost-endpoint status: conditions: - status: 'True' type: ACK.Adopted
Periksa apakah sumber daya Anda ada di klaster Anda:
kubectl describe endpoints.sagemaker xgboost-endpoint
Sumber daya HostingAutoscalingPolicy
Sumber daya HostingAutoscalingPolicy
(HAP) terdiri dari beberapa sumber daya Application Auto Scaling: dan. ScalableTarget
ScalingPolicy
Saat mengadopsi sumber daya HAP dengan ACK, pertama-tama instal pengontrol Application AutoScalableTarget
dan ScalingPolicy
sumber daya. Anda dapat menemukan pengindentifikasi sumber daya untuk sumber daya ini dalam status HostingAutoscalingPolicy
resource ()status.ResourceIDList
.
HostingDeployment sumber daya
Sumber HostingDeployment
daya terdiri dari beberapa sumber daya SageMaker AI:Endpoint
,EndpointConfig
, dan masing-masingModel
. Jika Anda mengadopsi titik akhir SageMaker AI di ACK, Anda perlu mengadopsiEndpoint
,EndpointConfig
, dan masing-masing Model
secara terpisah. Model
NamaEndpoint
,EndpointConfig
, dan dapat ditemukan dalam status HostingDeployment
sumber daya (status.endpointName
,status.endpointConfigName
, danstatus.modelNames
).
Untuk daftar semua sumber daya SageMaker AI yang didukung, lihat Referensi ACK API
Bersihkan sumber daya lama
Setelah Operator SageMaker AI baru untuk Kubernetes mengadopsi sumber daya Anda, Anda dapat menghapus instalan operator lama dan membersihkan sumber daya lama.
Langkah 1: Copot pemasangan operator lama
Untuk menghapus instalan operator lama, lihatHapus operator.
Awas
Copot pemasangan operator lama sebelum menghapus sumber daya lama.
Langkah 2: Hapus finalizer dan hapus sumber daya lama
Awas
Sebelum menghapus sumber daya lama, pastikan Anda telah menghapus instalan operator lama.
Setelah menghapus instalan operator lama, Anda harus secara eksplisit menghapus finalizer untuk menghapus sumber daya operator lama. Contoh skrip berikut menunjukkan cara menghapus semua pekerjaan pelatihan yang dikelola oleh operator lama di namespace tertentu. Anda dapat menggunakan pola serupa untuk menghapus sumber daya tambahan setelah diadopsi oleh operator baru.
catatan
Anda harus menggunakan nama sumber daya lengkap untuk mendapatkan sumber daya. Misalnya, gunakan kubectl get trainingjobs.sagemaker.aws.amazon.com
sebagai ganti dari kubectl get trainingjob
.
namespace=
sagemaker_namespace
training_jobs=$(kubectl get trainingjobs.sagemaker.aws.amazon.com -n $namespace -ojson | jq -r '.items | .[] | .metadata.name') for job in $training_jobs do echo "Deleting $job resource in $namespace namespace" kubectl patch trainingjobs.sagemaker.aws.amazon.com $job -n $namespace -p '{"metadata":{"finalizers":null}}' --type=merge kubectl delete trainingjobs.sagemaker.aws.amazon.com $job -n $namespace done
Gunakan Operator SageMaker AI baru untuk Kubernetes
Untuk panduan mendalam tentang penggunaan Operator SageMaker AI baru untuk Kubernetes, lihat Gunakan Operator SageMaker AI untuk Kubernetes