Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Aktifkan caching langkah
Untuk mengaktifkan caching langkah, Anda harus menambahkan CacheConfig
properti ke definisi langkah. CacheConfig
properti menggunakan format berikut dalam file definisi pipeline:
{ "CacheConfig": { "Enabled": false, "ExpireAfter": "<time>" } }
Enabled
Bidang menunjukkan apakah caching dihidupkan untuk langkah tertentu. Anda dapat mengatur bidang ketrue
, yang memberi tahu SageMaker AI untuk mencoba menemukan langkah langkah sebelumnya dengan atribut yang sama. Atau, Anda dapat mengatur bidang kefalse
, yang memberi tahu SageMaker AI untuk menjalankan langkah setiap kali pipeline berjalan. ExpireAfter
adalah string dalam format durasi ISO 8601ExpireAfter
Durasi dapat berupa nilai tahun, bulan, minggu, hari, jam, atau menit. Setiap nilai terdiri dari angka diikuti dengan huruf yang menunjukkan satuan durasi. Sebagai contoh:
-
“30d” = 30 hari
-
“5y” = 5 tahun
-
“T16m” = 16 menit
-
“30dT5h” = 30 hari dan 5 jam.
Diskusi berikut menjelaskan prosedur untuk mengaktifkan caching untuk pipeline baru atau yang sudah ada sebelumnya menggunakan Amazon Python. SageMaker SDK
Aktifkan caching untuk saluran pipa baru
Untuk pipeline baru, inisialisasi CacheConfig
instance dengan enable_caching=True
dan berikan sebagai input ke langkah pipeline Anda. Contoh berikut mengaktifkan caching dengan periode batas waktu 1 jam untuk langkah pelatihan:
from sagemaker.workflow.pipeline_context import PipelineSession from sagemaker.workflow.steps import CacheConfig cache_config = CacheConfig(enable_caching=True, expire_after="PT1H") estimator = Estimator(..., sagemaker_session=PipelineSession()) step_train = TrainingStep( name="TrainAbaloneModel", step_args=estimator.fit(inputs=inputs), cache_config=cache_config )
Aktifkan caching untuk pipeline yang sudah ada sebelumnya
Untuk mengaktifkan caching untuk pipeline yang sudah ada sebelumnya dan sudah ditentukan, nyalakan enable_caching
properti untuk langkah tersebut, dan setel expire_after
ke nilai batas waktu. Terakhir, perbarui pipeline dengan pipeline.upsert()
ataupipeline.update()
. Setelah Anda menjalankannya lagi, contoh kode berikut mengaktifkan caching dengan periode batas waktu 1 jam untuk langkah pelatihan:
from sagemaker.workflow.pipeline_context import PipelineSession from sagemaker.workflow.steps import CacheConfig from sagemaker.workflow.pipeline import Pipeline cache_config = CacheConfig(enable_caching=True, expire_after="PT1H") estimator = Estimator(..., sagemaker_session=PipelineSession()) step_train = TrainingStep( name="TrainAbaloneModel", step_args=estimator.fit(inputs=inputs), cache_config=cache_config ) # define pipeline pipeline = Pipeline( steps=[step_train] ) # additional step for existing pipelines pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()
Atau, perbarui konfigurasi cache setelah Anda mendefinisikan pipeline (yang sudah ada sebelumnya), memungkinkan satu kode berkelanjutan dijalankan. Contoh kode berikut menunjukkan metode ini:
# turn on caching with timeout period of one hour pipeline.steps[0].cache_config.enable_caching = True pipeline.steps[0].cache_config.expire_after = "PT1H" # additional step for existing pipelines pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()
Untuk contoh kode yang lebih rinci dan diskusi tentang bagaimana SDK parameter Python memengaruhi caching, lihat Konfigurasi Caching di dokumentasi