Aktifkan caching langkah - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Aktifkan caching langkah

Untuk mengaktifkan caching langkah, Anda harus menambahkan CacheConfig properti ke definisi langkah. CacheConfigproperti menggunakan format berikut dalam file definisi pipeline:

{     "CacheConfig": {         "Enabled": false,         "ExpireAfter": "<time>"     } }

EnabledBidang menunjukkan apakah caching dihidupkan untuk langkah tertentu. Anda dapat mengatur bidang ketrue, yang memberitahu SageMaker untuk mencoba menemukan langkah sebelumnya dengan atribut yang sama. Atau, Anda dapat mengatur bidang kefalse, yang memberitahu SageMaker untuk menjalankan langkah setiap kali pipeline berjalan. ExpireAfteradalah string dalam format durasi ISO 8601 yang mendefinisikan periode batas waktu. ExpireAfterDurasi dapat berupa nilai tahun, bulan, minggu, hari, jam, atau menit. Setiap nilai terdiri dari angka diikuti dengan huruf yang menunjukkan satuan durasi. Sebagai contoh:

  • “30d” = 30 hari

  • “5y” = 5 tahun

  • “T16m” = 16 menit

  • “30dT5h” = 30 hari dan 5 jam.

Diskusi berikut menjelaskan prosedur untuk mengaktifkan caching untuk pipeline baru atau yang sudah ada sebelumnya menggunakan Amazon Python. SageMaker SDK

Aktifkan caching untuk saluran pipa baru

Untuk pipeline baru, inisialisasi CacheConfig instance dengan enable_caching=True dan berikan sebagai input ke langkah pipeline Anda. Contoh berikut mengaktifkan caching dengan periode batas waktu 1 jam untuk langkah pelatihan:

from sagemaker.workflow.pipeline_context import PipelineSession from sagemaker.workflow.steps import CacheConfig cache_config = CacheConfig(enable_caching=True, expire_after="PT1H") estimator = Estimator(..., sagemaker_session=PipelineSession()) step_train = TrainingStep( name="TrainAbaloneModel", step_args=estimator.fit(inputs=inputs), cache_config=cache_config )

Aktifkan caching untuk pipeline yang sudah ada sebelumnya

Untuk mengaktifkan caching untuk pipeline yang sudah ada sebelumnya dan sudah ditentukan, nyalakan enable_caching properti untuk langkah tersebut, dan setel expire_after ke nilai batas waktu. Terakhir, perbarui pipeline dengan pipeline.upsert() ataupipeline.update(). Setelah Anda menjalankannya lagi, contoh kode berikut mengaktifkan caching dengan periode batas waktu 1 jam untuk langkah pelatihan:

from sagemaker.workflow.pipeline_context import PipelineSession from sagemaker.workflow.steps import CacheConfig from sagemaker.workflow.pipeline import Pipeline cache_config = CacheConfig(enable_caching=True, expire_after="PT1H") estimator = Estimator(..., sagemaker_session=PipelineSession()) step_train = TrainingStep( name="TrainAbaloneModel", step_args=estimator.fit(inputs=inputs), cache_config=cache_config ) # define pipeline pipeline = Pipeline( steps=[step_train] ) # additional step for existing pipelines pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()

Atau, perbarui konfigurasi cache setelah Anda mendefinisikan pipeline (yang sudah ada sebelumnya), memungkinkan satu kode berkelanjutan dijalankan. Contoh kode berikut menunjukkan metode ini:

# turn on caching with timeout period of one hour pipeline.steps[0].cache_config.enable_caching = True pipeline.steps[0].cache_config.expire_after = "PT1H" # additional step for existing pipelines pipeline.update() # or, call upsert() to update the pipeline # pipeline.upsert()

Untuk contoh kode yang lebih rinci dan diskusi tentang bagaimana SDK parameter Python memengaruhi caching, lihat Konfigurasi Caching di dokumentasi Amazon Python. SageMaker SDK