本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
設定管道
建議您使用 SageMaker 組態檔案來設定管道的預設值。如需 SageMaker 組態檔案的相關資訊,請參閱搭配 SageMaker Python 設定和使用預設值SDK@step
裝飾器引數中提供新值。下列主題說明如何設定組態檔案。
組態檔案中@step
裝飾器的組態與@remote
裝飾器的組態相同。若要在組態檔案中設定管道角色ARN和管道標籤,請使用下列程式碼片段中顯示的 Pipeline
區段:
SchemaVersion: '1.0' SageMaker: Pipeline: RoleArn: 'arn:aws:iam::555555555555:role/IMRole' Tags: - Key: 'tag_key' Value: 'tag_value'
對於大多數預設值,您也可以透過將新值傳遞給@step
裝飾器來覆寫組態檔案中的設定。例如,您可以覆寫預先處理步驟組態檔案中設定的執行個體類型,如下列範例所示:
@step(instance_type="
ml.m5.large
") def preprocess(raw_data): df = pandas.read_csv(raw_data) ... return procesed_dataframe
一些引數不屬於@step
裝飾器參數清單,只能透過 SageMaker 組態檔案為整個管道設定這些引數。它們列出如下:
sagemaker_session
(sagemaker.session.Session
): SageMaker 委派服務呼叫的基礎 SageMaker 工作階段。如果未指定,則會使用預設組態建立工作階段,如下所示:SageMaker: PythonSDK: Modules: Session: DefaultS3Bucket: 'default_s3_bucket' DefaultS3ObjectKeyPrefix: 'key_prefix'
custom_file_filter
(CustomFileFilter)
:指定要包含在管道步驟中的本機目錄和檔案的CustomFileFilter
物件。如果未指定,此值預設為None
。若要custom_file_filter
讓 生效,您必須將IncludeLocalWorkdir
設定為True
。下列範例顯示忽略所有筆記本檔案,以及名為 的檔案和目錄的組態data
。SchemaVersion: '1.0' SageMaker: PythonSDK: Modules: RemoteFunction: IncludeLocalWorkDir: true CustomFileFilter: IgnoreNamePatterns: # files or directories to ignore - "*.ipynb" # all notebook files - "data" # folder or file named "data"
如需如何使用
IncludeLocalWorkdir
的詳細資訊CustomFileFilter
,請參閱 搭配 @remote 裝飾項目使用模組化代碼。s3_root_uri (str)
: SageMaker 上傳程式碼封存和資料的根 Amazon S3 資料夾。如果未指定,則會使用預設 SageMaker 儲存貯體。s3_kms_key (str)
:用來加密輸入和輸出資料的金鑰。您只能在 SageMaker 組態檔案中設定此引數,且引數會套用至管道中定義的所有步驟。如果未指定,則值預設為None
。如需 S3 KMS金鑰組態範例,請參閱下列程式碼片段:SchemaVersion: '1.0' SageMaker: PythonSDK: Modules: RemoteFunction: S3KmsKeyId: 's3kmskeyid' S3RootUri: 's3://amzn-s3-demo-bucket/my-project