本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker AI 中的資料隱私權
Amazon SageMaker AI 會收集訓練期間使用 AWS自有和開放原始碼程式庫的彙總資訊。SageMaker AI 使用此彙總中繼資料來改善服務和客戶體驗。
以下各節說明 SageMaker AI 收集的中繼資料類型,以及如何選擇退出中繼資料收集。
收集的資訊類型
- 用量資訊
-
用於 SageMaker 訓練的 AWS擁有和開放原始碼程式庫中繼資料,例如用於分散式訓練、編譯和量化的中繼資料。
- 錯誤
-
意外行為的錯誤,包括與 SageMaker 訓練平台互動所造成的失敗、當機、串聯和失敗。
如何選擇退出中繼資料收集
在使用 CreateTrainingJob
API 建立訓練工作時,您可以選擇不與 SageMaker 訓練共用彙總中繼資料。如果您使用 主控台建立訓練任務,中繼資料收集預設為停用。
重要
您必須選擇不為提交的每個訓練任務收集中繼資料。您還必須選擇退出 API 呼叫,如下列範例所示。您無法選擇在訓練指令碼內選擇退出。
下一節說明如何使用 AWS CLI AWS SDK for Python (Boto3)、 或 SageMaker Python SDK 選擇退出中繼資料收集。
使用 AWS Command Line Interface (AWS CLI) 選擇不收集中繼資料
若要使用 選擇退出中繼資料收集 AWS CLI,請在 create-training-job
API 1
中將環境變數設定為 OPT_OUT_TRACKING
,如下列程式碼範例所示。
aws sagemaker create-training-job \ --training-job-name
your_job_name
\ --algorithm-specification AlgorithmName=your_algorithm_name
\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix
\ --resource-config InstanceType=ml.c5.xlarge
, InstanceCount=1
\ --stopping-condition MaxRuntimeInSeconds=100
\ --environment OPT_OUT_TRACKING=1
使用 選擇退出中繼資料收集 AWS SDK for Python (Boto3)
若要使用適用於 Python 的 SDK (Boto3) 選擇退出中繼資料收集,請在 create_training_job
API 1
中將環境變數設定為 OPT_OUT_TRACKING
,如下列程式碼範例所示。
boto3.client('sagemaker').create_training_job( TrainingJobName='
your_training_job
', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name
', 'TrainingInputMode': 'File', }, RoleArn='your_arn
', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix
', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge
', 'InstanceCount':1
, 'VolumeSizeInGB':123
, }, StoppingCondition={ 'MaxRuntimeInSeconds':123
, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )
使用 SageMaker Python SDK 選擇退出中繼資料集合
若要使用 SageMaker Python SDK 選擇退出中繼資料收集,請將環境變數OPT_OUT_TRACKING
設定為 SageMaker AI 估算器1
內部,如下列程式碼範例所示。
sagemaker.estimator( image_uri='
path_to_container
', role='rolearn
', instance_count=1
, instance_type='ml.c5.xlarge
', environment={ 'OPT_OUT_TRACKING': '1' }, )
選擇退出整個帳戶的中繼資料集合
如果您想要選擇退出多個帳戶的中繼資料收集,您可以將環境變數設定為選擇退出整個追蹤帳戶。您必須使用 SageMaker AI Python SDK,在帳戶層級選擇退出中繼資料集合。
下列程式碼範例顯示如何選擇退出整個帳戶的追蹤。
SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'
如需如何選擇不追蹤整個帳戶的詳細資訊,請參閱搭配 SageMaker Python SDK 設定和使用預設值
其他資訊
如果您的下游服務依賴 SageMaker AI 訓練
如果您操作依賴 SageMaker 訓練的服務,強烈建議您通知客戶 SageMaker Training 平台中的彙總中繼資料收集,並向他們提供選擇退出的選擇。或者,您可以代表客戶選擇退出中繼資料集合。
如果您是使用 SageMaker AI 訓練之服務的用戶端或客戶
如果您是使用 SageMaker 訓練之服務的用戶端或客戶,請使用上一節中您偏好的方法來選擇退出中繼資料收集。