Privacidade de dados na Amazon SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Privacidade de dados na Amazon SageMaker

A Amazon SageMaker coleta informações agregadas sobre o uso de bibliotecas AWS próprias e de código aberto usadas durante o treinamento. SageMaker usa esses metadados agregados para melhorar os serviços e a experiência do cliente.

As seções a seguir fornecem explicações sobre o tipo de metadados que são coletados e como optar por não participar da SageMaker coleta de metadados.

Tipos de informação coletados

Informações de uso

Metadados AWS de bibliotecas próprias e de código aberto que são usados com SageMaker treinamento, como aqueles usados para treinamento distribuído, compilação e quantização.

Erros

Erros de comportamento inesperado, incluindo falhas, falhas, cascatas e falhas resultantes da interação com a plataforma de treinamento. SageMaker

Como cancelar a coleta de metadados

Você pode optar por não compartilhar metadados agregados com o SageMaker treinamento ao criar um trabalho de treinamento usando o. CreateTrainingJob API Se você estiver usando o console para criar trabalhos de treinamento, a coleta de metadados será desativada por padrão.

Importante

Você deve optar por não receber a coleta de metadados para cada trabalho de treinamento enviado. Você também deve optar por não participar de uma API chamada, conforme mostrado nos exemplos a seguir. Você não pode optar por não participar de um script de treinamento.

A seção a seguir mostra como você pode optar por não participar da coleta de metadados usando o AWS CLI AWS SDK for Python (Boto3), ou o SageMaker PythonSDK.

Desative a coleta de metadados usando o AWS Command Line Interface ()AWS CLI

Para desativar a coleta de metadados usando o AWS CLI, defina OPT_OUT_TRACKING a variável de ambiente create-training-job API como 1 no, conforme mostrado no exemplo de código a seguir.

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

Opte por não participar da coleta de metadados usando o AWS SDK for Python (Boto3)

Para desativar a coleta de metadados usando o SDK for Python (Boto3), defina a OPT_OUT_TRACKING variável 1 de ambiente como no, conforme mostrado no exemplo de código create_training_job API a seguir.

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

Desative a coleta de metadados usando o Python SageMaker SDK

Para desativar a coleta de metadados usando o SageMaker SDK Python, defina a OPT_OUT_TRACKING variável 1 de ambiente como dentro de SageMaker um estimador, conforme mostrado no exemplo de código a seguir.

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

Opte por não participar da coleta de metadados em toda a conta

Se você quiser desativar a coleta de metadados para várias contas, defina uma variável de ambiente para desativar o rastreamento em toda a conta. Você deve usar o SageMaker Python SDK para cancelar a coleta de metadados no nível da conta.

O exemplo de código a seguir mostra como desativar o rastreamento em toda a conta.

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

Para obter mais informações sobre como desativar o rastreamento em toda a conta, consulte Como configurar e usar padrões com o Python. SageMaker SDK

Mais informações

Se seu serviço downstream SageMaker depender de treinamento

Se você opera um serviço que depende de SageMaker treinamento, é altamente recomendável informar seu cliente sobre a coleta agregada de metadados na plataforma de SageMaker treinamento e apresentar a ele a opção de optar por não participar. Como alternativa, você pode cancelar a coleta de metadados em nome do seu cliente.

Se você é cliente ou cliente de um serviço que usa SageMaker treinamento

Se você é cliente ou cliente de um serviço que usa SageMaker treinamento, use seu método preferido na seção anterior para cancelar a coleta de metadados.