Marcos y algoritmos compatibles
La siguiente tabla muestra los marcos y algoritmos de machine learning de SageMaker compatibles con el depurador.
SageMaker-supported frameworks and algorithms | Debugging output tensors |
---|---|
AWS Contenedores de aprendizaje profundo TensorFlow 1.15.4 |
|
AWS Contenedores de aprendizaje profundo PyTorch 1.5.0 |
|
AWS Contenedores de aprendizaje profundo MXNet |
|
1.0-1, 1.2-1, 1.3-1 |
|
Contenedores de entrenamiento personalizados (disponibles para TensorFlow, PyTorch, MXNet y XGBoost con registro manual de enlaces) |
-
Depuración de tensores de salida: rastrea y depura los parámetros del modelo, como los pesos, los gradientes, los sesgos y los valores escalares de tu trabajo de entrenamiento. Los marcos compatibles de aprendizaje profundo son Apache MXNet, TensorFlow, PyTorch y XGBoost.
importante
En cuanto al marco TensorFlow con Keras, el depurador de SageMaker ya no admite el cambio sin código para los modelos de depuración creados con los módulos
tf.keras
de TensorFlow 2.6 y versiones posteriores. Esto se debe a los cambios importantes anunciados en la nota de la versión de TensorFlow 2.6.0.Para obtener instrucciones sobre cómo actualizar el script de entrenamiento, consulte Adaptación del script de entrenamiento de TensorFlow. importante
A partir de la versión 1.12.0 de PyTorch y versiones posteriores, el depurador de SageMaker ya no admite cambios sin código para los modelos de depuración.
Esto se debe a cambios importantes que hacen que el depurador de SageMaker interfiera con la funcionalidad
torch.jit
. Para obtener instrucciones sobre cómo actualizar el script de entrenamiento, consulte Adaptar su script de entrenamiento de PyTorch.
Si el marco o algoritmo que desea entrenar o depurar no aparece en la tabla, visite el AWS foro de debate
Regiones de AWS
El depurador de Amazon SageMaker está disponible en todas las regiones donde el servicio de Amazon SageMaker está disponible, excepto en las siguientes regiones.
Asia-Pacífico (Yakarta):
ap-southeast-3
Para saber el servicio de Amazon SageMaker está disponible en su Región de AWS, consulte AWSServicios regionales
Utilice el depurador con contenedores de entrenamiento personalizados
Lleve sus contenedores de entrenamiento a SageMaker y obtenga información sobre sus trabajos de entrenamiento usando el depurador. Maximice la eficiencia de su trabajo optimizando su modelo en las instancias de Amazon EC2 mediante las funciones de supervisión y depuración.
Para obtener más información sobre cómo crear un contenedor de entrenamiento con la biblioteca de clientes sagemaker-debugger
, llevarlo al Amazon Elastic Container Registry (Amazon ECR), luego supervisar y depurar, consulte Uso del depurador con contenedores de entrenamiento personalizados.
Repositorios de GitHub de código abierto del depurador
Las API del depurador se proporcionan a través del SageMaker Python SDK y están diseñadas para crear configuraciones de enlaces y reglas del depurador para las operaciones de las API de CreateTrainingJob y DescribeTrainingJob de SageMaker. La biblioteca de clientes sagemaker-debugger
proporciona herramientas para registrar los enlaces y acceder a los datos de entrenamiento a través de su función de prueba, además de sus operaciones de API flexibles y potentes. Admite marcos de machine learning como TensorFlow, PyTorch, MXNet y XGBoost en Python 3.6 y versiones superiores.
Para obtener información directa acerca de las operaciones del depurador y de la API sagemaker-debugger
, consulte los siguientes enlaces:
Si utiliza el SDK para Java para realizar trabajos de entrenamiento relacionados con SageMaker y desea configurar las API del depurador, consulte las siguientes referencias: