Introducción a la implementación de herramientas de machine learning en EKS - Amazon EKS

Introducción a la implementación de herramientas de machine learning en EKS

Para comenzar a utilizar el machine learning en EKS, elija uno de estos patrones prescriptivos para preparar rápidamente un clúster de EKS y el software y hardware de ML para comenzar a ejecutar cargas de trabajo de ML. La mayoría de estos patrones se basan en los esquemas de Terraform que se encuentran disponibles en el sitio web de Datos en Amazon EKS. Antes de comenzar, debe tener en cuenta algunas cosas:

  • Se necesitan GPU o instancias de Neuron para ejecutar estos procedimientos. La falta de disponibilidad de estos recursos puede provocar que estos procedimientos fallen durante la creación del clúster o el escalado automático de nodos.

  • Neuron SDK (instancias basadas en Tranium e Inferentia) pueden suponer un ahorro de dinero y están más disponibles que las GPU NVIDIA. Por lo tanto, si las cargas de trabajo lo permiten, recomendamos que considere el uso de Neutron para las cargas de trabajo de machine learning (consulte Bienvenido a AWS Neuron).

  • Algunas de las experiencias para comenzar aquí requieren que obtenga datos a través de una cuenta propia de Hugging Face.

Para comenzar, elija entre la siguiente selección de patrones diseñados para ayudar a configurar la infraestructura para ejecutar las cargas de trabajo de machine learning:

Continuar con el uso de ML en EKS

Además de elegir entre los esquemas descritos en esta página, existen otras formas de proceder a través de la documentación de ML en EKS, si así lo prefiere. Por ejemplo, puede hacer lo siguiente:

Para mejorar su trabajo con ML en EKS, consulte lo siguiente: