Ajustes de modelos Configuración de datos Hiperparámetros Implementación Seguridad Información adicional

Afinamiento de un modelo en Studio

El afinamiento entrena un modelo previamente entrenado en un nuevo conjunto de datos sin tener que entrenarlo desde cero. Este proceso, también conocido como aprendizaje por transferencia, puede producir modelos precisos con conjuntos de datos más pequeños y con menos tiempo de entrenamiento. Para afinar JumpStart los modelos básicos, navega hasta una tarjeta de detalles del modelo en la interfaz de usuario de Studio. Para obtener más información sobre cómo abrir JumpStart en Studio, consulte. Abrir y usar en Studio JumpStart Tras acceder a la tarjeta de detalles del modelo que prefiera, seleccione Entrenar en la esquina superior derecha. Tenga en cuenta que no todos los modelos están disponibles para su afinamiento.

importante

Algunos modelos fundacionales requieren la aceptación explícita de un acuerdo de licencia de usuario final (EULA) antes del afinamiento. Para obtener más información, consulte Aceptación del EULA en Amazon Studio SageMaker .

Ajustes de modelos

Cuando se utiliza un modelo JumpStart básico previamente entrenado en Amazon SageMaker Studio, la ubicación del artefacto del modelo (URI de Amazon S3) se rellena de forma predeterminada. Para editar el URI predeterminado de Amazon S3, elija Introducir la ubicación del artefacto del modelo. No todos los modelos admiten cambiar la ubicación del artefacto del modelo.

Configuración de datos

En el campo Datos, proporcione un punto de URI de Amazon S3 a la ubicación del conjunto de datos de entrenamiento. El URI predeterminado de Amazon S3 apunta a un ejemplo de conjunto de datos de entrenamiento. Para editar el URI predeterminado de Amazon S3, seleccione Introducir conjunto de datos de entrenamiento y cambie el URI. Asegúrate de revisar la tarjeta de detalles del modelo en Amazon SageMaker Studio para obtener información sobre el formato de los datos de entrenamiento.

Hiperparámetros

Puede personalizar los hiperparámetros del trabajo de entrenamiento que se utilizan para ajustar el modelo. Los hiperparámetros disponibles para cada modelo ajustable varían según el modelo.

Los siguientes hiperparámetros son comunes entre los diversos modelos:

Época: una época es un ciclo que recorre todo el conjunto de datos. Varios intervalos completan un lote y, finalmente, varios lotes completan una época. Se ejecutan varias épocas hasta que la precisión del modelo alcanza un nivel aceptable o cuando la tasa de error cae por debajo de un nivel aceptable.
Tasa de aprendizaje: la cantidad que deben cambiar los valores entre épocas. A medida que se perfecciona el modelo, se modifican sus ponderaciones internas y se comprueban las tasas de error para ver si el modelo mejora. Una tasa de aprendizaje típica es de 0,1 o 0,01, donde 0,01 es un ajuste mucho menor y podría provocar que el entrenamiento tarde mucho en converger, mientras que 0,1 es mucho mayor y puede provocar que el entrenamiento se sobrepase. Es uno de los principales hiperparámetros que puede ajustar para entrenar su modelo. Tenga en cuenta que, en el caso de los modelos de texto, una tasa de aprendizaje mucho menor (5e-5 para BERT) puede dar como resultado un modelo más preciso.
Tamaño del lote: el número de registros del conjunto de datos que se van a seleccionar para cada intervalo y enviarlos al GPUs para su entrenamiento.

Consulte las peticiones de la información sobre herramientas y la información adicional de la tarjeta de detalles del modelo en la interfaz de usuario de Studio para obtener más información sobre hiperparámetros específicos del modelo elegido.

Para obtener más información sobre hiperparámetros disponibles, consulte Hiperparámetros de afinamiento compatibles comunes.

Implementación

Especifique el tipo de instancia de entrenamiento y la ubicación del artefacto de salida para el trabajo de entrenamiento. Solo puede elegir entre instancias que sean compatibles con el modelo elegido en el afinamiento de la interfaz de usuario de Studio. La ubicación predeterminada del artefacto de salida es el depósito predeterminado de la SageMaker IA. Para cambiar la ubicación del artefacto de salida, elija Introducir ubicación del artefacto de salida y cambie la URI de Amazon S3.

Seguridad

Especifique la configuración de seguridad que utilizará para su trabajo de formación, incluida la función de IAM que la SageMaker IA utiliza para entrenar su modelo, si su trabajo de formación debe conectarse a una nube privada virtual (VPC) y cualquier clave de cifrado para proteger sus datos.

Información adicional

En el campo Información adicional puede editar el nombre del trabajo de entrenamiento. También puede agregar y eliminar etiquetas en forma de pares clave-valor para organizar y categorizar sus trabajos de entrenamiento de afinamiento.

Tras proporcionar la información para la configuración de afinamiento, seleccione Enviar. Si el modelo fundacional previamente diseñado que ha decidido afinar requiere aceptación explícita de un acuerdo de licencia para el usuario final (EULA) antes del entrenamiento, el EULA aparece en una ventana emergente. Para aceptar los términos del EULA, elija Aceptar. Usted es el responsable de revisar y cumplir los términos de licencia aplicables y de asegurarse de que sean aceptables para su caso de uso antes de descargar o usar el modelo.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Estudio

Implementación de un modelo en Studio