Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Solucione problemas de Clarify Processing Jobs SageMaker
Si encuentra errores en los trabajos de SageMaker procesamiento de Clarify, consulte los siguientes escenarios para ayudar a identificar el problema.
nota
El motivo del error y el mensaje de salida se han diseñado para contener mensajes descriptivos y excepciones, si se encuentran, durante la ejecución. Un motivo frecuente de los errores es que falten parámetros o no sean válidos. Si ve mensajes poco claros, confusos o engañosos o no encuentra una solución, envíe sus comentarios.
Temas
- El trabajo de procesamiento no finaliza
- El trabajo de procesamiento tarda demasiado en ejecutarse
- El trabajo de procesamiento finaliza sin resultados y aparece un mensaje de CloudWatch advertencia
- Mensaje de error de configuración de análisis no válida
- El cálculo de las métricas de sesgo produce un error en varias o en todas las métricas
- Discrepancia entre la configuración del análisis y la entrada o salida del conjunto de datos o modelo
- El modelo devuelve un error interno de servidor 500 o el contenedor recurre a las predicciones por registro debido a un error del modelo
- El rol de ejecución no es válido
- No se pudieron descargar los datos
- No se ha podido conectar a SageMaker
El trabajo de procesamiento no finaliza
Si el trabajo de procesamiento no finaliza, pruebe lo siguiente:
-
Inspeccione los registros de trabajos directamente en el cuaderno en el que ejecutó el trabajo. Los registros del trabajo se encuentran en la salida de la celda del cuaderno en la que se inició la ejecución.
-
Inspeccione los inicios de sesión del trabajo CloudWatch.
-
Agregue la siguiente línea a su cuaderno para describir el último trabajo de procesamiento y busque el motivo del error y el mensaje de salida:
-
clarify_processor.jobs[-1].describe()
-
-
Ejecute el siguiente AWS CLI comando para describir el trabajo de procesamiento y buscar el motivo del error y el mensaje de salida:
-
aws sagemaker describe-processing-job —processing-job-name <processing-job-id>
-
El trabajo de procesamiento tarda demasiado en ejecutarse
Si el trabajo de procesamiento tarda demasiado en ejecutarse, utilice las siguientes formas de encontrar la causa raíz.
Compruebe si la configuración de los recursos es suficiente para gestionar la carga de computación. Para acelerar el trabajo, pruebe lo siguiente:
-
Usa un tipo de instancia más grande. SageMaker Clarify consulta el modelo de forma repetida, y una instancia más grande puede reducir considerablemente el tiempo de cálculo. Para ver una lista de las instancias disponibles, sus tamaños de memoria, ancho de banda y otros detalles de rendimiento, consulta los SageMakerprecios de Amazon
. -
Agrega más instancias. SageMaker Clarify puede usar varias instancias para explicar varios puntos de datos de entrada en paralelo. Para habilitar la computación en paralelo, configure su
instance_count
en más de1
cuando llame alSageMakerClarifyProcessor
. Para obtener más información, consulte Cómo ejecutar trabajos de procesamiento de SageMaker Clarify en paralelo. Si aumenta el número de instancias, supervise el rendimiento de su punto de conexión para comprobar si puede implementar el aumento de carga. Para obtener más información, consulte Captura de datos del punto de conexión en tiempo real. -
Si estás computando SHapley Additive exPlanations (SHAP), reduzca el
num_samples
parámetro en el archivo de configuración del análisis. El número de muestras afecta directamente a lo siguiente:-
El tamaño de los conjuntos de datos sintéticos que se envían a su punto de conexión
-
El tiempo de ejecución
Reducir el número de muestras también puede reducir la precisión en la estimación SHAP valores. Para obtener más información, consulte Archivos de configuración de análisis.
-
El trabajo de procesamiento finaliza sin resultados y aparece un mensaje de CloudWatch advertencia
Si el trabajo de procesamiento finaliza pero no se encuentra ningún resultado, los CloudWatch registros muestran un mensaje de advertencia que indica que se ha recibido la señal 15 y se está limpiando.
Esta advertencia indica que el trabajo se detuvo porque una solicitud de un cliente llamó a la o porque se agotó el tiempo asignado para su finalización. StopProcessingJob
API En este último caso, compruebe el tiempo de ejecución máximo en la configuración del trabajo (max_runtime_in_seconds
) y auméntelo según sea necesario.
Mensaje de error de configuración de análisis no válida
-
Si aparece el mensaje de error No se
puede cargar la configuración del análisis
como. JSON , esto significa que el archivo de entrada de la configuración del análisis para el trabajo de procesamiento no contiene ningún JSON objeto válido. Compruebe la validez del JSON objeto con un JSON linter. -
Si aparece el mensaje de error
Analysis configuration schema validation error.
, esto significa que el archivo de entrada de la configuración del análisis para el trabajo de procesamiento contiene campos desconocidos o tipos no válidos para algunos valores de campo. Revise los parámetros de configuración del archivo y compruébelos con los parámetros que figuran en el archivo de configuración del análisis. Para obtener más información, consulte Archivos de configuración de análisis.
El cálculo de las métricas de sesgo produce un error en varias o en todas las métricas
Si recibe uno de los siguientes mensajes de error No Label values are present in the predicted Label Column, Positive Predicted Index Series contains all False values.
o Predicted Label Column series data type is not the same as Label Column series.
, pruebe lo siguiente:
-
Compruebe que se está utilizando el conjunto de datos correcto.
-
Compruebe si el tamaño del conjunto de datos es demasiado pequeño; si, por ejemplo, contiene solo unas pocas filas. Esto puede provocar que las salidas del modelo tengan el mismo valor o que el tipo de datos se infiera incorrectamente.
-
Compruebe si la etiqueta o la faceta se consideran continuas o categóricas. SageMaker Clarify utiliza la heurística para determinar la.
DataType
En el caso de las métricas de sesgo posteriores al entrenamiento, es posible que el tipo de datos devuelto por el modelo no coincida con el contenido del conjunto de datos o SageMaker que Clarify no pueda transformarlos correctamente. -
En el informe de sesgo, debería ver un valor único para las columnas categóricas o un intervalo para las columnas continuas.
-
Por ejemplo, si una columna tiene valores 0,0 y 1,0 como flotantes, se considerará continua incluso si hay muy pocos valores únicos.
-
Discrepancia entre la configuración del análisis y la entrada o salida del conjunto de datos o modelo
-
Compruebe que el formato de referencia de la configuración de análisis es el mismo que el formato del conjunto de datos.
-
Si recibe el mensaje de error
Could not convert string to float.
, compruebe que el formato se ha especificado correctamente. También podría indicar que las predicciones del modelo tienen un formato diferente al de la columna de etiquetas o podría indicar que la configuración de la etiqueta o las probabilidades es incorrecta. -
Si recibe el mensaje de error
Unable to locate the facet.
oHeaders must contain label.
oHeaders in config do not match with the number of columns in the dataset.
oFeature names not found.
, compruebe que los encabezados coinciden con las columnas. -
Si recibes el mensaje de error
Los datos deben contener funciones
. , compruebe la plantilla de contenido de JSON Lines y compárela con el ejemplo del conjunto de datos, si está disponible.
El modelo devuelve un error interno de servidor 500 o el contenedor recurre a las predicciones por registro debido a un error del modelo
Si recibe el mensaje de error Fallback to per-record prediction because of model error.
, esto podría indicar que el modelo no puede gestionar el tamaño del lote, está limitado o simplemente no acepta la entrada pasada por el contenedor debido a problemas de serialización. Deberías revisar los CloudWatch registros del SageMaker punto final y buscar mensajes de error o rastreos. Para los casos de limitación de modelos, puede ser útil utilizar un tipo de instancia diferente o aumentar el número de instancias del punto de conexión.
El rol de ejecución no es válido
Esto indica que el rol proporcionado es incorrecto o que faltan los permisos necesarios. Compruebe el rol y los permisos que se utilizaron para configurar el trabajo de procesamiento y compruebe la política de permisos y confianza del rol.
No se pudieron descargar los datos
Esto indica que no se pudieron descargar las entradas del trabajo para que se iniciara el trabajo. Compruebe el nombre del bucket y los permisos del conjunto de datos y las entradas de configuración.
No se ha podido conectar a SageMaker
Esto indica que el trabajo no pudo llegar a los puntos finales SageMaker del servicio. Compruebe los ajustes de configuración de red para el trabajo de procesamiento y compruebe la configuración de la nube privada virtual (VPC).