Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Exploración de los datos con técnicas de visualización
nota
Solo puede usar las visualizaciones de SageMaker Canvas para modelos basados en conjuntos de datos tabulares. También se excluyen los modelos de predicción de texto de varias categorías.
Con Amazon SageMaker Canvas, puede explorar y visualizar sus datos para obtener información avanzada sobre ellos antes de crear sus modelos de aprendizaje automático. Puede realizar la visualización mediante gráficos de dispersión, gráficos de barras y diagramas de cajas, que pueden ayudarle a comprender los datos y a descubrir las relaciones entre las características que podrían afectar a la precisión del modelo.
En la pestaña Crear de la aplicación SageMaker Canvas, elija el visualizador de datos para empezar a crear sus visualizaciones.
Puede cambiar el tamaño de la muestra de visualización para ajustar el tamaño de la muestra aleatoria tomada del conjunto de datos. Un tamaño de muestra demasiado grande puede afectar al rendimiento de las visualizaciones de datos, por lo que le recomendamos que elija un tamaño de muestra adecuado. Para cambiar el tamaño de la muestra, use el procedimiento siguiente.
-
Elija una Muestra de visualización.
-
Utilice el control deslizante para seleccionar el tamaño de muestra que desee.
-
Seleccione Actualizar para confirmar el cambio en el tamaño de la muestra.
nota
Algunas técnicas de visualización requieren columnas de un tipo de datos específico. Por ejemplo, solo puede usar columnas numéricas para los ejes x e y de los gráficos de dispersión.
Gráfico de dispersión
Para crear un gráfico de dispersión con su conjunto de datos, elija Gráfico de dispersión en el panel de Visualización. Elija las características que desee trazar en los ejes x e Y en la sección Columnas. Puede arrastrar y soltar las columnas sobre los ejes o, una vez que haya colocado un eje, puede elegir una columna de la lista de columnas compatibles.
Puede utilizar Colorear por para colorear los puntos de datos del gráfico con una tercera característica. También puede usar Agrupar por para agrupar los datos en gráficos separados en función de una cuarta característica.
La siguiente imagen muestra un gráfico de dispersión que utiliza Colorear por y Agrupar por. En este ejemplo, la característica MaritalStatus
colorea cada punto de datos y, al agruparlo por la característica Department
, se obtiene un gráfico de dispersión para los puntos de datos de cada departamento.
Gráfico de barras
Para crear un gráfico de barras con su conjunto de datos, elija Gráfico de barras en el panel de Visualización. Elija las entidades que desee trazar en los ejes x e Y en la sección Columnas. Puede arrastrar y soltar las columnas sobre los ejes o, una vez que haya colocado un eje, puede elegir una columna de la lista de columnas compatibles.
Puede utilizar Agrupar por para agrupar el gráfico de barras por una tercera característica. Puede utilizar Apilar por para sombrear verticalmente cada barra en función de los valores únicos de una cuarta característica.
La siguiente imagen muestra un gráfico de barras que utiliza Agrupar por y Apilar por. En este ejemplo, el gráfico de barras está agrupado por la característica MaritalStatus
y apilado por la característica JobLevel
. Para cada JobRole
del eje x, hay una barra independiente para las categorías únicas de la característica MaritalStatus
, y cada barra se apila verticalmente según la característica JobLevel
.
Gráfico de cajas
Para crear un gráfico de cajas con su conjunto de datos, elija Diagrama de cajas en el panel de Visualización. Elija las entidades que desee trazar en los ejes x e Y en la sección Columnas. Puede arrastrar y soltar las columnas sobre los ejes o, una vez que haya colocado un eje, puede elegir una columna de la lista de columnas compatibles.
Puede utilizar Agrupar por para agrupar los diagramas de caja por una tercera característica.
La siguiente imagen muestra un gráfico de cajas que utiliza Agrupar por. En este ejemplo, los ejes x e y muestran JobLevel
y JobSatisfaction
, respectivamente, y los diagramas de cajas de colores se agrupan por la característica Department
.