Ejemplos de conjuntos de datos en Canvas - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplos de conjuntos de datos en Canvas

SageMaker Canvas proporciona conjuntos de datos de muestra que abordan casos de uso únicos para que pueda empezar a crear, entrenar y validar modelos rápidamente sin escribir ningún código. Los casos de uso asociados a estos conjuntos de datos destacan las capacidades de SageMaker Canvas, y puede aprovechar estos conjuntos de datos para empezar a crear modelos. Puede encontrar los conjuntos de datos de muestra en la página de conjuntos de datos de su aplicación Canvas. SageMaker

Los siguientes conjuntos de datos son los ejemplos que SageMaker Canvas proporciona de forma predeterminada. Estos conjuntos de datos abarcan casos de uso como la predicción del precio de la vivienda, la morosidad de los préstamos y la readmisión de pacientes diabéticos; la previsión de las ventas; la predicción de los fallos de la maquinaria para agilizar el mantenimiento predictivo en las unidades de fabricación; y la generación de predicciones de la cadena de suministro para el transporte y la logística. Los conjuntos de datos se almacenan en la sample_dataset carpeta del bucket de Amazon S3 predeterminado que se SageMaker crea para su cuenta en una región.

  • canvas-sample-diabetic-readmission.csv: este conjunto de datos contiene datos históricos que incluyen más de quince características con los resultados de los pacientes y los hospitales. Puede utilizar este conjunto de datos para predecir si es probable que los pacientes diabéticos de alto riesgo sean readmitidos en el hospital dentro de los 30 días siguientes al alta, después de 30 días o que no vuelvan a ingresar en el hospital. Utilice la columna de reingresos como columna de destino y utilice el tipo de modelo de predicción de más de 3 categorías con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con este conjunto de datos, consulte la página del taller de SageMaker Canvas. Este conjunto de datos se obtuvo del UCIMachine Learning Repository.

  • canvas-sample-housing.csv: este conjunto de datos contiene datos sobre las características vinculadas a un precio de vivienda determinado. Puede usar este conjunto de datos para predecir los precios de la vivienda. Utilice la columna median_house_value como columna de destino y utilice el tipo de modelo de predicción numérica con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con este conjunto de datos, consulte la página del taller de Canvas. SageMaker Este es el conjunto de datos sobre viviendas de California obtenido del StatLib repositorio.

  • canvas-sample-loans.csv: este conjunto de datos contiene datos crediticios completos de todos los préstamos emitidos entre 2007 y 2011, incluidos el estado actual del préstamo y la información de pago más reciente. Puede usar este conjunto de datos para predecir si un cliente reembolsará un préstamo. Utilice la columna de loan_status como columna de destino y utilice el tipo de modelo de predicción de más de 3 categorías con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con este conjunto de datos, consulte la página del taller de SageMaker Canvas. Estos datos utilizan los LendingClub datos obtenidos de Kaggle.

  • canvas-sample-maintenance.csv: este conjunto de datos contiene datos sobre las características relacionadas con un tipo de fallo de mantenimiento determinado. Puede usar este conjunto de datos para predecir qué fallos se producirán en el futuro. Utilice la columna de Failure Type como columna de destino y utilice el tipo de modelo de predicción de más de 3 categorías con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con este conjunto de datos, consulte la página del taller de SageMaker Canvas. Este conjunto de datos se obtuvo del UCIMachine Learning Repository.

  • canvas-sample-shipping-logs.csv: este conjunto de datos contiene datos de envío completos de todos los productos entregados, incluidos el tiempo estimado, la prioridad de envío, el transportista y el origen. Puede usar este conjunto de datos para predecir la hora estimada de llegada del envío en número de días. Usa la ActualShippingDayscolumna como columna de destino y usa el tipo de modelo de predicción numérica con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con estos datos, consulte la página del taller de SageMaker Canvas. Se trata de un conjunto de datos sintético creado por Amazon.

  • canvas-sample-sales-forecasting.csv: este conjunto de datos contiene datos históricos de ventas en series temporales para tiendas minoristas. Puede usar este conjunto de datos para pronosticar las ventas de una tienda minorista en particular. Utilice la columna de ventas como columna de destino y utilice el tipo de modelo de previsión de series temporales con este conjunto de datos. Para obtener más información sobre cómo crear un modelo con este conjunto de datos, consulte la página del taller de SageMaker Canvas. Se trata de un conjunto de datos sintético creado por Amazon.