Preparación e importación de datos con Amazon SageMaker Data Wrangler - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparación e importación de datos con Amazon SageMaker Data Wrangler

importante

Al usar Data Wrangler, incurre en costos. SageMaker Para obtener una lista completa de cargos y precios, consulta la pestaña Data Wrangler de los precios de Amazon SageMaker . Para evitar incurrir en cargos adicionales, cuando haya terminado, cierre su instancia de Data Wrangler. Para obtener más información, consulte Apagar Data Wrangler.

Después de crear un grupo de conjuntos de datos, puede usar Amazon SageMaker Data Wrangler (Data Wrangler) para importar datos de más de 40 fuentes a un conjunto de datos de Amazon Personalize. Data Wrangler es una función de Amazon SageMaker Studio Classic que proporciona una end-to-end solución para importar, preparar, transformar y analizar datos. No se puede usar Data Wrangler para preparar e importar datos en un conjunto de datos de acciones ni en un conjunto de datos de interacciones de acción.

Cuando utiliza Data Wrangler para preparar e importar datos, emplea un flujo de datos. Un flujo de datos define una serie de pasos de preparación de datos mediante machine learning, empezando por la importación de datos. Cada vez que añade un paso a su flujo, Data Wrangler realiza una acción con sus datos, como transformarlos o generar una visualización.

Estos son algunos de los pasos que puede añadir a su flujo para preparar datos para Amazon Personalize:

  • Estadísticas: puede añadir pasos de información específicos de Amazon Personalize a su flujo. Esta información puede ayudarle a conocer sus datos y a saber qué medidas puede llevar a cabo para mejorarlos.

  • Visualizaciones: puede añadir pasos de visualización para generar gráficos, como histogramas y gráficos de dispersión. Los gráficos pueden ayudarle a detectar problemas en los datos, como valores atípicos o valores que faltan.

  • Transformaciones: puede utilizar los pasos de transformación específicos y generales de Amazon Personalize para asegurarse de que sus datos cumplen los requisitos de Amazon Personalize. La transformación de Amazon Personalize le ayuda a asignar sus columnas de datos a las columnas obligatorias en función del tipo de conjunto de datos de Amazon Personalize.

Si necesita salir de Data Wrangler antes de importar datos en Amazon Personalize, puede volver a donde los dejó eligiendo el mismo tipo de conjunto de datos al iniciar Data Wrangler desde la consola de Amazon Personalize. O bien, puede acceder a Data Wrangler directamente a través de Studio Classic. SageMaker

Recomendamos que importe los datos de Data Wrangler en Amazon Personalize de la siguiente manera. Los pasos de transformación, visualización y análisis son opcionales, repetibles y se pueden completar en cualquier orden.

  1. Configurar permisos: configura los permisos para Amazon Personalize y las funciones SageMaker de servicio. Y configure los permisos para sus usuarios.

  2. Inicie Data Wrangler en SageMaker Studio Classic desde la consola Amazon Personalize: utilice la consola Amazon Personalize para configurar un SageMaker dominio e inicie Data Wrangler en Studio Classic. SageMaker

  3. Importar sus datos en Data Wrangler: importe datos de más de 40 orígenes en Data Wrangler. Las fuentes incluyen AWS servicios, como Amazon Redshift, Amazon o Amazon AthenaEMR, y terceros, como Snowflake o. DataBricks

  4. Transformar sus datos: utilice Data Wrangler para transformar sus datos y cumplir con los requisitos de Amazon Personalize.

  5. Visualizar y analizar sus datos: utilice Data Wrangler para visualizar sus datos y analizarlos mediante información específica de Amazon Personalize.

  6. Procese e importe datos a Amazon Personalize: utilice una libreta Jupyter de SageMaker Studio Classic para importar los datos procesados a Amazon Personalize.

Información adicional

Los siguientes recursos proporcionan información adicional sobre el uso de Amazon SageMaker Data Wrangler y Amazon Personalize.