Preparación e importación de datos masivos con Amazon SageMaker AI Data Wrangler - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparación e importación de datos masivos con Amazon SageMaker AI Data Wrangler

importante

Al usar Data Wrangler, incurre en costos de IA. SageMaker Para obtener una lista completa de cargos y precios, consulta la pestaña Data Wrangler de los precios de Amazon SageMaker AI. Para evitar incurrir en cargos adicionales, cuando haya terminado, cierre su instancia de Data Wrangler. Para obtener más información, consulte Apagar Data Wrangler.

Después de crear un grupo de conjuntos de datos, puede usar Amazon SageMaker AI Data Wrangler (Data Wrangler) para importar datos de más de 40 fuentes a un conjunto de datos de Amazon Personalize. Data Wrangler es una función de Amazon SageMaker AI Studio Classic que proporciona una end-to-end solución para importar, preparar, transformar y analizar datos. No se puede usar Data Wrangler para preparar e importar datos en un conjunto de datos de acciones ni en un conjunto de datos de interacciones de acción.

Cuando utiliza Data Wrangler para preparar e importar datos, emplea un flujo de datos. Un flujo de datos define una serie de pasos de preparación de datos mediante machine learning, empezando por la importación de datos. Cada vez que añade un paso a su flujo, Data Wrangler realiza una acción con sus datos, como transformarlos o generar una visualización.

Estos son algunos de los pasos que puede añadir a su flujo para preparar datos para Amazon Personalize:

  • Estadísticas: puede añadir pasos de información específicos de Amazon Personalize a su flujo. Esta información puede ayudarle a conocer sus datos y a saber qué medidas puede llevar a cabo para mejorarlos.

  • Visualizaciones: puede añadir pasos de visualización para generar gráficos, como histogramas y gráficos de dispersión. Los gráficos pueden ayudarle a detectar problemas en los datos, como valores atípicos o valores que faltan.

  • Transformaciones: puede utilizar los pasos de transformación específicos y generales de Amazon Personalize para asegurarse de que sus datos cumplen los requisitos de Amazon Personalize. La transformación de Amazon Personalize le ayuda a asignar sus columnas de datos a las columnas obligatorias en función del tipo de conjunto de datos de Amazon Personalize.

Si necesita salir de Data Wrangler antes de importar datos en Amazon Personalize, puede volver a donde los dejó eligiendo el mismo tipo de conjunto de datos al iniciar Data Wrangler desde la consola de Amazon Personalize. O bien, puede acceder a Data Wrangler directamente a través SageMaker de AI Studio Classic.

Recomendamos que importe los datos de Data Wrangler en Amazon Personalize de la siguiente manera. Los pasos de transformación, visualización y análisis son opcionales, repetibles y se pueden completar en cualquier orden.

  1. Configurar permisos: configure los permisos para las funciones de servicio Amazon Personalize y SageMaker AI. Y configure los permisos para sus usuarios.

  2. Inicie Data Wrangler en SageMaker AI Studio Classic desde la consola Amazon Personalize: utilice la consola Amazon Personalize para configurar un dominio de SageMaker IA e inicie Data Wrangler en SageMaker AI Studio Classic.

  3. Importar sus datos en Data Wrangler: importe datos de más de 40 orígenes en Data Wrangler. Las fuentes incluyen AWS servicios, como Amazon Redshift, Amazon o Amazon AthenaEMR, y terceros, como Snowflake o. DataBricks

  4. Transformar sus datos: utilice Data Wrangler para transformar sus datos y cumplir con los requisitos de Amazon Personalize.

  5. Visualizar y analizar sus datos: utilice Data Wrangler para visualizar sus datos y analizarlos mediante información específica de Amazon Personalize.

  6. Procese e importe datos a Amazon Personalize: utilice una libreta Jupyter clásica de SageMaker AI Studio para importar los datos procesados a Amazon Personalize.

Información adicional

Los siguientes recursos proporcionan información adicional sobre el uso de Amazon SageMaker AI Data Wrangler y Amazon Personalize.