Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Transformación de datos
Para transformar datos en Data Wrangler, añada un paso de transformación a su flujo de datos. Data Wrangler incluye más de 300 transformaciones que puede usar para preparar sus datos, incluida una transformación de Asignar columnas para Amazon Personalize. Además, puede usar las transformaciones generales de Data Wrangler para corregir problemas como valores atípicos, problemas de tipo y valores que faltan.
Cuando termine de transformar sus datos, podrá analizarlos con Data Wrangler. O bien, si ha terminado de preparar sus datos en Data Wrangler, puede procesarlos e importarlos en Amazon Personalize. Para obtener más información acerca del análisis de tablas, consulte Generación de visualizaciones y análisis de datos. Para obtener información sobre el procesamiento y la importación de datos, consulte Procesamiento de los datos y su importación en Amazon Personalize.
Asignación de columnas para Amazon Personalize
Para transformar sus datos de manera que cumplan con los requisitos de Amazon Personalize, añada la transformación de Asignar columnas para Amazon Personalize y asigne las columnas a los campos obligatorios y opcionales para Amazon Personalize.
Para usar la transformación de Asignar columnas para Amazon Personalize
-
Elija + para su última transformación y Agregar transformación. Si no ha agregado ninguna transformación, elija el signo + para la transformación de Tipos de datos. Data Wrangler añade esta transformación automáticamente a su flujo.
-
Seleccione Agregar paso.
-
Elija Transformaciones para Amazon Personalize. La transformación de Asignar columnas para Amazon Personalize está seleccionada de manera predeterminada.
-
Utilice los campos de transformación para asignar sus datos a los atributos requeridos de Amazon Personalize.
-
Elija el tipo de conjunto de datos que coincida con sus datos (interacciones, elementos o usuarios).
-
Elige tu dominio (ECOMMERCE, VIDEO _ON_ DEMAND o personalizado). El dominio que elija debe coincidir con el dominio que especificó al crear el grupo de conjuntos de datos.
-
Elija las columnas que coincidan con los campos obligatorios y opcionales de Amazon Personalize. Por ejemplo, para la columna Item_ID, elija la columna de sus datos que almacena la información de identificación única de cada uno de sus elementos.
Cada campo de columna se filtra por tipo de datos. Solo están disponibles las columnas de sus datos que cumplan los requisitos de tipo de datos de Amazon Personalize. Si sus datos no son del tipo requerido, puede usar la transformación de Data Wrangler de Analizar valor como tipo para convertirlos.
-
Transformaciones generales de Data Wrangler
Las siguientes transformaciones generales de Data Wrangler pueden ayudarle a preparar los datos para Amazon Personalize:
-
Conversión de tipos de datos: si su campo no aparece como una opción posible en la transformación de Asignar columnas para Amazon Personalize, es posible que necesite convertir su tipo de datos. La transformación de Data Wrangler Analizar valor como tipo puede ayudarle a convertir sus datos. O puede usar la transformación de Tipos de datos que Data Wrangler agrega de forma predeterminada cuando crea un flujo. Para usar esta transformación, elija el tipo de datos en las listas desplegables de Tipo, Vista previa y, a continuación, Actualizar.
Para obtener información sobre los tipos de datos requeridos para los campos, consulte la sección correspondiente al tipo de dominio y conjunto de datos en Creación de archivos JSON de esquema para los esquemas de Amazon Personalize.
-
Gestión de valores faltantes y valores atípicos: si genera información sobre valores que faltan o valores atípicos, puede utilizar las transformaciones de Data Wrangler Gestionar valores atípicos y Gestionar valores que faltan para resolver estos problemas.
-
Transformaciones personalizadas: con Data Wrangler, puede crear sus propias transformaciones con Python (función definida por el usuario) PySpark, pandas o (). PySpark SQL Puede usar una transformación personalizada para realizar tareas como eliminar columnas duplicadas o agruparlas por columnas. Para obtener más información, consulte Transformaciones personalizadas en la Guía para desarrolladores de Amazon SageMaker AI.