Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparación de los datos
nota
Anteriormente, Amazon SageMaker Data Wrangler formaba parte de la experiencia SageMaker Studio Classic. Ahora, si se actualiza para usar la nueva experiencia de Studio, debe usar SageMaker Canvas para acceder a Data Wrangler y recibir las últimas actualizaciones de funciones. Si ha estado utilizando Data Wrangler en Studio Classic hasta ahora y quiere migrar a Data Wrangler en Canvas, es posible que tenga que conceder permisos adicionales para poder crear y usar una aplicación de Canvas. Para obtener más información, consulte (Opcional) Migre de Data Wrangler en Studio Classic a Canvas SageMaker .
Para obtener información sobre cómo migrar los flujos de datos desde Data Wrangler en Studio Classic, consulte. (Opcional) Migrar datos de Studio Classic a Studio
Utilice Amazon SageMaker Data Wrangler en Amazon SageMaker Canvas para preparar, caracterizar y analizar sus datos. Puede integrar un flujo de preparación de datos de Data Wrangler en sus flujos de trabajo de machine learning (ML) a fin de simplificar y agilizar el preprocesamiento de datos y la ingeniería de características sin apenas codificación. También puede añadir sus propios scripts y transformaciones de Python para personalizar flujos de trabajo.
-
Flujo de datos: cree un flujo de datos para definir una serie de pasos de preparación de datos para el ML. Puede usar un flujo para combinar conjuntos de datos de diferentes orígenes, identificar el número y los tipos de transformaciones que desea aplicar a los conjuntos de datos y definir un flujo de trabajo de preparación de datos que se pueda integrar en una canalización de ML.
-
Transformación: limpie y transforme su conjunto de datos mediante transformaciones estándar, como herramientas de formato para datos numéricos, vectoriales y de cadenas. Aporte características para sus datos mediante transformaciones, como la incrustación de texto y fecha/hora y la codificación categórica.
-
Genere información valiosa sobre los datos: compruebe automáticamente la calidad de los datos y detecte anomalías en los mismos con el informe Data Wrangler Data Quality and Insights Report.
-
Análisis: analice las características de su conjunto de datos en cualquier punto del flujo. Data Wrangler incluye herramientas integradas de visualización de datos, como diagramas de dispersión e histogramas; también dispone de herramientas para el análisis de datos, como el análisis de fuga de objetivos y el modelado rápido para comprender la correlación de características.
-
Exportación: exporte su flujo de trabajo de preparación de datos a una ubicación distinta. A continuación, se muestran algunos ejemplos de ubicaciones.
-
Bucket de Amazon Simple Storage Service (Amazon S3)
-
Amazon SageMaker Feature Store: almacene las funciones y sus datos en una tienda centralizada.
-
-
Automatice la preparación de datos: cree flujos de trabajo de aprendizaje automático a partir de su flujo de datos.
-
Amazon SageMaker Pipelines: cree flujos de trabajo que gestionen sus trabajos de preparación de SageMaker datos, formación de modelos e implementación de modelos.
-
Canalización de inferencia en serie: cree una canalización de inferencia en serie a partir de su flujo de datos. Úselo para hacer predicciones sobre nuevos datos.
-
Script de Python. Almacene los datos y sus transformaciones en un script de Python para sus flujos de trabajo personalizados.
-