Notas de la versión

Data Wrangler se actualiza periódicamente con nuevas características y correcciones de errores. Para actualizar la versión de Data Wrangler que utiliza en Studio Classic, siga las instrucciones que aparecen en Cierre y actualice las aplicaciones clásicas de Amazon SageMaker Studio.

Notas de la versión

Notas de la versión
8/31/2023 Nueva funcionalidad: Ahora puede crear un informe de información y calidad de los datos de todo su conjunto de datos. Para obtener más información, consulte Información sobre los datos y la calidad de los datos. 5/20/2023 Nueva funcionalidad: Ahora puede importar sus datos desde Salesforce Data Cloud. Para obtener más información, consulte Importación de datos de Salesforce Data Cloud.. 4/18/2023 Nueva funcionalidad: Ahora puede obtener sus datos en un formato que Amazon Personalize pueda interpretar. Para obtener más información, consulte Asignar columnas para Amazon Personalize. 3/1/2023 Nueva funcionalidad: Ahora puede usar Hive para importar sus datos de Amazon EMR. Para obtener más información, consulte Importación de datos de Amazon EMR. 12/10/2022 Nueva funcionalidad: Ahora puede exportar su flujo de Data Wrangler a un punto de conexión de inferencia. Para obtener más información, consulte Exportación a un punto de conexión de inferencia. Nueva funcionalidad: Ahora puede usar un widget de cuaderno interactivo para preparar los datos. Para obtener más información, consulte Utilice un widget interactivo de preparación de datos en un bloc de notas clásico de Amazon SageMaker Studio para obtener información valiosa sobre los datos. Nueva funcionalidad: Ahora puede importar datos desde plataformas SaaS. Para obtener más información, consulte Importación de datos de plataformas de software como servicio (SaaS). 10/12/2022 Nueva funcionalidad: Ahora puede reutilizar los flujos de datos para diferentes conjuntos de datos. Para obtener más información, consulte Reutilización de flujos de datos para diferentes conjuntos de datos. 10/05/2022 Nueva funcionalidad: Ahora puede usar el análisis de componentes principales (PCA) como transformación. Para obtener más información, consulte Reducir la dimensionalidad dentro de un conjunto de datos. 10/05/2022 Nueva funcionalidad: Ahora puede reajustar los parámetros del flujo de Data Wrangler. Para obtener más información, consulte Exportación. 10/03/2022 Nueva funcionalidad: Ahora puede implementar modelos desde el flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos. 9/20/2022 Nueva funcionalidad: Ahora puede establecer períodos de retención de datos en Athena. Para obtener más información, consulte Importación de datos de Athena. 6/9/2022 Nueva funcionalidad: Ahora puede usar Amazon SageMaker Autopilot para entrenar un modelo directamente desde su flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos. 5/6/2022 Nueva funcionalidad: Ahora puede usar instancias m5 y r5 adicionales. Para obtener más información, consulte instancias. 4/27/2022 Nuevas funcionalidades: Ahora puede obtener un informe de calidad de datos. Para obtener más información, consulte Información sobre los datos y la calidad de los datos Ahora puede realizar muestreos aleatorios y muestreos estratificados. Para obtener más información, consulte Muestreo. 4/1/2022 Nueva funcionalidad: Ahora puede usar Databricks como origen de datos. Para obtener más información, consulte Importación de datos de Databricks (JDBC). 2/2/2022 Nuevas funcionalidades: Ahora puede exportar mediante los nodos de destino. Para obtener más información, consulte Exportación Puede importar archivos ORC y JSON. Para obtener más información sobre los tipos de archivos, consulte Importación. Data Wrangler ahora admite el uso de la transformación SMOTE. Para obtener más información, consulte Equilibrar los datos. Data Wrangler ahora admite la codificación por similitud para datos categóricos. Para obtener más información, consulte Codificación por similitud. Data Wrangler ahora admite el desanidamiento de datos JSON. Para obtener más información, consulte Datos JSON de Unnest. Data Wrangler ahora permite expandir los valores de una matriz en columnas diferentes. Para obtener más información, consulte Desglosar matriz. Data Wrangler ahora le permite ponerse en contacto con el equipo de servicio si tiene problemas. Para obtener más información, consulte Solucionar problemas. Data Wrangler admite la edición y eliminación de pasos del flujo de datos. Para obtener más información, consulte Eliminación de un paso del flujo de datos y Edición de un paso del flujo de Data Wrangler. Ahora puede realizar transformaciones en varias columnas. Para obtener más información, consulte Datos de transformación. Data Wrangler ahora admite el etiquetado de asignación de costos. Para obtener más información, consulte Uso de etiquetas de asignación de costes. 10/16/2021 Nueva funcionalidad: Data Wrangler ahora es compatible con los grupos de trabajo de Athena. Para obtener más información, consulte Importación de datos de Athena. 10/6/2021 Nueva funcionalidad: Data Wrangler ahora admite la transformación de datos de serie temporal. Para obtener más información, consulte Transformar series temporales. 7/15/2021 Nuevas funcionalidades: Ahora se admite Snowflake y Data Wrangler. Puede utilizar Snowflake como origen de datos en Data Wrangler. Se agregó compatibilidad con el delimitador de campos personalizado en CSV. Ahora se admiten comas, dos puntos, punto y coma, barra vertical (\|) y tabulador. Ahora puede exportar resultados directamente a Amazon S3. Se agregaron algunos analizadores de multicolinealidad nuevos: factores de inflación de la varianza, análisis de componentes principales y selección de características Lasso. Mejoras: Los gráficos de análisis ya no se pueden empaquetar con etiquetas superpuestas. Correcciones de errores: One-hot el codificador maneja la cadena vacía con elegancia. Se corrigieron bloqueos que se producían cuando el nombre de una columna de un marco de datos contenía puntos. 4/26/2021 Mejoras: Se agregó compatibilidad con trabajos de procesamiento distribuido. Puede utilizar varias instancias al ejecutar un trabajo de procesamiento. El trabajo de procesamiento de Data Wrangler ahora agrupa automáticamente las salidas pequeñas cuando el tamaño estimado de los resultados es inferior a 1 gigabyte. Cuaderno de almacén de características: rendimiento mejorado de ingestión del almacén de características. Los trabajos de procesamiento de Data Wrangler ahora usan 1.x como etiqueta contenedora autoritativa para futuras versiones. Correcciones de errores: Se corrigieron los problemas de renderización del histograma facetado. Se corrigió Exportar a trabajo de procesamiento para admitir columnas de tipo vectorial. Se corrigió el operador `Extract using regex` para que devuelva el primer grupo capturado si hay uno o más en la expresión regular o regex. 2/8/2021 Nuevas funcionalidades: El flujo de Data Wrangler admite varias instancias. Se actualizó el cuaderno de trabajo Export to Data Wrangler para usar el SageMaker SDK 2.20.0. Se actualizó la exportación a Pipeline Notebook para usar el SDK 2.20.0. SageMaker Se actualizó Exportar a cuaderno de canalización para añadir un ejemplo de entrenamiento de XGBoost como paso opcional. Mejoras: Para mejorar el rendimiento, ya no se admite la importación de archivos CSV que contengan varias líneas en un solo campo. Correcciones de errores: Se corrigió el problema de inferencia de tipos en el modelo Quick. Se corrigió el error de la métrica de sesgo en los informes de sesgo. Se corrigió la transformación de texto para caracterizar para que funcione con columnas a las que les faltan valores. Se corrigieron las visualizaciones integradas de histogramas y gráficos de dispersión para que funcionen con conjuntos de datos que contienen columnas tipo matriz. La consulta de Athena ahora se vuelve a ejecutar si el ID de ejecución de la consulta ha vencido.

8/31/2023

Nueva funcionalidad:

Ahora puede crear un informe de información y calidad de los datos de todo su conjunto de datos. Para obtener más información, consulte Información sobre los datos y la calidad de los datos.

5/20/2023

Nueva funcionalidad:

Ahora puede importar sus datos desde Salesforce Data Cloud. Para obtener más información, consulte Importación de datos de Salesforce Data Cloud..

4/18/2023

Nueva funcionalidad:

Ahora puede obtener sus datos en un formato que Amazon Personalize pueda interpretar. Para obtener más información, consulte Asignar columnas para Amazon Personalize.

3/1/2023

Nueva funcionalidad:

Ahora puede usar Hive para importar sus datos de Amazon EMR. Para obtener más información, consulte Importación de datos de Amazon EMR.

12/10/2022

Nueva funcionalidad:

Ahora puede exportar su flujo de Data Wrangler a un punto de conexión de inferencia. Para obtener más información, consulte Exportación a un punto de conexión de inferencia.

Nueva funcionalidad:

Ahora puede usar un widget de cuaderno interactivo para preparar los datos. Para obtener más información, consulte Utilice un widget interactivo de preparación de datos en un bloc de notas clásico de Amazon SageMaker Studio para obtener información valiosa sobre los datos.

Nueva funcionalidad:

Ahora puede importar datos desde plataformas SaaS. Para obtener más información, consulte Importación de datos de plataformas de software como servicio (SaaS).

10/12/2022

Nueva funcionalidad:

Ahora puede reutilizar los flujos de datos para diferentes conjuntos de datos. Para obtener más información, consulte Reutilización de flujos de datos para diferentes conjuntos de datos.

10/05/2022

Nueva funcionalidad:

Ahora puede usar el análisis de componentes principales (PCA) como transformación. Para obtener más información, consulte Reducir la dimensionalidad dentro de un conjunto de datos.

10/05/2022

Nueva funcionalidad:

Ahora puede reajustar los parámetros del flujo de Data Wrangler. Para obtener más información, consulte Exportación.

10/03/2022

Nueva funcionalidad:

Ahora puede implementar modelos desde el flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos.

9/20/2022

Nueva funcionalidad:

Ahora puede establecer períodos de retención de datos en Athena. Para obtener más información, consulte Importación de datos de Athena.

6/9/2022

Nueva funcionalidad:

Ahora puede usar Amazon SageMaker Autopilot para entrenar un modelo directamente desde su flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos.

5/6/2022

Nueva funcionalidad:

Ahora puede usar instancias m5 y r5 adicionales. Para obtener más información, consulte instancias.

4/27/2022

Nuevas funcionalidades:

Ahora puede obtener un informe de calidad de datos. Para obtener más información, consulte Información sobre los datos y la calidad de los datos
Ahora puede realizar muestreos aleatorios y muestreos estratificados. Para obtener más información, consulte Muestreo.

4/1/2022

Nueva funcionalidad:

Ahora puede usar Databricks como origen de datos. Para obtener más información, consulte Importación de datos de Databricks (JDBC).

2/2/2022

Nuevas funcionalidades:

Ahora puede exportar mediante los nodos de destino. Para obtener más información, consulte Exportación
Puede importar archivos ORC y JSON. Para obtener más información sobre los tipos de archivos, consulte Importación.
Data Wrangler ahora admite el uso de la transformación SMOTE. Para obtener más información, consulte Equilibrar los datos.
Data Wrangler ahora admite la codificación por similitud para datos categóricos. Para obtener más información, consulte Codificación por similitud.
Data Wrangler ahora admite el desanidamiento de datos JSON. Para obtener más información, consulte Datos JSON de Unnest.
Data Wrangler ahora permite expandir los valores de una matriz en columnas diferentes. Para obtener más información, consulte Desglosar matriz.
Data Wrangler ahora le permite ponerse en contacto con el equipo de servicio si tiene problemas. Para obtener más información, consulte Solucionar problemas.
Data Wrangler admite la edición y eliminación de pasos del flujo de datos. Para obtener más información, consulte Eliminación de un paso del flujo de datos y Edición de un paso del flujo de Data Wrangler.
Ahora puede realizar transformaciones en varias columnas. Para obtener más información, consulte Datos de transformación.
Data Wrangler ahora admite el etiquetado de asignación de costos. Para obtener más información, consulte Uso de etiquetas de asignación de costes.

10/16/2021

Nueva funcionalidad:

Data Wrangler ahora es compatible con los grupos de trabajo de Athena. Para obtener más información, consulte Importación de datos de Athena.

10/6/2021

Nueva funcionalidad:

Data Wrangler ahora admite la transformación de datos de serie temporal. Para obtener más información, consulte Transformar series temporales.

7/15/2021

Nuevas funcionalidades:

Ahora se admite Snowflake y Data Wrangler. Puede utilizar Snowflake como origen de datos en Data Wrangler.
Se agregó compatibilidad con el delimitador de campos personalizado en CSV. Ahora se admiten comas, dos puntos, punto y coma, barra vertical (|) y tabulador.
Ahora puede exportar resultados directamente a Amazon S3.
Se agregaron algunos analizadores de multicolinealidad nuevos: factores de inflación de la varianza, análisis de componentes principales y selección de características Lasso.

Mejoras:

Los gráficos de análisis ya no se pueden empaquetar con etiquetas superpuestas.

Correcciones de errores:

One-hot el codificador maneja la cadena vacía con elegancia.
Se corrigieron bloqueos que se producían cuando el nombre de una columna de un marco de datos contenía puntos.

4/26/2021

Mejoras:

Se agregó compatibilidad con trabajos de procesamiento distribuido. Puede utilizar varias instancias al ejecutar un trabajo de procesamiento.
El trabajo de procesamiento de Data Wrangler ahora agrupa automáticamente las salidas pequeñas cuando el tamaño estimado de los resultados es inferior a 1 gigabyte.
Cuaderno de almacén de características: rendimiento mejorado de ingestión del almacén de características.
Los trabajos de procesamiento de Data Wrangler ahora usan 1.x como etiqueta contenedora autoritativa para futuras versiones.

Correcciones de errores:

Se corrigieron los problemas de renderización del histograma facetado.
Se corrigió Exportar a trabajo de procesamiento para admitir columnas de tipo vectorial.
Se corrigió el operador Extract using regex para que devuelva el primer grupo capturado si hay uno o más en la expresión regular o regex.

2/8/2021

Nuevas funcionalidades:

El flujo de Data Wrangler admite varias instancias.
Se actualizó el cuaderno de trabajo Export to Data Wrangler para usar el SageMaker SDK 2.20.0.
Se actualizó la exportación a Pipeline Notebook para usar el SDK 2.20.0. SageMaker
Se actualizó Exportar a cuaderno de canalización para añadir un ejemplo de entrenamiento de XGBoost como paso opcional.

Mejoras:

Para mejorar el rendimiento, ya no se admite la importación de archivos CSV que contengan varias líneas en un solo campo.

Correcciones de errores:

Se corrigió el problema de inferencia de tipos en el modelo Quick.
Se corrigió el error de la métrica de sesgo en los informes de sesgo.
Se corrigió la transformación de texto para caracterizar para que funcione con columnas a las que les faltan valores.
Se corrigieron las visualizaciones integradas de histogramas y gráficos de dispersión para que funcionen con conjuntos de datos que contienen columnas tipo matriz.
La consulta de Athena ahora se vuelve a ejecutar si el ID de ejecución de la consulta ha vencido.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Seguridad y permisos

Solucionar problemas