Notas de la versión - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Notas de la versión

Data Wrangler se actualiza periódicamente con nuevas características y correcciones de errores. Para actualizar la versión de Data Wrangler que está utilizando en Studio Classic, siga las instrucciones que se indican en. Cierre y actualice las aplicaciones de Studio Classic

Notas de la versión

31/8/2023

Nueva funcionalidad:

Ahora puede crear un informe de información y calidad de los datos de todo su conjunto de datos. Para obtener más información, consulte Información sobre los datos y la calidad de los datos.

20/05/2023

Nueva funcionalidad:

Ahora puede importar sus datos desde Salesforce Data Cloud. Para obtener más información, consulte Importación de datos de Salesforce Data Cloud..

18 de abril de 2023

Nueva funcionalidad:

Ahora puede obtener sus datos en un formato que Amazon Personalize pueda interpretar. Para obtener más información, consulte Asignar columnas para Amazon Personalize.

1/3/2023

Nueva funcionalidad:

Ahora puedes usar Hive para importar tus datos de AmazonEMR. Para obtener más información, consulte Importar datos de Amazon EMR.

10/12/2022

Nueva funcionalidad:

Ahora puede exportar su flujo de Data Wrangler a un punto de conexión de inferencia. Para obtener más información, consulte Exportación a un punto de conexión de inferencia.

Nueva funcionalidad:

Ahora puede usar un widget de cuaderno interactivo para preparar los datos. Para obtener más información, consulte Utilice un widget interactivo de preparación de datos en un bloc de notas clásico de Amazon SageMaker Studio para obtener información valiosa sobre los datos.

Nueva funcionalidad:

Ahora puede importar datos desde plataformas SaaS. Para obtener más información, consulte Importación de datos de plataformas de software como servicio (SaaS).

10/12/2022

Nueva funcionalidad:

Ahora puede reutilizar los flujos de datos para diferentes conjuntos de datos. Para obtener más información, consulte Reutilización de flujos de datos para diferentes conjuntos de datos.

10/05/2022

Nueva funcionalidad:

Ahora puede usar el Análisis de componentes principales (PCA) como transformación. Para obtener más información, consulte Reducir la dimensionalidad dentro de un conjunto de datos.

5 de octubre de 2022

Nueva funcionalidad:

Ahora puede reajustar los parámetros del flujo de Data Wrangler. Para obtener más información, consulte Exportar.

10/03/2022

Nueva funcionalidad:

Ahora puede implementar modelos desde el flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos.

20/09/2022

Nueva funcionalidad:

Ahora puede establecer períodos de retención de datos en Athena. Para obtener más información, consulte Importación de datos de Athena.

9/06/2022

Nueva funcionalidad:

Ahora puede usar Amazon SageMaker Autopilot para entrenar un modelo directamente desde su flujo de Data Wrangler. Para obtener más información, consulte Entrenamiento automático de modelos en su flujo de datos.

6 de mayo de 2022

Nueva funcionalidad:

Ahora puede usar instancias m5 y r5 adicionales. Para obtener más información, consulte instancias.

27 de abril de 2022

Nuevas funcionalidades:

1/4/2022

Nueva funcionalidad:

Ahora puede usar Databricks como origen de datos. Para obtener más información, consulte Importa datos desde Databricks () JDBC.

2/2/2022

Nuevas funcionalidades:

  • Ahora puede exportar mediante los nodos de destino. Para obtener más información, consulte Exportar

  • Puede importar archivosORC. JSON Para obtener más información sobre los tipos de archivos, consulte Importación.

  • Data Wrangler ahora admite el uso de la SMOTE transformación. Para obtener más información, consulte Equilibrar los datos.

  • Data Wrangler ahora admite la codificación por similitud para datos categóricos. Para obtener más información, consulte Codificación por similitud.

  • Data Wrangler ahora admite el desanidamiento de datos. JSON Para obtener más información, consulte Datos no anidados JSON.

  • Data Wrangler ahora permite expandir los valores de una matriz en columnas diferentes. Para obtener más información, consulte Desglosar matriz.

  • Data Wrangler ahora le permite ponerse en contacto con el equipo de servicio si tiene problemas. Para obtener más información, consulte Solucionar problemas.

  • Data Wrangler admite la edición y eliminación de pasos del flujo de datos. Para obtener más información, consulte Eliminación de un paso del flujo de datos y Edición de un paso del flujo de Data Wrangler.

  • Ahora puede realizar transformaciones en varias columnas. Para obtener más información, consulte Datos de transformación.

  • Data Wrangler ahora admite el etiquetado de asignación de costos. Para obtener más información, consulte Uso de etiquetas de asignación de costes.

16/10/2021

Nueva funcionalidad:

Data Wrangler ahora es compatible con los grupos de trabajo de Athena. Para obtener más información, consulte Importación de datos de Athena.

6/10/2021

Nueva funcionalidad:

Data Wrangler ahora admite la transformación de datos de serie temporal. Para obtener más información, consulte Transformar series temporales.

15/7/2021

Nuevas funcionalidades:

  • Ahora se admite Snowflake y Data Wrangler. Puede utilizar Snowflake como origen de datos en Data Wrangler.

  • Se agregó soporte para el delimitador de campos personalizado en. CSV Ahora se admiten comas, dos puntos, punto y coma, barra vertical (|) y tabulador.

  • Ahora puede exportar resultados directamente a Amazon S3.

  • Se agregaron algunos analizadores de multicolinealidad nuevos: factores de inflación de la varianza, análisis de componentes principales y selección de características Lasso.

Mejoras:

  • Los gráficos de análisis ya no se pueden empaquetar con etiquetas superpuestas.

Correcciones de errores:

  • El codificador One-hot maneja la cadena vacía con fluidez.

  • Se corrigieron bloqueos que se producían cuando el nombre de una columna de un marco de datos contenía puntos.

26 de abril de 2021

Mejoras:

  • Se agregó compatibilidad con trabajos de procesamiento distribuido. Puede utilizar varias instancias al ejecutar un trabajo de procesamiento.

  • El trabajo de procesamiento de Data Wrangler ahora agrupa automáticamente las salidas pequeñas cuando el tamaño estimado de los resultados es inferior a 1 gigabyte.

  • Cuaderno de almacén de características: rendimiento mejorado de ingestión del almacén de características.

  • Los trabajos de procesamiento de Data Wrangler ahora usan 1.x como etiqueta contenedora autoritativa para futuras versiones.

Correcciones de errores:

  • Se corrigieron los problemas de renderización del histograma facetado.

  • Se corrigió Exportar a trabajo de procesamiento para admitir columnas de tipo vectorial.

  • Se corrigió el operador Extract using regex para que devuelva el primer grupo capturado si hay uno o más en la expresión regular o regex.

8/2/2021

Nuevas funcionalidades:

  • El flujo de Data Wrangler admite varias instancias.

  • Se actualizó el cuaderno de trabajo Exportar a Data Wrangler para usar SageMaker SDK la versión 2.20.0.

  • Se actualizó la exportación a Pipeline Notebook para usar la versión 2.20.0. SageMaker SDK

  • Se actualizó la exportación a Pipeline Notebook para añadir un ejemplo de XGBoost formación como paso opcional.

Mejoras:

  • Para mejorar el rendimiento, ya no se admite la importación de CSV archivos que contengan varias líneas en un solo campo.

Correcciones de errores:

  • Se corrigió el problema de inferencia de tipos en el modelo Quick.

  • Se corrigió el error de la métrica de sesgo en los informes de sesgo.

  • Se corrigió la transformación de texto para caracterizar para que funcione con columnas a las que les faltan valores.

  • Se corrigieron las visualizaciones integradas de histogramas y gráficos de dispersión para que funcionen con conjuntos de datos que contienen columnas tipo matriz.

  • La consulta de Athena ahora se vuelve a ejecutar si el ID de ejecución de la consulta ha vencido.