Uso de Amazon SageMaker Feature Store en la consola - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de Amazon SageMaker Feature Store en la consola

importante

Las políticas de IAM personalizadas que permiten a Amazon SageMaker Studio o Amazon SageMaker Studio Classic crear SageMaker recursos de Amazon también deben conceder permisos para añadir etiquetas a esos recursos. El permiso para añadir etiquetas a los recursos es necesario porque Studio y Studio Classic etiquetan automáticamente todos los recursos que crean. Si una política de IAM permite a Studio y Studio Classic crear recursos, pero no permite el etiquetado, se pueden producir errores de tipo AccessDenied «» al intentar crear recursos. Para obtener más información, consulte Proporcione permisos para etiquetar los recursos de SageMaker IA.

AWS políticas gestionadas para Amazon SageMaker AIque otorgan permisos para crear SageMaker recursos ya incluyen permisos para añadir etiquetas al crear esos recursos.

Puedes usar Amazon SageMaker Feature Store en la consola para crear, ver, actualizar y monitorear tus grupos de características. En esta guía, la supervisión incluye la visualización de las ejecuciones y el linaje de las canalizaciones de los grupos de características. Esta guía proporciona instrucciones sobre cómo realizar estas tareas desde la consola.

Para ver ejemplos y recursos de Feature Store que utilizan Amazon SageMaker APIs y AWS SDK for Python (Boto3), consulteRecursos de Amazon SageMaker Feature Store.

Creación de un grupo de características desde la consola

El proceso de creación de un grupo de características consta de cuatro pasos:

  1. Ingresar la información del grupo de características.

  2. Ingresar las definiciones de características.

  3. Ingresar las características necesarias.

  4. Ingresar las etiquetas de los grupos de características.

Considere cuál de las siguientes opciones se adapta mejor a su caso de uso:

  • Cree un almacenamiento en línea, un almacenamiento sin conexión o ambos. Para obtener más información sobre las diferencias entre el almacenamiento sin conexión y en línea, consulte Conceptos del almacén de características.

  • Usa una AWS Key Management Service clave predeterminada o tu propia clave de KMS. La clave predeterminada es la clave de AWS KMS (SSE-KMS). Puede reducir los costes de las AWS KMS solicitudes configurando el uso de Amazon S3 Bucket Keys en el bucket Amazon S3 de la tienda offline. Debe haber habilitado la clave de bucket de Amazon S3 antes de utilizar el bucket para sus grupos de características. Para obtener más información sobre cómo reducir el costo con el uso de claves de bucket de Amazon S3, consulte Reducción del costo de SSE-KMS con las claves de bucket de Amazon S3.

    Puede usar la misma clave para el almacenamiento sin conexión y en línea, o tener una clave única para cada uno. Para obtener más información al respecto AWS KMS, consulte AWS Key Management Service.

  • Si crea un almacenamiento sin conexión:

    • Decida si quiere crear un bucket de Amazon S3 o utilizar uno existente. Si utiliza uno existente, debe conocer la URL del bucket de Amazon S3 o el nombre del bucket de Amazon S3 y el nombre del directorio del conjunto de datos, si corresponde.

    • Elija el nombre de recurso de Amazon (ARN) que desea utilizar para especificar el rol de IAM. Para obtener más información sobre cómo encontrar su rol y las políticas asociadas, consulte Adición de políticas al rol de IAM.

    • Decida si desea utilizar la opción AWS Glue (predeterminada) o Apache Iceberg formato de tabla. En la mayoría de los casos de uso, se utiliza el Apache Iceberg formato de tabla. Para obtener más información acerca de los formatos de tabla, consulte Uso del almacén de características con el SDK para Python (Boto3).

Puede usar la consola para ver el linaje de un grupo de características. Las instrucciones para utilizar el Almacén de características en la consola varían en función de si ha habilitado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico como experiencia predeterminada.

  1. Abra la consola de Studio siguiendo las instrucciones de Lanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para expandir la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. Elija Crear grupo de características.

  5. En Detalles del grupo de características, ingrese un nombre para el grupo de características.

  6. De forma opcional, ingrese una descripción del grupo de características.

  7. En Configuración de almacenamiento del grupo de características, elija un tipo de almacenamiento de la lista desplegable. Para obtener más información sobre las configuraciones de almacenamiento, consulte Configuraciones de almacenamiento del almacén de características.

  8. Si ha optado por habilitar el almacenamiento en línea:

    1. Si solo habilita el almacenamiento en línea, puede elegir un Tipo de almacenamiento en la lista desplegable. Para obtener más información sobre los tipos de almacenamiento del almacenamiento en línea, consulte Almacenamiento en línea.

    2. (Opcional) Aplique el Tiempo de vida (TTL) moviendo el conmutador a Activado y especificando el valor y la unidad de Duración del tiempo de vida. Esto actualizará la duración del TTL predeterminada para todos los registros que se agreguen al grupo de características una vez creado el grupo de características. Para obtener más información sobre TTL, consulte Duración del tiempo de vida (TTL) de los registros.

  9. Si ha optado por habilitar el almacenamiento sin conexión:

    1. En Nombre del bucket de Amazon S3, introduzca un nuevo nombre de bucket o una URL de bucket existente manualmente.

    2. En la lista desplegable Formato de tabla, elija el formato de la tabla. En la mayoría de los casos de uso, debe utilizar el Apache Iceberg formato de tabla. Para obtener más información acerca de los formatos de tabla, consulte Uso del almacén de características con el SDK para Python (Boto3).

    3. En ARN del rol de IAM, elija el ARN del rol de IAM que desee asociar a este grupo de características. Para obtener más información sobre cómo encontrar su rol y las políticas asociadas, consulte Adición de políticas al rol de IAM.

    4. Si ha elegido habilitar el almacenamiento sin conexión en formato de tabla y el formato de tabla AWS Glue (predeterminado), en Catálogo de datos, puede elegir una de las dos opciones siguientes:

      • Utilice los valores predeterminados para su AWS Glue Data Catalog.

      • Indique el nombre del catálogo de datos actual, el nombre de la tabla y el nombre de la base de datos para ampliar el AWS Glue Data Catalog existente.

  10. En la lista desplegable Clave de cifrado de almacenamiento en línea o Clave de cifrado de almacenamiento sin conexión, elija una de las siguientes opciones:

    • Uso AWS gestionado AWS KMS key (predeterminado)

    • Introduzca un AWS KMS key ARN e introduzca su AWS KMS clave ARN en la clave de cifrado de la tienda fuera de línea ARN. Para obtener más información AWS KMS, consulte el Servicio de administración de AWS claves.

  11. Si corresponde, tendrá la opción de elegir el modo de rendimiento, lo que afectará a la forma en que se le cobrará. En el Modo de rendimiento, elija un modo de la lista desplegable e introduzca las capacidades de lectura y escritura cuando estén disponibles. Para obtener más información sobre los modos de rendimiento, por ejemplo, cuándo se puede aplicar el modo y las unidades de capacidad, consulte Modos de rendimiento.

  12. Una vez que haya especificado toda la información requerida, aparecerá el botón Continuar. Elija Continuar.

  13. En Especificar definiciones de características, tiene dos opciones para proporcionar un esquema para sus características: un editor JSON o un editor de tablas.

    • Editor de JSON: en la pestaña JSON, introduzca o copie y pegue sus definiciones de características en el formato JSON.

    • Editor de tablas: en la pestaña Tabla, introduzca el nombre de la característica y elija el tipo de datos correspondiente para cada característica de su grupo de características. Elija + Agregar definiciones de características para incluir más características. Tenga en cuenta que no puede eliminar las definiciones de características de los grupos de características. Sin embargo, puede añadir y actualizar las definiciones de características una vez creado el grupo de características.

    Debe haber al menos dos características en un grupo de características que representen el identificador del registro y la hora del evento:

    • El Tipo de característica del registro puede ser una cadena, una fracción o un entero.

    • El Tipo de característica de la hora del evento debe ser una cadena o una fracción. Sin embargo, si ha elegido Iceberg en el formato de tabla, la hora del evento debe ser una cadena.

  14. Una vez incluidas todas las características, elija Continuar.

  15. En Seleccionar las características requeridas, debe especificar las características del identificador del registro y la hora del evento. Para ello, elija el nombre de la característica en las listas desplegables Nombre de la característica del identificador de registros y Nombre de la característica de hora del evento, respectivamente.

  16. Una vez que haya elegido las características del identificador de registro y la hora del evento, elija Continuar.

  17. (Opcional) Para añadir etiquetas para el grupo de características, seleccione Agregar nueva etiqueta. A continuación, introduzca una clave de etiqueta y el valor correspondiente en Clave y Valor, respectivamente.

  18. Elija Continuar.

  19. En Revisar el grupo de características, revise la información del grupo de características. Puede editar cualquier paso mediante el botón Editar correspondiente a ese paso. Esto le lleva al paso de edición correspondiente. Para volver al paso 5, elija Continuar hasta volver al paso 5.

  20. Una vez que haya finalizado la configuración de su grupo de características, elija Crear grupo de características.

    Si se produce un problema durante la configuración, se muestra un mensaje de alerta emergente en la parte inferior de la página con consejos para resolver el problema. Para volver a los pasos anteriores para solucionar los problemas, seleccione Editar en el paso en el que hay conflictos.

    Después de que el grupo de características se haya creado correctamente, se muestra un mensaje emergente verde en la parte inferior de la página. El nuevo grupo de características también aparece en su catálogo de grupos de características.

Visualización de los detalles del grupo de características desde la consola

Puede ver los detalles de los grupos de características cuando se haya creado correctamente un grupo de características en el Almacén de características.

Puedes usar la consola o la API de Amazon SageMaker Feature Store para ver los detalles de tu grupo de características. Las instrucciones para usar el Almacén de características a través de la consola dependen de si ha habilitado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico como experiencia predeterminada.

  1. Abra la consola de Studio siguiendo las instrucciones de Lanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para expandir la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver sus grupos de características, seleccione Mi cuenta. Para ver los grupos de características compartidos, seleccione Entre cuentas.

  5. En la pestaña del Catálogo de grupos de características, elija el nombre de su grupo de características de la lista. Se abrirá la página del grupo de características.

  6. En la pestaña Características, encontrará una lista de todas las características. Use el filtro para refinar la lista. Elija una característica para ver sus detalles.

  7. En la pestaña Detalles y en la subpestaña Información, puede revisar la información de los grupos de características. Esto incluye Última ejecución, Configuración del almacenamiento sin conexión, Configuración del almacenamiento en línea y mucho más.

  8. En la pestaña Detalles y en la subpestaña Etiquetas, puede revisar las etiquetas de los grupos de características. Elija Agregar nueva etiqueta para agregar una nueva etiqueta o Eliminar para eliminar una etiqueta.

  9. En la pestaña Ejecuciones de canalizaciones, puede ver las canalizaciones o ejecuciones de canalizaciones asociadas a su grupo de características.

  10. En la pestaña Linaje, puede ver el linaje de su grupo de características.

Actualización de un grupo de características desde la consola

Puede actualizar los detalles de los grupos de características una vez que se haya creado correctamente un grupo de características en el Almacén de características.

Puedes usar la consola o la API de Amazon SageMaker Feature Store para actualizar un grupo de características. Las instrucciones para usar el Almacén de características a través de la consola dependen de si ha habilitado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico como experiencia predeterminada.

  1. Abra la consola de Studio siguiendo las instrucciones de Lanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para expandir la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver sus grupos de características, seleccione Mi cuenta. Para ver los grupos de características compartidos, seleccione Entre cuentas.

  5. En la pestaña del Catálogo de grupos de características, busque y elija el nombre de su grupo de características de la lista. Se abrirá la página del grupo de características.

  6. Elija Actualizar grupo de características.

  7. (Opcional) Si corresponde, puede cambiar el modo de rendimiento, lo que afectará a la forma en que se le cobrará. En el Modo de rendimiento, elija un modo de la lista desplegable e introduzca las capacidades de lectura y escritura cuando estén disponibles. Para obtener más información sobre los modos de rendimiento, por ejemplo, cuándo se puede aplicar el modo y las unidades de capacidad, consulte Modos de rendimiento.

  8. De forma opcional, si el grupo de características usa el almacenamiento en línea, puede actualizar el Tiempo de vida (TTL) predeterminado. Si el TTL no está habilitado para el grupo de características, mueva el botón bajo Tiempo de vida (TTL) a Activado. Puede especificar el valor y la unidad del TTL en Duración del tiempo de vida. Esto actualizará la duración del TTL predeterminada para todos los registros que se agreguen al grupo de características una vez actualizado el grupo de características.

  9. De forma opcional, puede agregar definiciones de características al grupo de características, pero tenga en cuenta que no puede eliminar definiciones de características de los grupos de características. Para añadir una definición de característica, elija + Agregar definición de característica y, a continuación, especifique el nombre de la nueva definición de característica en la columna Nombre y seleccione el tipo de característica en la columna Tipo de característica.

  10. Elija Guardar cambios.

  11. Para confirmar los cambios, elija Confirmar.

Visualización de las ejecuciones de canalizaciones desde la consola

Puede ver la información más reciente sobre la ejecución de canalizaciones de una característica o grupo de características en Ejecuciones de canalizaciones. También puede obtener enlaces a canalizaciones, ejecuciones, código y otra información útil sobre la ejecución.

Puede utilizar la consola para ver las ejecuciones de canalizaciones. Las instrucciones para usar el Almacén de características a través de la consola dependen de si ha habilitado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico como experiencia predeterminada.

  1. Abra la consola de Studio siguiendo las instrucciones de Lanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para expandir la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver sus grupos de características, seleccione Mi cuenta. Para ver los grupos de características compartidos, seleccione Entre cuentas.

  5. Elija un grupo de características o una característica para ver sus ejecuciones de canalizaciones.

  6. Elija la pestaña Ejecuciones de canalizaciones.

  7. Busque una canalización en la lista desplegable Seleccionar una canalización.

  8. Puede ver los enlaces de la canalización, la ejecución y los detalles del código. También puede ver el propietario, el estado, la fecha y la duración de la ejecución.

Visualización del linaje desde la consola

Puede ver el linaje de un grupo de características. El linaje incluye la información sobre el código de ejecución del flujo de trabajo de procesamiento de características, los orígenes de datos que se utilizaron y la forma en que se incorporaron al grupo de características o a la característica.

Puede usar la consola para ver el linaje de un grupo de características. Las instrucciones para usar el Almacén de características a través de la consola dependen de si ha habilitado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico como experiencia predeterminada.

  1. Abra la consola de Studio siguiendo las instrucciones de Lanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para expandir la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver sus grupos de características, seleccione Mi cuenta. Para ver los grupos de características compartidos, seleccione Entre cuentas.

  5. Elija un grupo de características o una característica para ver los detalles de su linaje.

  6. Elija la pestaña Linaje.

  7. Elija un grupo de características o un nodo de canalización para ampliar el nodo. Contiene más información sobre un grupo de características o canalización.

  8. Puede acercar, alejar o volver a centrar el gráfico de linaje mediante los botones de la parte inferior izquierda de la pantalla.

  9. Puede desplazarse por el mapa del linaje si lo desea y arrastrar la pantalla. Para mover los mapas del linaje utilizando los nodos como punto focal, puede pulsar la tecla Tab o Mayús+Tab para cambiar de un nodo a otro.

  10. Si procede, puede navegar por el linaje en sentido ascendente (izquierda, anterior) o descendente (derecha, más reciente). Para ello, elija un nodo y, a continuación, elija Consultar linaje ascendente o Consultar linaje descendente.