Uso de Amazon SageMaker Feature Store en la consola - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de Amazon SageMaker Feature Store en la consola

importante

IAMLas políticas personalizadas que permiten a Amazon SageMaker Studio o Amazon SageMaker Studio Classic crear SageMaker recursos de Amazon también deben conceder permisos para añadir etiquetas a esos recursos. El permiso para añadir etiquetas a los recursos es obligatorio porque Studio y Studio Classic etiquetan automáticamente los recursos que crean. Si una IAM política permite a Studio y Studio Classic crear recursos, pero no permite el etiquetado, se pueden producir errores AccessDenied «» al intentar crear recursos. Para obtener más información, consulte Proporciona permisos para etiquetar SageMaker los recursos.

AWS Políticas gestionadas para Amazon SageMakerque otorgan permisos para crear SageMaker recursos ya incluyen permisos para añadir etiquetas al crear esos recursos.

Puedes usar Amazon SageMaker Feature Store en la consola para crear, ver, actualizar y monitorear tus grupos de características. En esta guía, la supervisión incluye la visualización de las ejecuciones en proceso y el linaje de los grupos de características. Esta guía proporciona instrucciones sobre cómo realizar estas tareas desde la consola.

Para ver ejemplos y recursos de Feature Store que utilizan Amazon SageMaker APIs y AWS SDK for Python (Boto3), consulteRecursos de Amazon SageMaker Feature Store.

Cree un grupo de características desde la consola

El proceso de creación de un grupo de características consta de cuatro pasos:

  1. Ingresar la información del grupo de características.

  2. Ingresar las definiciones de características.

  3. Ingresar las características necesarias.

  4. Ingresar las etiquetas de los grupos de características.

Considera cuál de las siguientes opciones se adapta a tu caso de uso:

  • Cree un almacenamiento en línea, un almacenamiento sin conexión o ambos. Para obtener más información sobre las diferencias entre las tiendas online y offline, consulteConceptos del almacén de características.

  • Utilice una AWS Key Management Service clave predeterminada o la suya propiaKMS. La clave predeterminada es AWS KMS la tecla (SSE-KMS). Puede reducir los costes de las AWS KMS solicitudes configurando el uso de Amazon S3 Bucket Keys en el bucket Amazon S3 de la tienda offline. La clave de bucket de Amazon S3 debe estar habilitada antes de utilizar el bucket para sus grupos de características. Para obtener más información sobre cómo reducir el coste mediante el uso de las claves de bucket de Amazon S3, consulte Reducir el coste deSSE... KMS con las claves de bucket de Amazon S3.

    Puede usar la misma clave para el almacenamiento sin conexión y en línea, o tener una clave única para cada uno. Para obtener más información al respecto AWS KMS, consulte AWS Key Management Service.

  • Si crea un almacenamiento sin conexión:

    • Decida si quiere crear un bucket de Amazon S3 o utilizar uno existente. Si utiliza uno existente, debe conocer el bucket de Amazon S3 URL o el nombre del bucket de Amazon S3 y el nombre del directorio del conjunto de datos, si corresponde.

    • Elija qué nombre de recurso de Amazon (ARN) desea utilizar para especificar el IAM rol. Para obtener más información sobre cómo encontrar su función y las políticas asociadas, consulteAñadir políticas a su IAM función.

    • Decida si desea utilizar la opción AWS Glue (predeterminada) o Apache Iceberg formato de tabla. En la mayoría de los casos de uso, se utiliza el Apache Iceberg formato de tabla. Para obtener más información sobre los formatos de tabla, consulteUtilice Feature Store con SDK Python (Boto3).

Puede utilizar la consola para ver el linaje de un grupo de características. Las instrucciones para usar Feature Store en la consola varían en función de si está habilitada Amazon SageMaker Studio o Amazon SageMaker Studio Clásico es la experiencia predeterminada.

  1. Abre la consola de Studio siguiendo las instrucciones que se indican enLanza Amazon SageMaker Studio.

  2. Selecciona Datos en el panel de navegación izquierdo para ampliar la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. Elija Crear grupo de características.

  5. En Detalles del grupo de características, ingrese un nombre para el grupo de características.

  6. De forma opcional, ingrese una descripción del grupo de características.

  7. En Configuración de almacenamiento de grupos de funciones, elija una configuración de almacenamiento de la lista desplegable. Para obtener información sobre las configuraciones de almacenamiento, consulteConfiguraciones de almacenamiento del almacén de características.

  8. Si ha elegido habilitar el almacenamiento en línea:

    1. Si solo habilitas el almacenamiento online, puedes elegir un tipo de almacenamiento en la lista desplegable. Para obtener información sobre los tipos de almacenamiento de las tiendas en línea, consulteAlmacenamiento en línea.

    2. (Opcional) Aplique Time to Live (TTL) activando el interruptor y especificando el valor y la unidad de duración del tiempo de vida. Esto actualizará la TTL duración predeterminada de todos los registros agregados al grupo de entidades una vez creado el grupo de entidades. Para obtener más información al respectoTTL, consulteTiempo de vida (TTL) duración de los registros.

  9. Si ha elegido habilitar el almacenamiento sin conexión:

    1. En el nombre del bucket de Amazon S3, introduzca un nuevo nombre de bucket o introduzca un bucket URL existente manualmente.

    2. En la lista desplegable Formato de tabla, elija el formato de la tabla. En la mayoría de los casos de uso, debe usar el Apache Iceberg formato de tabla. Para obtener más información sobre los formatos de tabla, consulteUtilice Feature Store con SDK Python (Boto3).

    3. En IAMrol ARN, elija el IAM rol ARN que desee asociar a este grupo de funciones. Para obtener más información sobre cómo encontrar su función y las políticas asociadas, consulteAñadir políticas a su IAM función.

    4. Si ha elegido habilitar el formato de tabla de almacenamiento sin conexión y el formato de tabla AWS Glue (predeterminado), en Catálogo de datos, puede elegir una de las dos opciones siguientes:

      • Utilice los valores predeterminados para su AWS Glue Data Catalog.

      • Proporcione el nombre del catálogo de datos actual, el nombre de la tabla y el nombre de la base de datos para ampliar el existente AWS Glue Data Catalog.

  10. En la lista desplegable Clave de cifrado de tienda online o Clave de cifrado de tienda offline, elija una de las siguientes opciones:

    • Uso AWS gestionado AWS KMS key (predeterminado)

    • Introduzca una AWS KMS key ARN e introduzca su AWS KMS clave en la clave ARN de cifrado de la tienda fuera de líneaARN. Para obtener más información AWS KMS, consulte el Servicio de administración de AWS claves.

  11. Si corresponde, tendrá la opción de elegir el modo de procesamiento, lo que afectará a la forma en que se le cobrarán. En el modo de rendimiento, elija un modo de la lista desplegable e introduzca las capacidades de lectura y escritura cuando estén disponibles. Para obtener información sobre los modos de rendimiento, por ejemplo, cuándo se puede aplicar el modo y las unidades de capacidad, consulte. Modos de rendimiento

  12. Después de especificar toda la información requerida, aparecerá el botón Continuar. Elija Continuar.

  13. En Especificar las definiciones de elementos, tiene dos opciones para proporcionar un esquema para sus elementos: un JSON editor o un editor de tablas.

    • JSONeditor: en la JSONpestaña, introduzca o copie y pegue las definiciones de entidades en el JSON formato.

    • Editor de tablas: en la pestaña Tabla, introduzca el nombre de la entidad y elija el tipo de datos correspondiente para cada entidad de su grupo de entidades. Elija + Agregar definiciones de características para incluir más características. Tenga en cuenta que no puede eliminar las definiciones de entidades de sus grupos de entidades. Sin embargo, puede añadir y actualizar las definiciones de entidades una vez creado el grupo de entidades.

    Debe haber al menos dos entidades en un grupo de entidades que representen el identificador del registro y la hora del evento:

    • El tipo de entidad de registro puede ser una cadena, una fracción o una integral.

    • El tipo de entidad de la hora del evento debe ser una cadena o una fracción. Sin embargo, si ha elegido Iceberg en el formato de tabla, la hora del evento debe ser una cadena.

  14. Una vez incluidas todas las funciones, elija Continuar.

  15. En Seleccione las funciones requeridas, debe especificar el identificador del registro y las características de la hora del evento. Para ello, elija el nombre de la función en las listas desplegables Nombre de función del identificador de registro y Nombre de función de hora del evento, respectivamente.

  16. Después de elegir el identificador de registro y las funciones de hora del evento, elija Continuar.

  17. (Opcional) Para añadir etiquetas al grupo de entidades, elija Añadir nueva etiqueta. A continuación, introduzca una clave de etiqueta y el valor correspondiente en Clave y Valor, respectivamente.

  18. Elija Continuar.

  19. En Revisar el grupo de características, revise la información del grupo de características. Para editar cualquier paso, pulse el botón Editar que corresponda a ese paso. Esto le lleva al paso de edición correspondiente. Para volver al paso 5, elija Continuar hasta volver al paso 5.

  20. Una vez finalizada la configuración del grupo de entidades, elija Crear grupo de entidades.

    Si se produce un problema durante la configuración, aparece un mensaje de alerta emergente en la parte inferior de la página con consejos para resolver el problema. Para volver a los pasos anteriores para solucionar los problemas, selecciona Editar en el paso con conflictos.

    Cuando el grupo de funciones se haya creado correctamente, aparecerá un mensaje emergente verde en la parte inferior de la página. El nuevo grupo de entidades también aparece en su catálogo de grupos de entidades.

Vea los detalles del grupo de características desde la consola

Puede ver los detalles de sus grupos de características después de que un grupo de características se haya creado correctamente en el Feature Store.

Puedes usar la consola o la Amazon SageMaker Feature Store API para ver los detalles de tu grupo de características. Las instrucciones para usar Feature Store a través de la consola dependen de si la has activado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico si es tu experiencia predeterminada.

  1. Abre la consola de Studio siguiendo las instrucciones que se indican enLanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para ampliar la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver tus grupos de funciones, selecciona Mi cuenta. Para ver los grupos de funciones compartidos, selecciona Cuenta cruzada.

  5. En la pestaña del Catálogo de grupos de características, elija el nombre de su grupo de características de la lista. Se abrirá la página del grupo de características.

  6. En la pestaña Características, encontrará una lista de todas las características. Use el filtro para refinar la lista. Elija una característica para ver sus detalles.

  7. En la pestaña Detalles y en la subpestaña Información, puede revisar la información de su grupo de características. Esto incluye la ejecución más reciente, la configuración de almacenamiento sin conexión, la configuración de almacenamiento en línea y más.

  8. En la pestaña Detalles y la subpestaña Etiquetas, puede revisar las etiquetas de sus grupos de características. Elija Agregar nueva etiqueta para agregar una nueva etiqueta o Eliminar para eliminar una etiqueta.

  9. En la pestaña Ejecuciones en canalización, puedes ver las canalizaciones o ejecuciones de canalizaciones asociadas a tu grupo de características.

  10. En la pestaña Linaje, puedes ver el linaje de tu grupo de características.

Actualiza un grupo de características desde la consola

Puede actualizar sus grupos de entidades una vez que se haya creado correctamente un grupo de entidades en el Feature Store.

Puedes usar la consola o la Amazon SageMaker Feature Store API para actualizar un grupo de características. Las instrucciones para usar Feature Store a través de la consola dependen de si la has activado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico si es tu experiencia predeterminada.

  1. Abre la consola de Studio siguiendo las instrucciones que se indican enLanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para ampliar la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver tus grupos de funciones, selecciona Mi cuenta. Para ver los grupos de funciones compartidos, selecciona Cuenta cruzada.

  5. En la pestaña del Catálogo de grupos de características, busque y elija el nombre de su grupo de características de la lista. Se abrirá la página del grupo de características.

  6. Elija Actualizar grupo de características.

  7. (Opcional) Si corresponde, puedes cambiar el modo de procesamiento, lo que afectará a la forma en que se te cobrará. En el modo de rendimiento, elija un modo de la lista desplegable e introduzca las capacidades de lectura y escritura cuando estén disponibles. Para obtener información sobre los modos de rendimiento, por ejemplo, cuándo se puede aplicar el modo y las unidades de capacidad, consulte. Modos de rendimiento

  8. (Opcional) Si tu grupo de funciones usa la tienda en línea, puedes actualizar el tiempo de vida predeterminado (TTL). Si TTL no está activado para el grupo de funciones, mueve el botón de cambio situado en Time to Live (TTL) a Activado. Puede especificar el TTL valor y la unidad en Duración del tiempo de vida. Esto actualizará la TTL duración predeterminada de todos los registros agregados al grupo de entidades una vez actualizado el grupo de entidades.

  9. De forma opcional, puede agregar definiciones de características al grupo de características, pero tenga en cuenta que no puede eliminar definiciones de características de los grupos de características. Para añadir una definición de entidad, elija + Añadir definición de entidad y, a continuación, especifique el nombre de la nueva definición de entidad en la columna Nombre y seleccione el tipo de entidad en la columna Tipo de entidad.

  10. Elija Guardar cambios.

  11. Para confirmar los cambios, seleccione Confirmar.

Consulta las ejecuciones en canalización desde la consola

Puedes ver la información más reciente sobre la ejecución de una canalización de una función o un grupo de características en Ejecuciones de canalización. También puedes obtener enlaces a canalizaciones, ejecuciones, código y otra información útil sobre la ejecución.

Puedes usar la consola para ver las ejecuciones de tus canalizaciones. Las instrucciones para usar Feature Store a través de la consola dependen de si la has activado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico si es tu experiencia predeterminada.

  1. Abre la consola de Studio siguiendo las instrucciones que se indican enLanza Amazon SageMaker Studio.

  2. Seleccione Datos en el panel de navegación izquierdo para ampliar la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver tus grupos de funciones, selecciona Mi cuenta. Para ver los grupos de funciones compartidos, selecciona Cuenta cruzada.

  5. Elija un grupo de funciones o una función para ver sus ejecuciones en proceso.

  6. Elija la pestaña Ejecuciones de canalizaciones.

  7. Busque una canalización en la lista desplegable Seleccionar una canalización.

  8. Puedes ver los enlaces a la canalización, la ejecución y los detalles del código. También puedes ver el propietario, el estado, la fecha y la duración de la ejecución.

Vea el linaje desde la consola

Puede ver el linaje de un grupo de características. El linaje incluye la información sobre el código de ejecución del flujo de trabajo de procesamiento de características, los orígenes de datos que se utilizaron y la forma en que se incorporaron al grupo de características o a la característica.

Puede usar la consola para ver el linaje de un grupo de características. Las instrucciones sobre el uso de Feature Store a través de la consola dependen de si la ha activado Amazon SageMaker Studio o Amazon SageMaker Studio Clásico es la experiencia predeterminada.

  1. Abre la consola de Studio siguiendo las instrucciones que se indican enLanza Amazon SageMaker Studio.

  2. Selecciona Datos en el panel de navegación izquierdo para ampliar la lista desplegable.

  3. En la lista desplegable, elija Almacén de características.

  4. (Opcional) Para ver tus grupos de funciones, selecciona Mi cuenta. Para ver los grupos de funciones compartidos, selecciona Cuenta cruzada.

  5. Elija un grupo de características o una entidad para ver los detalles de su linaje.

  6. Elija la pestaña Linaje.

  7. Elija un grupo de características o un nodo de canalización para ampliar el nodo. Contiene más información sobre un grupo de características o canalización.

  8. Puede acercar, alejar o volver a centrar el gráfico de linaje mediante los botones de la parte inferior izquierda de la pantalla.

  9. Puede desplazarse por el mapa de linaje si lo desea y arrastrar la pantalla. Para mover los mapas de linaje utilizando los nodos como punto focal, puede pulsar la tecla Tab o Shift+Tab para cambiar de un nodo a otro.

  10. Si corresponde, puedes navegar por el linaje aguas arriba (a la izquierda, antes) o aguas abajo (a la derecha, más reciente). Para ello, elija un nodo y, a continuación, elija Query upstream linage o Query downstream linage.