Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
El almacenamiento en línea es un almacén de datos de baja latencia y alta disponibilidad que proporciona una búsqueda de características en tiempo real. Por lo general, se utiliza para atender modelos de machine learning (ML). Cuando cree un grupo de características, puede elegir entre el almacenamiento en línea estándar (Standard
) o el almacenamiento en línea integrada en la memoria (InMemory
). De esta forma, puede seleccionar el tipo de almacenamiento que mejor se adapte a los patrones de lectura y escritura de una aplicación concreta, teniendo en cuenta el rendimiento y el costo. Para obtener más información sobre los precios, consulta Amazon SageMaker AI Pricing
El almacenamiento en línea contiene las siguientes opciones de StorageType
. Para obtener más información sobre el contenido del almacenamiento en línea, consulte OnlineStoreConfig
.
Tipo de almacenamiento estándar
El nivel Standard
es un almacén de datos administrado de baja latencia para los grupos de características del almacenamiento en línea. Proporciona una recuperación rápida de datos para atender modelos de ML para sus aplicaciones. Standard
es el tipo de almacenamiento predeterminado.
Tipo de almacenamiento en memoria
El nivel InMemory
es un almacén de datos administrado para los grupos de características del almacenamiento en línea que admite recuperaciones de muy baja latencia. Proporciona una recuperación de datos a gran escala en tiempo real para atender los modelos de ML que se utilizan en aplicaciones de alto rendimiento. El InMemory
nivel funciona con Amazon ElastiCache (Redis OSS). Para obtener más información, consulte ¿Qué es Amazon ElastiCache (Redis OSS)? .
El nivel InMemory
del almacenamiento en línea admite los tipos de colección, a saber, lista, conjunto y vector. Para obtener más información sobre los tipos de colección InMemory
, consulte Tipos de colección.
El almacén de características proporciona lectura y escritura de baja latencia al almacenamiento en línea. La latencia de la aplicación consta principalmente de dos componentes: latencia de infraestructura o red y latencia de API del almacén de características. La reducción de la latencia de la red ayuda a obtener las lecturas y escrituras con la latencia más baja en el almacén de características. Puede reducir la latencia de la red en Feature Store AWS PrivateLink implementándola en el punto final de tiempo de ejecución de Feature Store. Con AWS PrivateLink, puede acceder de forma privada a todas las operaciones de la API Feature Store Runtime desde su Amazon Virtual Private Cloud (VPC) de forma escalable mediante puntos de enlace de VPC de interfaz. Una AWS PrivateLink implementación con la privateDNSEnabled
opción establecida como verdadera:
-
Mantiene todo el tráfico de lectura/escritura del almacén de características dentro de su VPC.
-
Mantiene el tráfico de invocación en la misma AZ que el cliente que lo originó al utilizar el almacén de características. Esto evita los «saltos» entre la AZs reducción de la latencia de la red.
Siga los pasos de Acceder a un AWS
servicio mediante un punto final de VPC de interfaz para AWS PrivateLink configurarlo en Feature Store. El nombre del servicio de Feature Store Runtime AWS PrivateLink escom.amazonaws.region.sagemaker.featurestore-runtime
.
El nivel InMemory
del almacenamiento en línea se escala automáticamente en función del uso del almacenamiento y las solicitudes. El escalado automatizado puede tardar unos minutos en adaptarse a un nuevo patrón de uso si este cambia rápidamente. Durante el escalado automatizado:
-
Las operaciones de escritura en el grupo de características pueden recibir errores de limitación. Debe volver a intentar realizar las solicitudes unos minutos más tarde.
-
Las operaciones de lectura en el grupo de características pueden recibir errores de limitación. En este caso, son adecuadas las estrategias de reintento estándar.
-
Es posible que las operaciones de lectura sufran una alta latencia.
El tamaño máximo predeterminado del grupo de características del nivel InMemory
es 50 GiB.
Tenga en cuenta que, actualmente, el nivel InMemory
solo admite grupos de características en línea, no grupos de características en línea y sin conexión, por lo que no hay replicación entre el almacenamiento sin conexión y en línea para el nivel InMemory
. Además, actualmente, el nivel InMemory
no admite claves de KMS administradas por el cliente.