Creación de configuraciones de la página

Implementación de un esquema de vectorización de datos en streaming

Este tema describe cómo implementar un esquema de vectorización de datos en streaming.

Implementación de un esquema de vectorización de datos en streaming

Asegúrese de que los siguientes recursos estén configurados correctamente:
1. Un clúster de Amazon MSK aprovisionado o sin servidor con uno o más temas que contengan datos.
Configuración de Bedrock: Acceso al modelo de Bedrock deseado. Modelos de Bedrock compatibles actualmente:
- Amazon Titan Embeddings G1 - Text
- Amazon Titan Text Embeddings V2
- Amazon Titan Multimodal Embeddings G1
- Cohere Embed inglés
- Cohere Embed multilingüe
AWS OpenSearch colección:
- Puede utilizar una colección de OpenSearch servicios aprovisionados o sin servidor.
- La colección OpenSearch de servicios debe tener al menos un índice.
- Si planea usar una colección OpenSearch sin servidor, asegúrese de crear una colección de búsqueda vectorial. Para obtener información detallada sobre cómo configurar un índice vectorial, consulte Requisitos previos para usar un almacén vectorial propio para una base de conocimientos. Para obtener más información sobre la vectorización, consulta la explicación de las capacidades de las bases de datos vectoriales de Amazon OpenSearch Service.
  
  nota
  Al crear un índice vectorial, debe usar el nombre del campo vectorial embedded_data.
- Si piensa utilizar una colección OpenSearch aprovisionada, debe añadir el rol de aplicación MSF (que contiene la política de acceso de Opensearch) que creó el blueprint, como usuario maestro de su colección. OpenSearch Además, confirme que la política de acceso OpenSearch esté configurada para «Permitir» acciones. Esto es necesario para habilitar el control de acceso detallado.
- Si lo desea, puede habilitar el acceso al OpenSearch panel de control para ver los resultados. Consulte habilitar el control de acceso detallado.
Inicie sesión con un rol que permita CreateStack los permisos aws:.
Vaya al panel de la consola de MSF y seleccione Crear aplicación de streaming.
En Elegir un método para configurar la aplicación de procesamiento de flujos, seleccione Usar un esquema.
Seleccione Esquema de aplicación de IA en tiempo real en el menú desplegable de esquemas.
Proporcione las configuraciones deseadas. Consulte Creación de configuraciones de la página.
Seleccione Deploy Blueprint para iniciar una CloudFormation implementación.
Una vez completada la CloudFormation implementación, vaya a la aplicación Flink implementada. Revise las propiedades de tiempo de ejecución de la aplicación.
Puede elegir ejecutar las change/add propiedades de su aplicación. Para obtener más información, consulte Configuración de propiedades de tiempo de ejecución para conocer los detalles necesarios para configurar estas propiedades.

nota
Nota:
Si utilizas OpenSearch aprovisionadas, asegúrate de activar el control de acceso detallado.
Si el clúster aprovisionado es privado, agréguelo https:// a la URL del punto de enlace de la OpenSearch VPC aprovisionada y cámbielo para que apunte sink.os.endpoint a este punto de enlace.
Si el clúster aprovisionado es público, asegúrese de que la aplicación de MSF tenga acceso a Internet. Para obtener más información, consulte >>>>>> express-brokers-publication-merge type="documentation» url="managed- flink/latest/java/vpc -internet.html ">Acceso a Internet y a los servicios para una aplicación Managed Service for Apache Flink conectada a VPC.
Una vez que esté conforme con todas las configuraciones, seleccione Run. La aplicación comenzará a ejecutarse.
Envíe mensajes al clúster de MSK.
Navegue hasta el clúster de Opensearch y vaya al panel de control. OpenSearch
En el panel, seleccione Descubrir en el menú de la izquierda. Debería ver los documentos almacenados junto con sus incrustaciones vectoriales.
Consulte Trabajo con colecciones de búsqueda vectorial para conocer cómo puede utilizar los vectores almacenados en el índice.

Creación de configuraciones de la página

Este tema describe las configuraciones de página que se deben consultar al especificar las configuraciones de esquemas de aplicaciones de IA en tiempo real.

Nombre de la aplicación

Campo existente en MSF: asigne cualquier nombre a la aplicación.

Clúster de MSK

Seleccione el clúster de MSK que creó durante la configuración desde la lista desplegable.

Temas

Agregue el nombre del tema o de los temas que creó durante la configuración.

Tipo de datos del flujo de entrada

Seleccione Cadena si va a proporcionar entrada de tipo cadena al flujo de MSK.

Seleccione JSON si la entrada en el flujo de MSK está en formato JSON. En claves JSON incrustadas, escriba los nombres de los campos del JSON de entrada cuyo valor desea enviar a Bedrock para generar incrustaciones.

Modelo de incrustación de Bedrock

Seleccione uno de la lista. Asegúrese de tener acceso al modelo que elija; de lo contrario, la pila podría fallar. Consulte Agregar o eliminar acceso a los modelos base de Amazon Bedrock.

OpenSearch clúster

Seleccione el clúster que creó en la lista desplegable.

OpenSearch nombre del índice vectorial

Seleccione el índice vectorial que creó en el paso anterior.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Notas antes de habilitar esquemas de incrustación vectorial en tiempo real

Cuota

Implementación de un esquema de vectorización de datos en streaming

Implementación de un esquema de vectorización de datos en streaming

nota

nota

Creación de configuraciones de la página