Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Implemente un plan de vectorización de datos de streaming
En este tema se describe cómo implementar un esquema de vectorización de datos de streaming.
Implemente un plan de vectorización de datos de streaming
-
Asegúrese de que los siguientes recursos estén configurados correctamente:
-
Clúster de MSK aprovisionado o sin servidor con uno o más temas que contienen datos.
-
-
Configuración de Bedrock: acceso al modelo de Bedrock deseado. Los modelos Bedrock compatibles actualmente son:
Amazon Titan Embeddings G1 - Text
Amazon Titan Text Embeddings V2
Amazon Titan Multimodal Embeddings G1
Cohere Embed inglés
Cohere Embed multilingüe
-
AWS OpenSearch colección:
Puede utilizar una colección de OpenSearch servicios aprovisionados o sin servidor.
La colección OpenSearch de servicios debe tener al menos un índice.
Si planea usar una colección OpenSearch sin servidor, asegúrese de crear una colección de búsqueda vectorial. Para obtener más información sobre cómo configurar un índice vectorial, consulta los requisitos previos de tu propio almacén de vectores para obtener una base de conocimientos. Para obtener más información sobre la vectorización, consulta la explicación de las capacidades de las bases de datos vectoriales de Amazon OpenSearch Service
. nota
Al crear un índice vectorial, debe usar el nombre del campo vectorial.
embedded_data
Si planea usar una colección OpenSearch aprovisionada, debe añadir el rol de aplicación MSF (que contiene la política de acceso de Opensearch) que creó el blueprint, como usuario maestro de su colección. OpenSearch Además, confirme que la política de acceso OpenSearch esté configurada para «Permitir» acciones. Esto es necesario para permitir el control de acceso al grano fino.
Si lo desea, puede habilitar el acceso al OpenSearch panel de control para ver los resultados. Consulte esta sección para activar el control de acceso de grano fino.
Inicie sesión con un rol que permita CreateStack los permisos aws:.
Ve al panel de control de la consola de MSF y selecciona Crear aplicación de streaming.
En Elegir un método para configurar la aplicación de procesamiento de transmisiones, seleccione Usar un plano.
Seleccione el plano de la aplicación de IA en tiempo real en el menú desplegable de planos.
Proporcione las configuraciones deseadas. Consulte Cree configuraciones de página.
Seleccione Deploy Blueprint para iniciar una CloudFormation implementación.
Una vez completada la CloudFormation implementación, vaya a la aplicación Flink implementada. Compruebe las propiedades de tiempo de ejecución de la aplicación.
Puede elegir cambiar o añadir las propiedades de tiempo de ejecución a su aplicación. Consulte Configuración de propiedades en tiempo de ejecución para obtener detalles sobre cómo configurar estas propiedades.
nota
Nota:
Si está utilizando OpenSearch aprovisionadas, asegúrese de haber activado el control de acceso detallado.
Si el clúster aprovisionado es privado, agréguelo
https://
a la URL del punto de enlace de la OpenSearch VPC aprovisionada y cámbielo para que apuntesink.os.endpoint
a este punto de enlace.Si el clúster aprovisionado es público, asegúrate de que tu aplicación de MSF pueda acceder a Internet. Para obtener más información, consulte >>>>>> express-brokers-publication-merge type="documentation» url="managed- flink/latest/java/vpc -internet.html ">Acceso a Internet y a los servicios para una aplicación Managed Service for Apache Flink conectada a VPC.
Una vez que esté satisfecho con todas las configuraciones, seleccione.
Run
La aplicación empezará a ejecutarse.Introduce mensajes en tu clúster de MSK.
Navegue hasta el clúster de Opensearch y vaya al panel de OpenSearch control.
En el panel de control, selecciona Discover en el menú de la izquierda. Deberías ver los documentos persistentes junto con sus incrustaciones vectoriales.
Consulte Cómo utilizar las colecciones de búsqueda vectorial para ver cómo puede utilizar los vectores almacenados en el índice.
Cree configuraciones de página
En este tema, se describen las configuraciones de página de creación para consultarlas a la hora de especificar las configuraciones de los planos de aplicaciones de IA en tiempo real.
- Nombre de la aplicación
-
Campo existente en MSF, asigne cualquier nombre a su aplicación.
- Clúster de MSK
-
Seleccione el clúster de MSK que creó durante la configuración en la lista desplegable.
- Temas
-
Agregue el nombre de los temas que creó en la configuración.
- Tipo de datos del flujo de entrada
-
Elija Cadena si va a proporcionar una entrada de cadena a la transmisión de MSK.
Elija JSON si la entrada de la transmisión de MSK es JSON. En las claves JSON integradas, escribe los nombres de los campos del JSON de entrada cuyo valor quieras enviar a Bedrock para generar incrustaciones.
- Modelo de incrustación en Bedrock
Seleccione uno de la lista. Asegúrese de tener acceso al modelo que elija; de lo contrario, la pila podría fallar. Consulte Añadir o eliminar el acceso a los modelos de bases Amazon Bedrock.
- OpenSearch clúster
Selecciona el clúster que creaste en el menú desplegable.
- OpenSearch nombre del índice vectorial
Seleccione el índice vectorial que creó en el paso anterior.