

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Implementación de un esquema de vectorización de datos en streaming
<a name="ai-vector-embedding-integration-deploy"></a>

Este tema describe cómo implementar un esquema de vectorización de datos en streaming.

**Implementación de un esquema de vectorización de datos en streaming**

1. Asegúrese de que los siguientes recursos estén configurados correctamente:

   1. Un clúster de Amazon MSK aprovisionado o sin servidor con uno o más temas que contengan datos.

1. Configuración de Bedrock: [Acceso al modelo de Bedrock deseado](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html). Modelos de Bedrock compatibles actualmente:
   + Amazon Titan Embeddings G1 - Text
   + Amazon Titan Text Embeddings V2
   + Amazon Titan Multimodal Embeddings G1
   + Cohere Embed inglés
   + Cohere Embed multilingüe

1. AWS OpenSearch colección:
   + Puede utilizar una colección de OpenSearch servicios aprovisionados o sin servidor.
   + La colección OpenSearch de servicios debe tener al menos un índice.
   + Si planea usar una **colección OpenSearch sin servidor**, asegúrese de crear una colección de búsqueda vectorial. Para obtener información detallada sobre cómo configurar un índice vectorial, consulte [Requisitos previos para usar un almacén vectorial propio para una base de conocimientos](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html). Para obtener más información sobre la vectorización, consulta la explicación de las [capacidades de las bases de datos vectoriales de Amazon OpenSearch Service](https://aws.amazon.com/blogs/big-data/amazon-opensearch-services-vector-database-capabilities-explained/).
**nota**  
Al crear un índice vectorial, debe usar el nombre del campo vectorial `embedded_data`.
   + Si piensa utilizar una **colección OpenSearch aprovisionada**, debe añadir el rol de aplicación MSF (que contiene la política de acceso de Opensearch) que creó el blueprint, como usuario maestro de su colección. OpenSearch Además, confirme que la política de acceso OpenSearch esté configurada para «Permitir» acciones. Esto es necesario para [habilitar el control de acceso detallado](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling).
   + Si lo desea, puede habilitar el acceso al OpenSearch panel de control para ver los resultados. Consulte [habilitar el control de acceso detallado](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling).

1. Inicie sesión con un rol que permita CreateStack los permisos [aws:](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-action-createstack.html).

1. Vaya al panel de la consola de MSF y seleccione **Crear aplicación de streaming**.

1. En **Elegir un método para configurar la aplicación de procesamiento de flujos**, seleccione **Usar un esquema**.

1. Seleccione **Esquema de aplicación de IA en tiempo real** en el menú desplegable de esquemas.

1. Proporcione las configuraciones deseadas. Consulte [Creación de configuraciones de la página](#ai-vector-embedding-integration-create-page-configs).

1. Seleccione **Deploy Blueprint** para iniciar una CloudFormation implementación.

1. Una vez completada la CloudFormation implementación, vaya a la aplicación Flink implementada. Revise las propiedades de tiempo de ejecución de la aplicación.

1. Puede elegir ejecutar las change/add propiedades de su aplicación. Para obtener más información, consulte [Configuración de propiedades de tiempo de ejecución](https://docs.aws.amazon.com/managed-flink/latest/java/troubleshooting-blueprints.html) para conocer los detalles necesarios para configurar estas propiedades.
**nota**  
Nota:  
Si utilizas OpenSearch aprovisionadas, asegúrate de activar el [control de acceso detallado](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling).  
Si el clúster aprovisionado es privado, agréguelo `https://` a la URL del punto de enlace de la OpenSearch VPC aprovisionada y cámbielo para que apunte `sink.os.endpoint` a este punto de enlace.  
Si el clúster aprovisionado es público, asegúrese de que la aplicación de MSF tenga acceso a Internet. Para obtener más información, consulte [>>>>>> express-brokers-publication-merge type="documentation» url="managed- flink/latest/java/vpc -internet.html ">Acceso a Internet y a los servicios para una aplicación Managed Service for Apache Flink conectada a VPC]().

1. Una vez que esté conforme con todas las configuraciones, seleccione `Run`. La aplicación comenzará a ejecutarse.

1. Envíe mensajes al clúster de MSK.

1. Navegue hasta el clúster de Opensearch y vaya al panel de control. OpenSearch 

1. En el panel, seleccione **Descubrir** en el menú de la izquierda. Debería ver los documentos almacenados junto con sus incrustaciones vectoriales.

1. Consulte [Trabajo con colecciones de búsqueda vectorial](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html) para conocer cómo puede utilizar los vectores almacenados en el índice.

## Creación de configuraciones de la página
<a name="ai-vector-embedding-integration-create-page-configs"></a>

Este tema describe las configuraciones de página que se deben consultar al especificar las configuraciones de esquemas de aplicaciones de IA en tiempo real.

**Nombre de la aplicación**  
Campo existente en MSF: asigne cualquier nombre a la aplicación.

**Clúster de MSK**  
Seleccione el clúster de MSK que creó durante la configuración desde la lista desplegable.

**Temas**  
Agregue el nombre del tema o de los temas que creó durante la configuración.

**Tipo de datos del flujo de entrada**  
Seleccione **Cadena** si va a proporcionar entrada de tipo cadena al flujo de MSK.  
Seleccione **JSON** si la entrada en el flujo de MSK está en formato JSON. En **claves JSON incrustadas**, escriba los nombres de los campos del JSON de entrada cuyo valor desea enviar a Bedrock para generar incrustaciones.

**Modelo de incrustación de Bedrock**  
Seleccione uno de la lista. Asegúrese de tener acceso al modelo que elija; de lo contrario, la pila podría fallar. Consulte [Agregar o eliminar acceso a los modelos base de Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access-modify.html).

**OpenSearch clúster**  
Seleccione el clúster que creó en la lista desplegable.

**OpenSearch nombre del índice vectorial**  
Seleccione el índice vectorial que creó en el paso anterior.