Implemente un plan de vectorización de datos de streaming - Amazon Managed Streaming para Apache Kafka

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implemente un plan de vectorización de datos de streaming

En este tema se describe cómo implementar un esquema de vectorización de datos de streaming.

Implemente un plan de vectorización de datos de streaming
  1. Asegúrese de que los siguientes recursos estén configurados correctamente:

    1. Clúster de MSK aprovisionado o sin servidor con uno o más temas que contienen datos.

  2. Configuración de Bedrock: acceso al modelo de Bedrock deseado. Los modelos Bedrock compatibles actualmente son:

    • Amazon Titan Embeddings G1 - Text

    • Amazon Titan Text Embeddings V2

    • Amazon Titan Multimodal Embeddings G1

    • Cohere Embed inglés

    • Cohere Embed multilingüe

  3. AWS OpenSearch colección:

  4. Inicie sesión con un rol que permita CreateStack los permisos aws:.

  5. Ve al panel de control de la consola de MSF y selecciona Crear aplicación de streaming.

  6. En Elegir un método para configurar la aplicación de procesamiento de transmisiones, seleccione Usar un plano.

  7. Seleccione el plano de la aplicación de IA en tiempo real en el menú desplegable de planos.

  8. Proporcione las configuraciones deseadas. Consulte Cree configuraciones de página.

  9. Seleccione Deploy Blueprint para iniciar una CloudFormation implementación.

  10. Una vez completada la CloudFormation implementación, vaya a la aplicación Flink implementada. Compruebe las propiedades de tiempo de ejecución de la aplicación.

  11. Puede elegir cambiar o añadir las propiedades de tiempo de ejecución a su aplicación. Consulte Configuración de propiedades en tiempo de ejecución para obtener detalles sobre cómo configurar estas propiedades.

    nota

    Nota:

    Si está utilizando OpenSearch aprovisionadas, asegúrese de haber activado el control de acceso detallado.

    Si el clúster aprovisionado es privado, agréguelo https:// a la URL del punto de enlace de la OpenSearch VPC aprovisionada y cámbielo para que apunte sink.os.endpoint a este punto de enlace.

    Si el clúster aprovisionado es público, asegúrate de que tu aplicación de MSF pueda acceder a Internet. Para obtener más información, consulte >>>>>> express-brokers-publication-merge type="documentation» url="managed- flink/latest/java/vpc -internet.html ">Acceso a Internet y a los servicios para una aplicación Managed Service for Apache Flink conectada a VPC.

  12. Una vez que esté satisfecho con todas las configuraciones, seleccione. Run La aplicación empezará a ejecutarse.

  13. Introduce mensajes en tu clúster de MSK.

  14. Navegue hasta el clúster de Opensearch y vaya al panel de OpenSearch control.

  15. En el panel de control, selecciona Discover en el menú de la izquierda. Deberías ver los documentos persistentes junto con sus incrustaciones vectoriales.

  16. Consulte Cómo utilizar las colecciones de búsqueda vectorial para ver cómo puede utilizar los vectores almacenados en el índice.

Cree configuraciones de página

En este tema, se describen las configuraciones de página de creación para consultarlas a la hora de especificar las configuraciones de los planos de aplicaciones de IA en tiempo real.

Nombre de la aplicación

Campo existente en MSF, asigne cualquier nombre a su aplicación.

Clúster de MSK

Seleccione el clúster de MSK que creó durante la configuración en la lista desplegable.

Temas

Agregue el nombre de los temas que creó en la configuración.

Tipo de datos del flujo de entrada

Elija Cadena si va a proporcionar una entrada de cadena a la transmisión de MSK.

Elija JSON si la entrada de la transmisión de MSK es JSON. En las claves JSON integradas, escribe los nombres de los campos del JSON de entrada cuyo valor quieras enviar a Bedrock para generar incrustaciones.

Modelo de incrustación en Bedrock

Seleccione uno de la lista. Asegúrese de tener acceso al modelo que elija; de lo contrario, la pila podría fallar. Consulte Añadir o eliminar el acceso a los modelos de bases Amazon Bedrock.

OpenSearch clúster

Selecciona el clúster que creaste en el menú desplegable.

OpenSearch nombre del índice vectorial

Seleccione el índice vectorial que creó en el paso anterior.