Note prima di abilitare i blueprint di incorporamento vettoriale in tempo reale - Amazon Managed Streaming per Apache Kafka

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Note prima di abilitare i blueprint di incorporamento vettoriale in tempo reale

L'applicazione Managed Service for Apache Flink supporterà solo testo o JSON dati non strutturati nel flusso di input.

Sono supportate due modalità di elaborazione degli input:

  • Quando i dati di input sono testo non strutturato, viene incorporato l'intero messaggio di testo. Il DB vettoriale contiene il testo originale e l'incorporamento generato.

  • Quando i dati di input sono in JSONformato, l'applicazione offre la possibilità di configurare e specificare una o più chiavi all'interno del valore dell'JSONoggetto da utilizzare per il processo di incorporamento. Se è presente più di una chiave, tutte le chiavi vengono vettorializzate insieme e indicizzate nel DB vettoriale. Il DB vettoriale conterrà il messaggio originale e l'incorporamento generato.

Generazione di incorporamento: l'applicazione supporta tutti i modelli di incorporamento del testo forniti esclusivamente da Bedrock.

Persistenza in Vector DB Store: l'applicazione utilizza un OpenSearch cluster esistente (fornito o Serverless) nell'account del cliente come destinazione per la persistenza dei dati incorporati. Quando usi Opensearch Serverless per creare un indice vettoriale, usa sempre il nome del campo vettoriale. embedded_data

Analogamente ai MSF blueprint, è necessario gestire l'infrastruttura per eseguire il codice associato al blueprint di incorporamento vettoriale in tempo reale.

Analogamente a MSF Blueprints, una volta creata, un'MSFapplicazione deve essere avviata esclusivamente nell' AWS account utilizzando la console o. CLI AWS non avvierà l'MSFapplicazione per te. Devi chiamare StartApplication API (tramite CLI o console) per far funzionare l'applicazione.

Spostamento dei dati tra account: l'applicazione non consente di spostare dati tra flussi di input e destinazioni vettoriali che risiedono in account diversi AWS .