

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Implementieren Sie einen Blueprint zur Vektorisierung von Streaming-Daten
<a name="ai-vector-embedding-integration-deploy"></a>

In diesem Thema wird beschrieben, wie ein Blueprint für die Vektorisierung von Streaming-Daten bereitgestellt wird.

**Stellen Sie einen Blueprint zur Vektorisierung von Streaming-Daten bereit**

1. Stellen Sie sicher, dass die folgenden Ressourcen korrekt eingerichtet sind:

   1. Bereitgestellter oder serverloser MSK-Cluster mit einem oder mehreren Themen, die Daten enthalten.

1. Bedrock-Setup: [Zugriff auf das gewünschte Bedrock-Modell](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html). Derzeit werden folgende Bedrock-Modelle unterstützt:
   + Amazon Titan Embeddings G1 – Text
   + Amazon Titan Text Embeddings V2
   + Amazon Titan Multimodal Embeddings G1
   + Cohere Embed English
   + Cohere Embed Multilingual

1. AWS OpenSearch Sammlung:
   + Sie können eine Sammlung bereitgestellter oder serverloser OpenSearch Dienste verwenden.
   + Die OpenSearch Servicesammlung muss mindestens einen Index haben.
   + Wenn Sie eine **OpenSearch serverlose Sammlung** verwenden möchten, stellen Sie sicher, dass Sie eine Vektorsuchsammlung erstellen. Einzelheiten zum Einrichten eines Vektorindex finden Sie unter [Voraussetzungen für Ihren eigenen Vektorspeicher als Wissensdatenbank](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html). Weitere Informationen zur Vektorisierung finden Sie unter Erläuterung der [Vektordatenbankfunktionen von Amazon OpenSearch Service](https://aws.amazon.com/blogs/big-data/amazon-opensearch-services-vector-database-capabilities-explained/).
**Anmerkung**  
Wenn Sie einen Vektorindex erstellen, müssen Sie den Vektorfeldnamen verwenden. `embedded_data`
   + Wenn Sie eine **OpenSearch bereitgestellte Sammlung** verwenden möchten, müssen Sie Ihrer Sammlung die MSF-Anwendungsrolle (die die Opensearch-Zugriffsrichtlinie enthält), die durch den Blueprint erstellt wurde, als Masterbenutzer hinzufügen. OpenSearch Vergewissern Sie sich außerdem, dass die Zugriffsrichtlinie auf Aktionen „Zulassen“ eingestellt OpenSearch ist. Dies ist erforderlich, um [eine detaillierte Zugriffskontrolle zu ermöglichen](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling).
   + Optional können Sie den Zugriff auf das OpenSearch Dashboard aktivieren, um Ergebnisse anzuzeigen. Weitere Informationen finden Sie unter [Aktivieren der Zugangskontrolle für Feinkörner](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling).

1. Melden Sie sich mit einer Rolle an, die [aws: CreateStack](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-action-createstack.html) -Berechtigungen zulässt.

1. Gehen Sie zum Dashboard der MSF-Konsole und wählen Sie **Streaming-Anwendung erstellen** aus.

1. **Wählen Sie unter Methode zur Einrichtung der Stream-Verarbeitungsanwendung** auswählen die Option **Blueprint verwenden** aus.

1. Wählen Sie im Dropdownmenü Blueprints die Option **Blueprint für KI-Anwendungen in Echtzeit** aus.

1. Geben Sie die gewünschten Konfigurationen an. Siehe [Seitenkonfigurationen erstellen](#ai-vector-embedding-integration-create-page-configs).

1. Wählen Sie **Blueprint bereitstellen** aus, um eine CloudFormation Bereitstellung zu starten.

1. Sobald die CloudFormation Bereitstellung abgeschlossen ist, wechseln Sie zur bereitgestellten Flink-Anwendung. Überprüfen Sie die Runtime-Eigenschaften der Anwendung.

1. Sie können wählen, welche change/add Runtime-Eigenschaften für Ihre Anwendung gelten sollen. Einzelheiten zur [Konfiguration dieser Eigenschaften finden Sie unter Konfiguration der Runtime-Eigenschaften](https://docs.aws.amazon.com/managed-flink/latest/java/troubleshooting-blueprints.html).
**Anmerkung**  
Hinweis:  
Wenn Sie OpenSearch Provisioned verwenden, stellen Sie bitte sicher, dass Sie die [Fine-Grain-Zugriffskontrolle](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/fgac.html#fgac-enabling) aktiviert haben.  
Wenn Ihr bereitgestellter Cluster privat ist, fügen Sie ihn `https://` zu Ihrer OpenSearch bereitgestellten VPC-Endpunkt-URL hinzu und ändern Sie ihn so, dass er auf diesen Endpunkt `sink.os.endpoint` verweist.  
Wenn Ihr bereitgestellter Cluster öffentlich ist, stellen Sie sicher, dass Ihre MSF-Anwendung auf das Internet zugreifen kann. Weitere Informationen finden Sie unter [>>>>>> express-brokers-publication-merge type="documentation“ url="managed- flink/latest/java/vpc -internet.html ">Internet- und Servicezugriff für eine mit VPC verbundene Managed Service for]() Apache Flink-Anwendung.

1. Wenn Sie mit allen Konfigurationen zufrieden sind, wählen Sie. `Run` Die Anwendung wird gestartet.

1. Pumpnachrichten in Ihrem MSK-Cluster.

1. Navigieren Sie zum Opensearch-Cluster und gehen Sie zum OpenSearch Dashboard.

1. Wählen Sie auf dem Dashboard im linken Menü **Discover** aus. Sie sollten persistente Dokumente zusammen mit ihren Vektoreinbettungen sehen.

1. Unter [Arbeiten mit Vektorsuchsammlungen](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html) erfahren Sie, wie Sie die im Index gespeicherten Vektoren verwenden können.

## Seitenkonfigurationen erstellen
<a name="ai-vector-embedding-integration-create-page-configs"></a>

In diesem Thema wird das Erstellen von Seitenkonfigurationen beschrieben, auf die bei der Angabe von Konfigurationen für KI-Anwendungs-Blueprints in Echtzeit zurückgegriffen werden kann.

**Anwendungsname**  
Bestehendes Feld in MSF, geben Sie Ihrer Anwendung einen beliebigen Namen.

**MSK-Cluster**  
Wählen Sie den MSK-Cluster, den Sie während der Installation erstellt haben, aus der Drop-down-Liste aus.

**Topics**  
Fügen Sie den Namen der Themen hinzu, die Sie im Setup erstellt haben.

**Datentyp des Eingabe-Streams**  
Wählen Sie „**Zeichenfolge**“, wenn Sie Zeichenketteneingaben für den MSK-Stream bereitstellen möchten.  
Wählen Sie **JSON**, wenn die Eingabe im MSK-Stream JSON ist. Schreiben Sie in **eingebettete JSON-Schlüssel** die Namen der Felder in Ihrem Eingabe-JSON, deren Wert Sie zur Generierung von Einbettungen an Bedrock senden möchten.

**Bedrock-Einbettungsmodell**  
Wählen Sie eines aus der Liste aus. Stellen Sie sicher, dass Sie Modellzugriff für das von Ihnen gewählte Modell haben, da der Stack sonst ausfallen könnte. Weitere Informationen finden [Sie unter Zugriff auf Amazon Bedrock Foundation-Modelle hinzufügen oder entfernen](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access-modify.html).

**OpenSearch Cluster**  
Wählen Sie den Cluster, den Sie erstellt haben, aus der Dropdownliste aus.

**OpenSearch Name des Vektor-Indexes**  
Wählen Sie den Vektorindex aus, den Sie im obigen Schritt erstellt haben.