Erstellen einer Wissensdatenbank - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen einer Wissensdatenbank

Anmerkung

Sie können keine Wissensdatenbank mit einem Root-Benutzer erstellen. Melden Sie sich mit einem IAM Benutzer an, bevor Sie mit diesen Schritten beginnen.

Im Rahmen der Erstellung einer Wissensdatenbank konfigurieren Sie eine Datenquelle und einen Vektorspeicher Ihrer Wahl.

Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten.

Console
So erstellen Sie eine Wissensdatenbank
  1. Melden Sie sich als Benutzer mit IAM Amazon Bedrock-Berechtigungen an und öffnen Sie die Amazon Bedrock-Konsole AWS Management Console unter. https://console.aws.amazon.com/bedrock/

  2. Wählen Sie im linken Navigationsbereich Wissensdatenbanken aus.

  3. Wählen Sie im Abschnitt Wissensdatenbanken die Option Wissensdatenbank erstellen aus.

  4. Richten Sie auf der Seite Wissensdatenbank-Details bereitstellen die folgenden Konfigurationen ein:

    1. (Optional) Ändern Sie im Abschnitt Wissensdatenbank-Details den Standardnamen und geben Sie eine Beschreibung für Ihre Wissensdatenbank ein.

    2. Wählen Sie im Abschnitt IAMBerechtigungen eine Rolle AWS Identity and Access Management (IAM) aus, die Amazon Bedrock die Berechtigung zum Zugriff auf andere AWS Dienste gewährt. Sie können Amazon Bedrock die Servicerolle erstellen lassen oder eine benutzerdefinierte Rolle auswählen, die Sie erstellt haben.

    3. (Optional) Fügen Sie Ihrer Wissensdatenbank Tags hinzu. Weitere Informationen finden Sie unter Markieren von Ressourcen.

    4. Klicken Sie auf Weiter.

  5. Wählen Sie auf der Seite Datenquelle auswählen die Datenquelle aus, die Sie für die Wissensdatenbank verwenden möchten:

    1. Folgen Sie den Schritten zur Verbindungskonfiguration für Ihre ausgewählte Datenquelle. Informationen zur Auswahl Ihrer Datenquelle finden Sie unter Unterstützte Datenquellen und folgen Sie den Schritten zur Konfiguration der Konsolenverbindung.

    2. (Optional) Um die folgenden erweiterten Einstellungen als Teil der Datenquellenkonfiguration zu konfigurieren, erweitern Sie den Abschnitt Erweiterte Einstellungen — optional.

      Für KMS key Einstellungen können Sie entweder einen benutzerdefinierten Schlüssel wählen oder den standardmäßig bereitgestellten Datenverschlüsselungsschlüssel verwenden.

      Bei der Konvertierung Ihrer Daten in Einbettungen werden Ihre transienten Daten standardmäßig mit einem Schlüssel Amazon Bedrock verschlüsselt, der AWS Eigentümer und Verwalter ist. Sie können Ihren eigenen Schlüssel verwenden. KMS Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.

      Für die Richtlinieneinstellungen zum Löschen von Daten können Sie eine der folgenden Optionen wählen:

      • Löschen: Löscht alle Daten aus Ihrer Datenquelle, die beim Löschen einer Wissensdatenbank- oder Datenquellenressource in Vektoreinbettungen konvertiert wurden. Beachten Sie, dass nicht der Vektorspeicher selbst gelöscht wird, sondern nur die Daten. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird.

      • Beibehalten: Behält alle Daten aus Ihrer Datenquelle bei, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen umgewandelt wurden. Beachten Sie, dass der Vektorspeicher selbst nicht gelöscht wird, wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen.

    3. Um die folgenden Einstellungen für das Aufteilen und Analysieren von Inhalten als Teil der Datenquellenkonfiguration zu konfigurieren, wechseln Sie zum Abschnitt Inhaltsaufteilung und -analyse.

      Wählen Sie eine der folgenden Optionen für das Chunking:

      • Chunking mit fester Größe: Inhalt, aufgeteilt in Textblöcke mit der von Ihnen festgelegten ungefähren Token-Größe. Sie können die maximale Anzahl von Tokens festlegen, die für einen Abschnitt nicht überschritten werden darf, und den Prozentsatz der Überlappungen zwischen aufeinanderfolgenden Blöcken festlegen.

      • Standard-Chunking: Inhalt wird in Textblöcke von bis zu 300 Tokens aufgeteilt. Wenn ein einzelnes Dokument oder ein Inhalt weniger als 300 Token enthält, wird das Dokument nicht weiter aufgeteilt.

      • Hierarchisches Chunking: Inhalt, der in verschachtelten Strukturen aus über- und untergeordneten Blöcken organisiert ist. Sie legen die maximale Größe des übergeordneten Chunk-Tokens und die maximale Größe des untergeordneten Chunk-Tokens fest. Sie legen auch die absolute Anzahl von Überlappungstoken zwischen aufeinanderfolgenden übergeordneten Chunks und aufeinanderfolgenden untergeordneten Chunks fest.

      • Semantisches Chunking: Inhalt, der in semantisch ähnliche Textblöcke oder Satzgruppen unterteilt ist. Sie legen die maximale Anzahl von Sätzen fest, die den Ziel-/aktuellen Satz umgeben, die gruppiert werden sollen (Puffergröße). Sie legen auch den Schwellenwert für das Perzentil am Breakpoint fest, um den Text in sinnvolle Abschnitte zu unterteilen. Beim semantischen Chunking wird ein Basismodell verwendet. Informationen zu den Kosten von Foundation-Modellen finden Sie unter Amazon Bedrock Preise.

      • Kein Chunting: Jedes Dokument wird als einzelner Textblock behandelt. Möglicherweise möchten Sie Ihre Dokumente vorab verarbeiten, indem Sie sie in separate Dateien aufteilen.

      Anmerkung

      Sie können die Chunking-Strategie nicht ändern, nachdem Sie die Datenquelle erstellt haben.

      Sie können das Basismodell für Amazon Bedrock das Parsen von Dokumenten verwenden, um mehr als Standardtext zu analysieren. Sie können beispielsweise Tabellendaten innerhalb von Dokumenten analysieren, wobei deren Struktur intakt bleibt. Informationen zu den Kosten von Foundation-Modellen finden Sie in der Amazon Bedrock Preisübersicht.

      Sie können eine AWS Lambda Funktion verwenden, um Ihre Chunking-Strategie und die Art und Weise, wie die Attribute/Felder Ihrer Dokumentmetadaten behandelt und aufgenommen werden, anzupassen. Geben Sie den Amazon S3 Bucket-Speicherort für die Eingabe und Ausgabe der Lambda-Funktion an.

    4. Klicken Sie auf Weiter.

  6. Wählen Sie auf der Seite Einbettungsmodell auswählen und Vektorspeicher konfigurieren ein unterstütztes Einbettungsmodell aus, um Ihre Daten in Vektoreinbettungen für die Wissensdatenbank umzuwandeln.

  7. Wählen Sie im Abschnitt Vektordatenbank eine der folgenden Optionen aus, um die Vektoreinbettungen für Ihre Wissensdatenbank zu speichern:

    • Schnelles Erstellen eines neuen Vektorspeichers — Amazon Bedrock erstellt eine Amazon OpenSearch Serverless-Vektorsuchsammlung für Sie. Mit dieser Option werden für Sie eine öffentliche Vektorsuchsammlung und ein Vektorindex mit den erforderlichen Feldern und erforderlichen Konfigurationen eingerichtet. Nachdem die Sammlung erstellt wurde, können Sie sie in der Amazon OpenSearch Serverless-Konsole oder über die AWS API verwalten. Weitere Informationen finden Sie unter Arbeiten mit Vektorsuchsammlungen im Amazon OpenSearch Service Developer Guide. Wenn Sie diese Option auswählen, können Sie optional die folgenden Einstellungen aktivieren:

      1. Um redundante aktive Replikate zu aktivieren, sodass die Verfügbarkeit Ihres Vector Stores im Falle eines Infrastrukturausfalls nicht beeinträchtigt wird, wählen Sie Redundanz aktivieren (aktive Replikate).

        Anmerkung

        Wir empfehlen Ihnen, diese Option deaktiviert zu lassen, während Sie Ihre Wissensdatenbank testen. Wenn Sie für die Bereitstellung in der Produktion bereit sind, empfehlen wir, redundante aktive Replikate zu aktivieren. Informationen zur Preisgestaltung finden Sie unter Preise für Serverless OpenSearch

      2. Um den automatisierten Vektorspeicher mit einem vom Kunden verwalteten Schlüssel zu verschlüsseln, wählen Sie Kundenverwalteten KMS Schlüssel für Amazon OpenSearch Serverless Vector hinzufügen — optional und wählen Sie den Schlüssel aus. Weitere Informationen finden Sie unter Verschlüsselung von Informationen, die an Amazon OpenSearch Service weitergegeben werden.

    • Wählen Sie einen von Ihnen erstellten Vektorspeicher aus — Wählen Sie den Service aus, der eine Vektordatenbank enthält, die Sie bereits erstellt haben. Füllen Sie die Felder aus, damit Amazon Bedrock Informationen aus der Wissensdatenbank Ihrer Datenbank zuordnen kann, sodass es diese Einbettungen speichern, aktualisieren und verwalten kann. Weitere Informationen darüber, wie diese Felder den von Ihnen erstellten Feldern zugeordnet werden, finden Sie unterRichten Sie einen Vektorindex für Ihre Wissensdatenbank in einem unterstützten Vektorspeicher ein.

      Anmerkung

      Wenn Sie eine Datenbank in Amazon OpenSearch Serverless, Amazon Aurora oder MongoDB Atlas verwenden, müssen Sie zuvor die Felder unter Feldzuordnung konfiguriert haben. Wenn Sie eine Datenbank in Pinecone oder verwendenRedis Enterprise Cloud, können Sie hier Namen für diese Felder angeben und Amazon Bedrock erstellt sie dynamisch im Vector Store für Sie.

  8. Klicken Sie auf Weiter.

  9. Prüfen Sie auf der Seite Überprüfen und erstellen die Konfiguration und die Details Ihrer Wissensdatenbank. Wählen Sie in einem Abschnitt, den Sie ändern müssen, die Option Bearbeiten aus. Wenn Sie mit den Änderungen zufrieden sind, wählen Sie Wissensdatenbank erstellen aus.

  10. Die Zeit, die zum Erstellen der Wissensdatenbank benötigt wird, hängt von der Menge der von Ihnen bereitgestellten Daten ab. Wenn die Erstellung der Wissensdatenbank abgeschlossen ist, ändert sich der Status der Wissensdatenbank in Bereit.

API

Um eine Wissensdatenbank zu erstellen, senden Sie eine CreateKnowledgeBaseAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock und geben Sie den Namen, die Beschreibung, die Anweisungen für die Ausführung und das Basismodell für die Orchestrierung an.

Anmerkung

Wenn Sie es vorziehen, Amazon Bedrock einen Vector Store für Sie in Amazon OpenSearch Service erstellen und verwalten zu lassen, verwenden Sie die Konsole. Weitere Informationen finden Sie unter Erstellen einer Wissensdatenbank.

  • Stellen Sie ARN ihnen die Berechtigungen zur Erstellung einer Wissensdatenbank vor roleArn Ort zur Verfügung.

  • Geben Sie das Einbettungsmodell an, das im Feld embeddingModelArn im Objekt knowledgeBaseConfiguration verwendet werden soll.

  • Geben Sie die Konfiguration für Ihren Vektorspeicher im Objekt storageConfiguration an. Weitere Informationen finden Sie unter Richten Sie einen Vektorindex für Ihre Wissensdatenbank in einem unterstützten Vektorspeicher ein

    • Verwenden Sie für eine Amazon OpenSearch Service-Datenbank das opensearchServerlessConfiguration Objekt.

    • Verwenden Sie für eine Pinecone Datenbank das pineconeConfiguration Objekt.

    • Verwenden Sie für eine Redis Enterprise Cloud Datenbank das redisEnterpriseCloudConfiguration Objekt.

    • Verwenden Sie das rdsConfiguration Objekt für eine Amazon Aurora Aurora-Datenbank.

    • Verwenden Sie für eine MongoDB Atlas-Datenbank das mongodbConfiguration Objekt.

Nachdem Sie eine Wissensdatenbank erstellt haben, erstellen Sie eine Datenquelle, die die Dokumente oder Inhalte für Ihre Wissensdatenbank enthält. Senden Sie eine CreateDataSourceAnfrage, um die Datenquelle zu erstellen. Informationen zur Auswahl Ihrer Datenquelle finden Sie unter Unterstützte Datenquellen und folgen Sie dem Beispiel für die API Verbindungskonfiguration.

  • Geben Sie die Verbindungsinformationen für die Datenquellendateien in das dataSourceConfiguration Feld ein.

  • Geben Sie an, wie die Datenquellen im vectorIngestionConfiguration Feld aufgeteilt werden sollen.

    Anmerkung

    Sie können die Chunking-Konfiguration nicht ändern, nachdem Sie die Datenquelle erstellt haben.

  • Geben Sie das dataDeletionPolicy für Ihre Datenquelle an. Sie können DELETE alle Daten aus Ihrer Datenquelle verwenden, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen umgewandelt wurden. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird. Sie können RETAIN alle Daten aus Ihrer Datenquelle verwenden, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen konvertiert wurden. Beachten Sie, dass der Vektorspeicher selbst nicht gelöscht wird, wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen.

  • (Optional) Bei der Konvertierung Ihrer Daten in Einbettungen verschlüsselt Amazon Bedrock Ihre Daten standardmäßig mit einem Schlüssel, der AWS Eigentümer und Verwalter ist. Um Ihren eigenen KMS Schlüssel zu verwenden, fügen Sie ihn in das Objekt ein. serverSideEncryptionConfiguration Weitere Informationen finden Sie unter Verschlüsselung von Wissensdatenbankressourcen.

Richten Sie Sicherheitskonfigurationen für Ihre Wissensdatenbank ein

Nachdem Sie eine Wissensdatenbank erstellt haben, müssen Sie möglicherweise die folgenden Sicherheitskonfigurationen einrichten:

Richten Sie Datenzugriffsrichtlinien für Ihre Wissensdatenbank ein

Wenn Sie eine benutzerdefinierte Rolle verwenden, richten Sie Sicherheitskonfigurationen für Ihre neu erstellte Wissensdatenbank ein. Wenn Sie Amazon Bedrock eine Servicerolle für Sie erstellen lassen, können Sie diesen Schritt überspringen. Folgen Sie den Schritten auf der Registerkarte, die der Datenbank entspricht, die Sie eingerichtet haben.

Amazon OpenSearch Serverless

Um den Zugriff auf die Amazon OpenSearch Serverless-Sammlung auf die Knowledge-Base-Servicerolle zu beschränken, erstellen Sie eine Datenzugriffsrichtlinie. Sie können dies auf folgende Weise tun:

Verwenden Sie die folgende Datenzugriffsrichtlinie, in der Sie die Amazon OpenSearch Serverless-Sammlung und Ihre Servicerolle angeben:

[ { "Description": "${data access policy description}", "Rules": [ { "Resource": [ "index/${collection_name}/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}:role/${kb-service-role}" ] } ]
Pinecone, Redis Enterprise Cloud or MongoDB Atlas

Um einenPinecone,Redis Enterprise Cloud, MongoDB Atlas-Vektorindex zu integrieren, fügen Sie Ihrer Wissensdatenbankdienstrolle die folgende identitätsbasierte Richtlinie hinzu, damit sie auf das AWS Secrets Manager Geheimnis für den Vektorindex zugreifen kann.

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::${region}:${account-id}:secret:${secret-id}" } } }] }

Richten Sie Netzwerkzugriffsrichtlinien für Ihre Amazon OpenSearch Serverless-Wissensdatenbank ein

Wenn Sie eine private Amazon OpenSearch Serverless-Sammlung für Ihre Wissensdatenbank verwenden, kann nur über einen AWS PrivateLink VPC Endpunkt darauf zugegriffen werden. Sie können eine private Amazon OpenSearch Serverless-Sammlung erstellen, wenn Sie Ihre Amazon OpenSearch Serverless-Vektorsammlung einrichten, oder Sie können eine bestehende Amazon OpenSearch Serverless-Sammlung (einschließlich einer, die von der Amazon Bedrock-Konsole für Sie erstellt wurde) privat machen, wenn Sie deren Netzwerkzugriffsrichtlinie konfigurieren.

Die folgenden Ressourcen im Amazon OpenSearch Service Developer Guide helfen Ihnen dabei, die Einrichtung zu verstehen, die für private Amazon OpenSearch Serverless-Sammlungen erforderlich ist:

Um einer Amazon Bedrock-Wissensdatenbank den Zugriff auf eine private Amazon OpenSearch Serverless-Sammlung zu ermöglichen, müssen Sie die Netzwerkzugriffsrichtlinie für die Amazon OpenSearch Serverless-Sammlung bearbeiten, um Amazon Bedrock als Quellservice zuzulassen. Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten.

Console
  1. Öffnen Sie die Amazon OpenSearch Service-Konsole unter https://console.aws.amazon.com/aos/.

  2. Wählen Sie im linken Navigationsbereich Sammlungen aus. Wählen Sie dann Ihre Sammlung aus.

  3. Wählen Sie im Bereich Netzwerk die zugehörige Richtlinie aus.

  4. Wählen Sie Edit (Bearbeiten) aus.

  5. Führen Sie unter Methode zur Richtliniendefinition auswählen einen der folgenden Schritte aus:

    • Belassen Sie die Option Methode zur Richtliniendefinition auswählen auf Visueller Editor und konfigurieren Sie die folgenden Einstellungen im Abschnitt Regel 1:

      1. (Optional) Geben Sie im Feld Regelname einen Namen für die Netzwerkzugriffsregel ein.

      2. Wählen Sie unter Zugriff auf Sammlungen von die Option Privat (empfohlen) aus.

      3. Wählen Sie AWS Dienst mit privatem Zugriff aus. Geben Sie in das Textfeld einbedrock.amazonaws.com.

      4. Deaktivieren Sie die Option Zugriff auf OpenSearch Dashboards aktivieren.

    • Wählen Sie die folgende Richtlinie aus JSONund fügen Sie sie in den JSON Editor ein.

      [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
  6. Wählen Sie Aktualisieren.

API

Gehen Sie wie folgt vor, um die Netzwerkzugriffsrichtlinie für OpenSearch Ihre Amazon Serverless-Sammlung zu bearbeiten:

  1. Senden Sie eine GetSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie den Typ name der Richtlinie an und geben Sie den Namen type als network an. Beachten Sie die policyVersion in der Antwort.

  2. Senden Sie eine UpdateSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie mindestens die folgenden Felder an:

    Feld Beschreibung
    name Der Name der Richtlinie.
    policyVersion Sie sind von der GetSecurityPolicy Antwort zu Ihnen policyVersion zurückgekehrt.
    Typ Der Typ der Sicherheitsrichtlinie. Geben Sie an network.
    policy Die zu verwendende Richtlinie. Geben Sie das folgende JSON Objekt an
    [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]

Ein AWS CLI Beispiel finden Sie unter Datenzugriffsrichtlinien erstellen (AWS CLI).

  • Verwenden Sie die Amazon OpenSearch Service-Konsole, indem Sie den Schritten unter Netzwerkrichtlinien erstellen (Konsole) folgen. Anstatt eine Netzwerkrichtlinie zu erstellen, notieren Sie sich die zugehörige Richtlinie im Unterabschnitt Netzwerk der Erfassungsdetails.