Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie eine Amazon Bedrock-Wissensdatenbank
Sie können eine Amazon Bedrock-Wissensdatenbank einrichten, um Informationen aus Ihren eigenen Daten abzurufen und Antworten auf Fragen in natürlicher Sprache zu generieren. Im Rahmen der Erstellung einer Wissensdatenbank konfigurieren Sie eine Datenquelle und einen Vektorspeicher Ihrer Wahl.
Anmerkung
Sie können keine Wissensdatenbank mit einem Root-Benutzer erstellen. Melden Sie sich mit einem IAM Benutzer an, bevor Sie mit diesen Schritten beginnen.
Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten:
- Console
-
So erstellen Sie eine Wissensdatenbank
-
Melden Sie sich als Benutzer mit IAM Amazon Bedrock-Berechtigungen an und öffnen Sie die Amazon Bedrock-Konsole AWS Management Console unter. https://console.aws.amazon.com/bedrock/
-
Wählen Sie im linken Navigationsbereich Wissensdatenbanken aus.
-
Wählen Sie im Abschnitt Wissensdatenbanken die Option Wissensdatenbank erstellen aus.
-
Richten Sie auf der Seite Wissensdatenbank-Details bereitstellen die folgenden Konfigurationen ein:
-
(Optional) Ändern Sie im Abschnitt Wissensdatenbank-Details den Standardnamen und geben Sie eine Beschreibung für Ihre Wissensdatenbank ein.
-
Wählen Sie im Abschnitt IAMBerechtigungen eine Rolle AWS Identity and Access Management (IAM) aus, die Amazon Bedrock die Berechtigung zum Zugriff auf andere AWS Dienste gewährt. Sie können Amazon Bedrock die Servicerolle erstellen lassen oder eine benutzerdefinierte Rolle auswählen, die Sie erstellt haben.
-
(Optional) Fügen Sie Ihrer Wissensdatenbank Tags hinzu. Weitere Informationen finden Sie unter Taggen von Amazon Bedrock-Ressourcen.
-
Klicken Sie auf Weiter.
-
-
Wählen Sie auf der Seite Datenquelle auswählen die Datenquelle aus, die Sie für die Wissensdatenbank verwenden möchten:
-
Folgen Sie den Schritten zur Verbindungskonfiguration für Ihre ausgewählte Datenquelle. Informationen zur Auswahl Ihrer Datenquelle finden Sie unter Unterstützte Datenquellen und folgen Sie den Schritten zur Konfiguration der Konsolenverbindung.
-
(Optional) Um die folgenden erweiterten Einstellungen als Teil der Datenquellenkonfiguration zu konfigurieren, erweitern Sie den Abschnitt Erweiterte Einstellungen — optional.
Für KMS key Einstellungen können Sie entweder einen benutzerdefinierten Schlüssel wählen oder den standardmäßig bereitgestellten Datenverschlüsselungsschlüssel verwenden.
Bei der Konvertierung Ihrer Daten in Einbettungen werden Ihre transienten Daten standardmäßig mit einem Schlüssel Amazon Bedrock verschlüsselt, der AWS Eigentümer und Verwalter ist. Sie können Ihren eigenen Schlüssel verwenden. KMS Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.
Für die Richtlinieneinstellungen zum Löschen von Daten können Sie eine der folgenden Optionen wählen:
-
Löschen: Löscht alle Daten aus Ihrer Datenquelle, die beim Löschen einer Wissensdatenbank- oder Datenquellenressource in Vektoreinbettungen konvertiert wurden. Beachten Sie, dass nicht der Vektorspeicher selbst gelöscht wird, sondern nur die Daten. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird.
-
Beibehalten: Behält alle Daten aus Ihrer Datenquelle bei, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen umgewandelt wurden. Beachten Sie, dass der Vektorspeicher selbst nicht gelöscht wird, wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen.
-
-
Um die folgenden Einstellungen für das Aufteilen und Analysieren von Inhalten als Teil der Datenquellenkonfiguration zu konfigurieren, wechseln Sie zum Abschnitt Inhaltsaufteilung und -analyse.
Wählen Sie eine der folgenden Optionen für das Chunking:
-
Chunking mit fester Größe: Inhalt, aufgeteilt in Textblöcke mit der von Ihnen festgelegten ungefähren Token-Größe. Sie können die maximale Anzahl von Tokens festlegen, die für einen Abschnitt nicht überschritten werden darf, und den Prozentsatz der Überlappungen zwischen aufeinanderfolgenden Blöcken festlegen.
-
Standard-Chunking: Inhalt wird in Textblöcke von bis zu 300 Tokens aufgeteilt. Wenn ein einzelnes Dokument oder ein Inhalt weniger als 300 Token enthält, wird das Dokument nicht weiter aufgeteilt.
-
Hierarchisches Chunking: Inhalt, der in verschachtelten Strukturen aus über- und untergeordneten Blöcken organisiert ist. Sie legen die maximale Größe des übergeordneten Chunk-Tokens und die maximale Größe des untergeordneten Chunk-Tokens fest. Sie legen auch die absolute Anzahl von Überlappungstoken zwischen aufeinanderfolgenden übergeordneten Chunks und aufeinanderfolgenden untergeordneten Chunks fest.
-
Semantisches Chunking: Inhalt, der in semantisch ähnliche Textblöcke oder Satzgruppen unterteilt ist. Sie legen die maximale Anzahl von Sätzen fest, die den Ziel-/aktuellen Satz umgeben, die gruppiert werden sollen (Puffergröße). Sie legen auch den Schwellenwert für das Perzentil am Breakpoint fest, um den Text in sinnvolle Abschnitte zu unterteilen. Beim semantischen Chunking wird ein Basismodell verwendet. Informationen zu den Kosten von Foundation-Modellen finden Sie in der Amazon Bedrock Preisübersicht
. -
Kein Chunting: Jedes Dokument wird als einzelner Textblock behandelt. Möglicherweise möchten Sie Ihre Dokumente vorab verarbeiten, indem Sie sie in separate Dateien aufteilen.
Anmerkung
Sie können die Chunking-Strategie nicht ändern, nachdem Sie die Datenquelle erstellt haben.
Sie können das Basismodell für Amazon Bedrock das Parsen von Dokumenten verwenden, um mehr als Standardtext zu analysieren. Sie können beispielsweise Tabellendaten innerhalb von Dokumenten analysieren, wobei deren Struktur intakt bleibt. Informationen zu den Kosten von Foundation-Modellen finden Sie in der Amazon Bedrock Preisübersicht
. Sie können eine AWS Lambda Funktion verwenden, um Ihre Chunking-Strategie und die Art und Weise, wie die Attribute/Felder Ihrer Dokumentmetadaten behandelt und aufgenommen werden, anzupassen. Geben Sie den Amazon S3 Bucket-Speicherort für die Eingabe und Ausgabe der Lambda-Funktion an.
-
-
Klicken Sie auf Weiter.
-
-
Wählen Sie auf der Seite Einbettungsmodell auswählen und Vektorspeicher konfigurieren ein unterstütztes Einbettungsmodell aus, um Ihre Daten in Vektoreinbettungen für die Wissensdatenbank umzuwandeln.
-
Wählen Sie im Bereich Vektorspeicher eine der folgenden Optionen aus, um die Vektoreinbettungen für Ihre Wissensdatenbank zu speichern:
-
Schnelles Erstellen eines neuen Vektorspeichers — Amazon Bedrock erstellt eine Amazon OpenSearch Serverless-Vektorsuchsammlung für Sie. Mit dieser Option werden für Sie eine öffentliche Vektorsuchsammlung und ein Vektorindex mit den erforderlichen Feldern und erforderlichen Konfigurationen eingerichtet. Nachdem die Sammlung erstellt wurde, können Sie sie in der Amazon OpenSearch Serverless-Konsole oder über die AWS API verwalten. Weitere Informationen finden Sie unter Arbeiten mit Vektorsuchsammlungen im Amazon OpenSearch Service Developer Guide. Wenn Sie diese Option auswählen, können Sie optional die folgenden Einstellungen aktivieren:
-
Um redundante aktive Replikate zu aktivieren, sodass die Verfügbarkeit Ihres Vector Stores im Falle eines Infrastrukturausfalls nicht beeinträchtigt wird, wählen Sie Redundanz aktivieren (aktive Replikate).
Anmerkung
Wir empfehlen, diese Option deaktiviert zu lassen, während Sie Ihre Wissensdatenbank testen. Wenn Sie für die Bereitstellung in der Produktion bereit sind, empfehlen wir, redundante aktive Replikate zu aktivieren. Informationen zur Preisgestaltung finden Sie unter Preise für Serverless OpenSearch
-
Um den automatisierten Vektorspeicher mit einem vom Kunden verwalteten Schlüssel zu verschlüsseln, wählen Sie Kundenverwalteten KMS Schlüssel für Amazon OpenSearch Serverless Vector hinzufügen — optional und wählen Sie den Schlüssel aus. Weitere Informationen finden Sie unter Verschlüsselung von Informationen, die an Amazon OpenSearch Service weitergegeben werden.
-
-
Wählen Sie einen von Ihnen erstellten Vector Store aus — Wählen Sie den Service für den Vector Store aus, den Sie bereits erstellt haben. Füllen Sie die Felder aus, damit Amazon Bedrock Informationen aus der Wissensdatenbank Ihrem Vektorspeicher zuordnen kann, sodass dieser Vektoreinbettungen speichern, aktualisieren und verwalten kann. Weitere Informationen zu den Feldern finden Sie unter Ihren eigenen unterstützten Vektorspeicher einrichten.
Anmerkung
Wenn Sie eine Datenbank in Amazon OpenSearch Serverless, Amazon Aurora oder MongoDB Atlas verwenden, müssen Sie zuvor die Felder unter Feldzuordnung konfiguriert haben. Wenn Sie eine Datenbank verwenden in Pinecone or Redis Enterprise Cloud, Sie können hier Namen für diese Felder angeben und Amazon Bedrock erstellt sie dynamisch im Vector Store für Sie.
-
-
Klicken Sie auf Weiter.
-
Prüfen Sie auf der Seite Überprüfen und erstellen die Konfiguration und die Details Ihrer Wissensdatenbank. Wählen Sie in einem Abschnitt, den Sie ändern möchten, die Option Bearbeiten aus. Wenn Sie mit den Änderungen zufrieden sind, wählen Sie Wissensdatenbank erstellen aus.
-
Die Zeit, die für die Erstellung der Wissensdatenbank benötigt wird, hängt von Ihren spezifischen Konfigurationen ab. Wenn die Erstellung der Wissensdatenbank abgeschlossen ist, ändert sich der Status der Wissensdatenbank entweder in den Status „Bereit“ oder „Verfügbar“.
-
- API
-
Um eine Wissensdatenbank zu erstellen, senden Sie eine CreateKnowledgeBaseAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock und geben Sie den Namen, die Beschreibung, die Anweisungen für die Ausführung und das Basismodell für die Orchestrierung an.
Anmerkung
Wenn Sie es vorziehen, Amazon Bedrock einen Vector Store für Sie in Amazon OpenSearch Service erstellen und verwalten zu lassen, verwenden Sie die Konsole. Weitere Informationen finden Sie unter Erstellen Sie eine Amazon Bedrock-Wissensdatenbank.
-
Stellen Sie ARN ihnen die Berechtigungen zur Erstellung einer Wissensdatenbank vor
roleArn
Ort zur Verfügung. -
Geben Sie das Modell für Vektoreinbettungen an, das im
embeddingModelArn
Feld im Objekt verwendet werden soll.knowledgeBaseConfiguration
Wissensdatenbanken finden Sie unter Unterstützte Modelle.Sie müssen den Modellzugriff aktivieren, um ein Modell verwenden zu können, das für Wissensdatenbanken unterstützt wird. Notieren Sie sich Ihr Modell Amazon Resource Name (ARN), das für die Konvertierung Ihrer Daten in Vektoreinbettungen erforderlich ist. Kopieren Sie die Modell-ID für das von Ihnen gewählte Modell für Wissensdatenbanken und erstellen Sie das Modell ARN anhand der Modell- (Ressourcen-) ID. Folgen Sie dabei den angegebenen ARNBeispielen für Ihren Modellressourcentyp.
-
Geben Sie die Konfiguration für Ihren Vektorspeicher im Objekt
storageConfiguration
an. Weitere Informationen finden Sie unter Voraussetzungen für einen eigenen Vector Store für eine Wissensdatenbank-
Verwenden Sie für eine Amazon OpenSearch Service-Datenbank das
opensearchServerlessConfiguration
Objekt. -
Für ein Pinecone Datenbank, benutze das
pineconeConfiguration
Objekt. -
Für ein Redis Enterprise Cloud Datenbank, benutze das
redisEnterpriseCloudConfiguration
Objekt. -
Verwenden Sie das
rdsConfiguration
Objekt für eine Amazon Aurora Aurora-Datenbank. -
Verwenden Sie für eine MongoDB Atlas-Datenbank das
mongodbConfiguration
Objekt.
-
Nachdem Sie eine Wissensdatenbank erstellt haben, erstellen Sie eine Datenquelle, die die Dokumente oder Inhalte für Ihre Wissensdatenbank enthält. Senden Sie eine CreateDataSourceAnfrage, um die Datenquelle zu erstellen. Informationen zur Auswahl Ihrer Datenquelle finden Sie unter Unterstützte Datenquellen und folgen Sie dem Beispiel für die API Verbindungskonfiguration.
-
Geben Sie die Verbindungsinformationen für die Datenquellendateien in das
dataSourceConfiguration
Feld ein. -
Geben Sie an, wie die Datenquellen im
vectorIngestionConfiguration
Feld aufgeteilt werden sollen.Anmerkung
Sie können die Chunking-Konfiguration nicht ändern, nachdem Sie die Datenquelle erstellt haben.
-
Geben Sie das
dataDeletionPolicy
für Ihre Datenquelle an. Sie könnenDELETE
alle Daten aus Ihrer Datenquelle verwenden, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen umgewandelt wurden. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird. Sie könnenRETAIN
alle Daten aus Ihrer Datenquelle verwenden, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen konvertiert wurden. Beachten Sie, dass der Vektorspeicher selbst nicht gelöscht wird, wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen. -
(Optional) Bei der Konvertierung Ihrer Daten in Einbettungen verschlüsselt Amazon Bedrock Ihre Daten standardmäßig mit einem Schlüssel, der AWS Eigentümer und Verwalter ist. Um Ihren eigenen KMS Schlüssel zu verwenden, fügen Sie ihn in das Objekt ein.
serverSideEncryptionConfiguration
Weitere Informationen finden Sie unter Verschlüsselung von Wissensdatenbankressourcen.
-
Richten Sie Sicherheitskonfigurationen für Ihre Wissensdatenbank ein
Nachdem Sie eine Wissensdatenbank erstellt haben, müssen Sie möglicherweise die folgenden Sicherheitskonfigurationen einrichten:
Themen
Richten Sie Datenzugriffsrichtlinien für Ihre Wissensdatenbank ein
Wenn Sie eine benutzerdefinierte Rolle verwenden, richten Sie Sicherheitskonfigurationen für Ihre neu erstellte Wissensdatenbank ein. Wenn Sie Amazon Bedrock eine Servicerolle für Sie erstellen lassen, können Sie diesen Schritt überspringen. Folgen Sie den Schritten auf der Registerkarte, die der Datenbank entspricht, die Sie eingerichtet haben.
- Amazon OpenSearch Serverless
-
Um den Zugriff auf die Amazon OpenSearch Serverless-Sammlung auf die Knowledge-Base-Servicerolle zu beschränken, erstellen Sie eine Datenzugriffsrichtlinie. Sie können dies auf folgende Weise tun:
-
Verwenden Sie die Amazon OpenSearch Service-Konsole, indem Sie den Schritten unter Erstellen von Datenzugriffsrichtlinien (Konsole) im Amazon OpenSearch Service Developer Guide folgen.
-
Verwenden Sie das, AWS API indem Sie eine CreateAccessPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt senden. Ein AWS CLI Beispiel finden Sie unter Datenzugriffsrichtlinien erstellen (AWS CLI).
Verwenden Sie die folgende Datenzugriffsrichtlinie, in der Sie die Amazon OpenSearch Serverless-Sammlung und Ihre Servicerolle angeben:
[ { "Description": "
${data access policy description}
", "Rules": [ { "Resource": [ "index/${collection_name}
/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}
:role/${kb-service-role}
" ] } ] -
- Pinecone, Redis Enterprise Cloud or MongoDB Atlas
-
Um ein zu integrieren Pinecone, Redis Enterprise Cloud, MongoDB Atlas Vector Index, fügen Sie Ihrer Wissensdatenbank-Servicerolle die folgende identitätsbasierte Richtlinie hinzu, damit sie auf das AWS Secrets Manager Geheimnis für den Vektorindex zugreifen kann.
{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::
${region}
:${account-id}
:secret:${secret-id}
" } } }] }
Richten Sie Netzwerkzugriffsrichtlinien für Ihre Amazon OpenSearch Serverless-Wissensdatenbank ein
Wenn Sie eine private Amazon OpenSearch Serverless-Sammlung für Ihre Wissensdatenbank verwenden, kann nur über einen AWS PrivateLink VPC Endpunkt darauf zugegriffen werden. Sie können eine private Amazon OpenSearch Serverless-Sammlung erstellen, wenn Sie Ihre Amazon OpenSearch Serverless-Vektorsammlung einrichten, oder Sie können eine bestehende Amazon OpenSearch Serverless-Sammlung (einschließlich einer, die von der Amazon Bedrock-Konsole für Sie erstellt wurde) privat machen, wenn Sie deren Netzwerkzugriffsrichtlinie konfigurieren.
Die folgenden Ressourcen im Amazon OpenSearch Service Developer Guide helfen Ihnen dabei, die Einrichtung zu verstehen, die für private Amazon OpenSearch Serverless-Sammlungen erforderlich ist:
-
Weitere Informationen zum Einrichten eines VPC Endpunkts für eine private Amazon OpenSearch Serverless-Sammlung finden Sie unter Zugriff auf Amazon OpenSearch Serverless über einen Schnittstellenendpunkt ()AWS PrivateLink.
-
Weitere Informationen zu Netzwerkzugriffsrichtlinien in Amazon OpenSearch Serverless finden Sie unter Netzwerkzugriff für Amazon OpenSearch Serverless.
Um einer Amazon Bedrock-Wissensdatenbank den Zugriff auf eine private Amazon OpenSearch Serverless-Sammlung zu ermöglichen, müssen Sie die Netzwerkzugriffsrichtlinie für die Amazon OpenSearch Serverless-Sammlung bearbeiten, um Amazon Bedrock als Quellservice zuzulassen. Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten:
- Console
-
-
Öffnen Sie die Amazon OpenSearch Service-Konsole unter https://console.aws.amazon.com/aos/
. -
Wählen Sie im linken Navigationsbereich Sammlungen aus. Wählen Sie dann Ihre Sammlung aus.
-
Wählen Sie im Bereich Netzwerk die zugehörige Richtlinie aus.
-
Wählen Sie Edit (Bearbeiten) aus.
-
Führen Sie unter Methode zur Richtliniendefinition auswählen einen der folgenden Schritte aus:
-
Belassen Sie die Option Methode zur Richtliniendefinition auswählen auf Visueller Editor und konfigurieren Sie die folgenden Einstellungen im Abschnitt Regel 1:
-
(Optional) Geben Sie im Feld Regelname einen Namen für die Netzwerkzugriffsregel ein.
-
Wählen Sie unter Zugriff auf Sammlungen von die Option Privat (empfohlen) aus.
-
Wählen Sie AWS Dienst mit privatem Zugriff aus. Geben Sie in das Textfeld ein
bedrock.amazonaws.com
. -
Deaktivieren Sie die Option Zugriff auf OpenSearch Dashboards aktivieren.
-
-
Wählen Sie die folgende Richtlinie aus JSONund fügen Sie sie in den JSON Editor ein.
[ { "AllowFromPublic": false, "Description":"
${network access policy description}
", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}
" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
-
-
Wählen Sie Aktualisieren.
-
- API
-
Gehen Sie wie folgt vor, um die Netzwerkzugriffsrichtlinie für OpenSearch Ihre Amazon Serverless-Sammlung zu bearbeiten:
-
Senden Sie eine GetSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie den Typ
name
der Richtlinie an und geben Sie den Namentype
alsnetwork
an. Beachten Sie diepolicyVersion
in der Antwort. -
Senden Sie eine UpdateSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie mindestens die folgenden Felder an:
Feld Beschreibung name Der Name der Richtlinie. policyVersion Sie sind von der GetSecurityPolicy
Antwort zu IhnenpolicyVersion
zurückgekehrt.Typ Der Typ der Sicherheitsrichtlinie. Geben Sie an network
.policy Die zu verwendende Richtlinie. Geben Sie das folgende JSON Objekt an [ { "AllowFromPublic": false, "Description":"
${network access policy description}
", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}
" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
Ein AWS CLI Beispiel finden Sie unter Datenzugriffsrichtlinien erstellen (AWS CLI).
-
-
Verwenden Sie die Amazon OpenSearch Service-Konsole, indem Sie den Schritten unter Netzwerkrichtlinien erstellen (Konsole) folgen. Anstatt eine Netzwerkrichtlinie zu erstellen, notieren Sie sich die zugehörige Richtlinie im Unterabschnitt Netzwerk der Erfassungsdetails.