Connect zu Confluence her, um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Connect zu Confluence her, um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten

Atlassian Confluence ist ein kollaboratives Arbeitsmanagement-Tool, das für die gemeinsame Nutzung, Speicherung und Bearbeitung von Projekten, Softwareentwicklung und Produktmanagement entwickelt wurde. Sie können eine Verbindung zu Ihrer Confluence-Instance für Ihre Amazon Bedrock-Wissensdatenbank herstellen, indem Sie entweder die AWS Management Console für Amazon Bedrock oder die CreateDataSourceAPI(siehe Amazon Bedrock unterstützt und) verwenden. SDKs AWS CLI

Anmerkung

Der Confluence-Datenquellen-Connector befindet sich in der Vorschauversion und kann sich ändern.

Confluence-Datenquellen unterstützen keine multimodalen Daten wie Tabellen, Diagramme, Diagramme oder andere Bilder.

Amazon Bedrock unterstützt die Verbindung zu Confluence Cloud-Instanzen. Derzeit ist nur Amazon OpenSearch Serverless Vector Store für die Verwendung mit dieser Datenquelle verfügbar.

Es gibt Beschränkungen für die Anzahl der Dateien und MB pro Datei, die gecrawlt werden können. Informationen zu Wissensdatenbanken finden Sie unter Kontingente.

Unterstützte Features

  • Automatische Erkennung der wichtigsten Dokumentfelder

  • Inhaltsfilter zum Einschließen/Ausschließen

  • Inkrementelle Inhaltssynchronisierung für hinzugefügte, aktualisierte und gelöschte Inhalte

  • OAuth2.0-Authentifizierung, Authentifizierung mit Confluence-Token API

Voraussetzungen

Stellen Sie in Confluence sicher, dass Sie:

  • Notieren Sie sich Ihre Confluence-Instanz. URL Zum Beispiel für Confluence Cloud,. https://example.atlassian.net Das URL für Confluence Cloud muss die Basis sein, URL endend mit. .atlassian.net

  • Konfigurieren Sie grundlegende Authentifizierungsdaten, die einen Benutzernamen (E-Mail des Administratorkontos) und ein Passwort (APIConfluence-Token) enthalten, damit Amazon Bedrock eine Verbindung zu Ihrer Confluence Cloud-Instanz herstellen kann. Informationen zur Erstellung eines API Confluence-Tokens findest du unter Tokens für dein Atlassian-Konto verwalten auf der API Atlassian-Website.

  • (Optional) Konfiguriere eine OAuth 2.0-Anwendung mit den Anmeldeinformationen eines App-Schlüssels, eines geheimen App-Schlüssels, eines Zugriffstokens und eines Aktualisierungstokens. Weitere Informationen findest du unter OAuth2.0-Apps auf der Atlassian-Website.

  • Bestimmte Leseberechtigungen oder Bereiche müssen aktiviert sein, damit deine OAuth 2.0-App eine Verbindung zu Confluence herstellen kann.

    Confluence: API

    • offline_access

    • read:content:confluence — Detaillierte Inhalte anzeigen

    • read:content-details:confluence — Inhaltsdetails anzeigen

    • read:space-details:confluence — Bereichsdetails anzeigen

    • read:audit-log:confluence — Audit-Aufzeichnungen anzeigen

    • read:page:confluence — Seiten anzeigen

    • read:attachment:confluence — Inhaltsanhänge ansehen und herunterladen

    • read:blogpost:confluence — Blogbeiträge ansehen

    • read:custom-content:confluence — Benutzerdefinierten Inhalt anzeigen

    • read:comment:confluence — Kommentare anzeigen

    • read:template:confluence — Inhaltsvorlagen anzeigen

    • read:label:confluence — Labels anzeigen

    • read:watcher:confluence — Inhaltsbeobachter anzeigen

    • read:relation:confluence — Entitätsbeziehungen anzeigen

    • read:user:confluence — Benutzerdetails anzeigen

    • read:configuration:confluence — Confluence-Einstellungen anzeigen

    • read:space:confluence — Space-Details anzeigen

    • read:space.property:confluence — Raumeigenschaften anzeigen

    • read:user.property:confluence — Benutzereigenschaften anzeigen

    • read:space.setting:confluence — Bereichseinstellungen anzeigen

    • read:analytics.content:confluence — Analytik für Inhalte anzeigen

    • read:content.property:confluence — Inhaltseigenschaften anzeigen

    • read:content.metadata:confluence — Inhaltszusammenfassungen anzeigen

    • read:inlinetask:confluence — Aufgaben anzeigen

    • read:task:confluence — Aufgaben anzeigen

    • read:whiteboard:confluence — Whiteboards anzeigen

    • read:app-data:confluence — App-Daten lesen

    • read:folder:confluence — Ordner anzeigen

    • read:embed:confluence — Smart Link-Daten anzeigen

Stellen Sie in Ihrem Konto sicher, dass Sie AWS :

  • Speichern Sie Ihre Authentifizierungsdaten AWS Secrets Manager geheim und notieren Sie sich den Amazon-Ressourcennamen (ARN) des Geheimnisses. Folgen Sie den Anweisungen zur Verbindungskonfiguration auf dieser Seite, um die Schlüssel-Wert-Paare aufzunehmen, die in Ihrem Geheimnis enthalten sein müssen.

  • Nehmen Sie die erforderlichen Berechtigungen für die Verbindung mit Ihrer Datenquelle in Ihre AWS Identity and Access Management (IAM) Rollen-/Berechtigungsrichtlinie für Ihre Wissensdatenbank auf. Informationen zu den erforderlichen Berechtigungen für diese Datenquelle, um sie Ihrer IAM Wissensdatenbank-Rolle hinzuzufügen, finden Sie unter Berechtigungen für den Zugriff auf Datenquellen.

Anmerkung

Wenn Sie die Konsole verwenden, können Sie Ihr Geheimnis AWS Secrets Manager hinzufügen oder ein vorhandenes Geheimnis als Teil des Konfigurationsschritts für die Datenquelle verwenden. Die IAM Rolle mit allen erforderlichen Berechtigungen kann im Rahmen der Konsolenschritte zum Erstellen einer Wissensdatenbank für Sie erstellt werden. Nachdem Sie Ihre Datenquelle und andere Konfigurationen konfiguriert haben, wird die IAM Rolle mit allen erforderlichen Berechtigungen auf Ihre spezifische Wissensdatenbank angewendet.

Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten in verschiedenen Datenquellen wiederzuverwenden.

Konfiguration der Verbindung

Um eine Verbindung zu Ihrer Confluence-Instance herzustellen, müssen Sie die erforderlichen Konfigurationsinformationen angeben, damit Amazon Bedrock auf Ihre Daten zugreifen und sie crawlen kann. Sie müssen auch dem folgen. Voraussetzungen

Ein Beispiel für eine Konfiguration für diese Datenquelle ist in diesem Abschnitt enthalten.

Weitere Informationen zur auto Erkennung von Dokumentfeldern, Einschluss-/Ausschlussfiltern, inkrementeller Synchronisierung, geheimen Authentifizierungsdaten und deren Funktionsweise finden Sie unter:

Der Datenquellen-Connector erkennt und crawlt automatisch alle wichtigen Metadatenfelder Ihrer Dokumente oder Inhalte. Der Datenquellen-Connector kann beispielsweise den Dokumenttext durchsuchen, der Ihren Dokumenten entspricht, den Dokumenttitel, das Erstellungs- oder Änderungsdatum des Dokuments oder andere Kernfelder, die möglicherweise auf Ihre Dokumente zutreffen.

Wichtig

Wenn Ihr Inhalt vertrauliche Informationen enthält, Amazon Bedrock könnten Sie mit vertraulichen Informationen antworten.

Sie können Filteroperatoren auf Metadatenfelder anwenden, um die Relevanz von Antworten weiter zu verbessern. Zum Beispiel das Dokument „epoch_modification_time“ oder die Anzahl der Sekunden, die seit dem 1. Januar 1970 vergangen sind, als das Dokument zuletzt aktualisiert wurde. Sie können nach den neuesten Daten filtern, wobei „epoch_modification_time“ größer als eine bestimmte Zahl ist. Weitere Informationen zu den Filteroperatoren, die Sie auf Ihre Metadatenfelder anwenden können, finden Sie unter Metadaten und Filterung.

Sie können das Crawlen bestimmter Inhalte ein- oder ausschließen. Sie können beispielsweise ein prefix/regular expression pattern to skip crawling any file that contains “private” in the file name. You could also specify an inclusion prefix/regular Ausschlussausdrucksmuster angeben, um bestimmte Inhaltsentitäten oder Inhaltstypen einzubeziehen. Wenn Sie einen Inklusions- und Ausschlussfilter angeben und beide einem Dokument entsprechen, hat der Ausschlussfilter Vorrang und das Dokument wird nicht gecrawlt.

Ein Beispiel für ein Muster mit regulären Ausdrücken zum Ausschließen oder Herausfiltern von PDF Dateien, die „privat“ im Dateinamen enthalten:“. *private.*\\ .pdf

Sie können Einschluss-/Ausschlussfilter auf die folgenden Inhaltstypen anwenden:

  • Space: Eindeutige Leertaste

  • Page: Titel der Hauptseite

  • Blog: Titel des Hauptblogs

  • Comment: Kommentare, die zu einer bestimmten Seite oder einem bestimmten Blog gehören. Angeben der Re: Page/Blog Title

  • Attachment: Name der Anhangsdatei mit ihrer Erweiterung

Der Datenquellen-Connector crawlt bei jeder Synchronisierung Ihrer Datenquelle mit Ihrer Wissensdatenbank neue, geänderte und gelöschte Inhalte. Amazon Bedrock kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu crawlen, die sich seit der letzten Synchronisierung geändert haben. Wenn Sie Ihre Datenquelle zum ersten Mal mit Ihrer Wissensdatenbank synchronisieren, werden alle Inhalte standardmäßig gecrawlt.

Um Ihre Datenquelle mit Ihrer Wissensdatenbank zu synchronisieren, verwenden Sie die StartIngestionJobAPIoder wählen Sie Ihre Wissensdatenbank in der Konsole aus und wählen Sie im Bereich Datenquellenübersicht die Option Synchronisieren aus.

Wichtig

Alle Daten, die Sie aus Ihrer Datenquelle synchronisieren, stehen allen Personen zur Verfügung, die zum bedrock:Retrieve Abrufen der Daten berechtigt sind. Dies kann auch alle Daten mit kontrollierten Datenquellenberechtigungen einschließen. Weitere Informationen finden Sie unter Knowledgebase-Berechtigungen.

(Wenn Sie die Standardauthentifizierung verwenden) Ihre geheimen Authentifizierungsdaten AWS Secrets Manager sollten die folgenden Schlüssel-Wert-Paare enthalten:

  • username: admin user email address of Atlassian account

  • password: Confluence API token

(Wenn Sie die OAuth 2.0-Authentifizierung verwenden) Ihre geheimen Authentifizierungsdaten AWS Secrets Manager sollten die folgenden Schlüssel-Wert-Paare enthalten:

  • confluenceAppKey: app key

  • confluenceAppSecret: app secret

  • confluenceAccessToken: app access token

  • confluenceRefreshToken: app refresh token

Anmerkung

Das Confluence OAuth2 2.0-Zugriffstoken hat eine standardmäßige Ablaufzeit von 60 Minuten. Wenn dieses Token abläuft, während Ihre Datenquelle synchronisiert wird (Synchronisierungsjob), verwendet Amazon Bedrock das bereitgestellte Aktualisierungstoken, um dieses Token neu zu generieren. Bei dieser Regenerierung werden sowohl die Zugriffs- als auch die Aktualisierungstoken aktualisiert. Um die Token vom aktuellen Synchronisierungsauftrag bis zum nächsten Synchronisierungsauftrag auf dem neuesten Stand zu halten, benötigt Amazon Bedrock im Rahmen Ihrer Wissensdatenbank-Rolle Schreib- und Schreibberechtigungen für Ihre geheimen Anmeldeinformationen. IAM

Anmerkung

Ihr Secret in AWS Secrets Manager muss dieselbe Region Ihrer Wissensdatenbank verwenden.

Console
Connect eine Confluence-Instanz mit deiner Wissensdatenbank
  1. Folgen Sie den Schritten unter Erstellen Sie eine Wissensdatenbank in Amazon Bedrock Knowledge Bases und wählen Sie Confluence als Datenquelle.

  2. Geben Sie einen Namen und optional eine Beschreibung für die Datenquelle an.

  3. Geben Sie Ihre Confluence-Instanz an. URL Zum Beispiel für Confluence Cloud,. https://example.atlassian.net Das URL für Confluence Cloud muss die Basis sein, URL endend mit. .atlassian.net

  4. Im Bereich Erweiterte Einstellungen können Sie optional Folgendes konfigurieren:

    • KMSSchlüssel für die Speicherung transienter Daten. — Sie können die transienten Daten verschlüsseln und gleichzeitig Ihre Daten mit dem Standard Von AWS verwalteter Schlüssel - oder Ihrem eigenen Schlüssel in Einbettungen konvertieren. KMS Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.

    • Richtlinie zum Löschen von Daten — Sie können die Vektoreinbettungen für Ihre Datenquelle löschen, die standardmäßig im Vektorspeicher gespeichert sind, oder sich dafür entscheiden, die Vektorspeicherdaten beizubehalten.

  5. Geben Sie die Authentifizierungsinformationen ein, um eine Verbindung zu Ihrer Confluence-Instanz herzustellen:

    • Gehen Sie für die Standardauthentifizierung AWS Secrets Manager zu, um Ihre geheimen Authentifizierungsdaten hinzuzufügen, oder verwenden Sie einen vorhandenen Amazon-Ressourcennamen (ARN) für das von Ihnen erstellte Geheimnis. Dein Secret muss die Admin-Benutzer-E-Mail-Adresse des Atlassian-Kontos als Benutzernamen und ein API Confluence-Token anstelle eines Passworts enthalten. Informationen zur Erstellung eines API Confluence-Tokens findest du unter Tokens für dein Atlassian-Konto verwalten API auf der Atlassian-Website.

    • Gehen Sie für die OAuth 2.0-Authentifizierung zu, AWS Secrets Manager um Ihre geheimen Authentifizierungsdaten hinzuzufügen, oder verwenden Sie einen vorhandenen Amazon-Ressourcennamen (ARN) für das von Ihnen erstellte Geheimnis. Ihr Geheimnis muss den Confluence-App-Schlüssel, den geheimen App-Schlüssel, das Zugriffstoken und das Aktualisierungstoken enthalten. Weitere Informationen findest du unter OAuth2.0-Apps auf der Atlassian-Website.

  6. (Optional) Im Bereich Inhaltsanalyse und Chunking kannst du anpassen, wie deine Daten analysiert und aufgeteilt werden sollen. Weitere Informationen zu diesen Anpassungen finden Sie in den folgenden Ressourcen:

  7. Wählen Sie, ob Sie Filter oder Muster mit regulären Ausdrücken verwenden möchten, um bestimmte Inhalte ein- oder auszuschließen. Andernfalls werden alle Standardinhalte gecrawlt.

  8. Wählen Sie weiterhin ein Einbettungsmodell und einen Vektorspeicher aus. Um die verbleibenden Schritte zu sehen, kehren Sie zu dem Schritt zurück, nachdem Sie Ihre Datenquelle verbunden haben, Erstellen Sie eine Wissensdatenbank in Amazon Bedrock Knowledge Bases und fahren Sie mit diesem fort.

API

Im Folgenden finden Sie ein Beispiel für eine Konfiguration für die Verbindung mit Confluence Cloud für Ihre Amazon Bedrock-Wissensdatenbank. Sie konfigurieren Ihre Datenquelle mithilfe von API mit AWS CLI oder unterstütztSDK, z. B. Python. Nach dem Aufrufen rufen Sie an CreateKnowledgeBase, CreateDataSourceum Ihre Datenquelle mit Ihren Verbindungsinformationen zu erstellendataSourceConfiguration.

Weitere Informationen zu Anpassungen, die Sie bei der Datenerfassung vornehmen können, indem Sie das optionale vectorIngestionConfiguration Feld einbeziehen, finden Sie unter. Passen Sie die Aufnahme für eine Datenquelle an

AWS Command Line Interface

aws bedrock create-data-source \ --name "Confluence Cloud/SaaS connector" \ --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://confluence-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE" \ --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}' confluence-bedrock-connector-configuration.json { "confluenceConfiguration": { "sourceConfiguration": { "hostUrl": "https://example.atlassian.net", "hostType": "SAAS", "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "Attachment", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "CONFLUENCE" }