Amazon Bedrock ナレッジベースの Confluence に接続する
Atlassian Confluence は、プロジェクト計画、ソフトウェア開発、製品管理の共有、保存、作業を目的とした共同作業管理ツールです。Amazon Bedrock 用の AWS マネジメントコンソール
注記
Confluence データソースコネクタはプレビューリリースの段階であり、変更される可能性があります。
Amazon Bedrock は、Confluence Cloud インスタンスへの接続をサポートしています。現在、このデータソースで使用できるのは Amazon OpenSearch Serverless ベクトルストアのみです。
クロールできるファイル数とファイルあたりの MB に制限があります。「Quotas for knowledge bases」を参照してください。
サポートされている機能
-
メインドキュメントフィールドの自動検出
-
包含/除外コンテンツフィルター
-
追加、更新、削除されたコンテンツの増分同期
-
OAuth 2.0 認証、Confluence API トークンを使用した認証
前提条件
Confluence で以下を確認してください。
-
Confluence インスタンスの URL をメモします。例えば、Confluence Cloud の場合は、
https://example.atlassian.net
です。Confluence Cloud の URL は、.atlassian.net
で終わるベース URL である必要があります。 -
Amazon Bedrock が Confluence Cloud インスタンスに接続できるように、ユーザー名 (管理者アカウントの E メール) とパスワード (Confluence API トークン) を含む基本的な認証情報を設定します。Confluence API トークンの作成方法については、Atlassian ウェブサイトの「Manage API tokens for your Atlassian account
」を参照してください。 -
(オプション) アプリケーションキー、アプリケーションシークレット、アクセストークン、および更新トークンの認証情報を使用して OAuth 2.0 アプリケーションを設定します。詳細については、Atlassian ウェブサイトの「OAuth 2.0 apps
」を参照してください。 -
OAuth 2.0 アプリが Confluence に接続するには、特定の読み取りアクセス許可またはスコープを有効にする必要があります。
Confluence API:
-
offline_access
-
readonly:content.attachment:confluence
-
read:confluence-content.all
-
read:confluence-content.summary
-
read:confluence-space.summary
-
AWS アカウントで、以下のことを確認してください。
-
認証情報を AWS Secrets Managerシークレットに保存し、シークレットの Amazon リソースネーム (ARN) をメモします。このページの接続設定手順に従って、必要なキーと値のペアをシークレットに含めます。
-
ナレッジベースの AWS Identity and Access Management (IAM) ロール/アクセス許可ポリシーに、データソースに接続するために必要なアクセス許可を含めます。このデータソースがナレッジベースの IAM ロールに追加するために必要なアクセス許可については、「Permissions to access data sources」を参照してください。
注記
コンソールを使用する場合は、AWS Secrets Manager に移動してシークレットを追加するか、データソース設定手順の一部として既存のシークレットを使用できます。必要なすべてのアクセス許可を持つ IAM ロールは、ナレッジベースを作成するためのコンソール手順の一部として作成できます。データソースの設定およびその他の設定を行うと、必要なすべてのアクセス許可を持つ IAM ロールが特定のナレッジベースに適用されます。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。データソース間で認証情報とシークレットを再利用することはお勧めしません。
接続設定
Confluence インスタンスに接続するには、Amazon Bedrock がデータにアクセスしてクロールできるように、必要な設定情報を提供する必要があります。また、前提条件 に従う必要があります。
このデータソースの設定例をこのセクションに示します。
ドキュメントフィールドの自動検出、包含/除外フィルター、増分同期、シークレット認証情報、およびこれらの仕組みの詳細については、以下を選択してください。
データソースコネクタは、ドキュメントまたはコンテンツのすべてのメインメタデータフィールドを自動的に検出してクロールします。例えば、データソースコネクタは、ドキュメントの本文に相当する部分、ドキュメントタイトル、ドキュメントの作成日または変更日、またはドキュメントに適用される可能性のあるその他のコアフィールドをクロールできます。
重要
コンテンツに機密情報が含まれている場合、Amazon Bedrock は機密情報を使用して応答できます。
メタデータフィールドにフィルタリング演算子を適用して、レスポンスの関連性をさらに高めることができます。例えば、ドキュメントの「epoch_modification_time」は、ドキュメントの最終更新日を 1970 年 1 月 1 日からの経過秒数で表します。「epoch_modification_time」にフィルターを適用して、その値が特定の数より大きい最新のデータだけを取得できます。メタデータフィールドに適用できるフィルタリング演算子の詳細については、「メタデータとフィルタリング」を参照してください。
特定のコンテンツのクロールを含めることも除外することもできます。例えば、除外のためのプレフィックス/正規表現パターンを指定して、ファイル名に「プライベート」が含まれているファイルのクロールをスキップできます。特定のコンテンツエンティティまたはコンテンツタイプを含めるように、包含のためのプレフィックス/正規表現パターンを指定することもできます。包含フィルターと除外フィルターを指定し、両方がドキュメントに一致する場合、除外フィルターが優先され、ドキュメントはクロールされません。
ファイル名に「private」を含む PDF ファイルを除外またはフィルタリングする正規表現パターンの例: ".*private.*\\.pdf"
包含/除外フィルターは、次のコンテンツタイプに適用できます。
-
Space
: 一意のスペースキー -
Page
: メインページのタイトル -
Blog
: メインブログのタイトル -
Comment
: 特定のページまたはブログに属するコメント。Re: Page/Blog Title
を指定 -
Attachment
: 拡張子付きの添付ファイル名
データソースコネクタは、データソースがナレッジベースと同期するたびに、新規、変更、削除されたコンテンツをクロールします。Amazon Bedrock は、データソースの仕組みを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツをクロールできます。データソースをナレッジベースと初めて同期すると、デフォルトですべてのコンテンツがクロールされます。
データソースをナレッジベースと同期するには、StartIngestionJob API を使用するか、コンソールでナレッジベースを選択し、データソースの概要セクションで [同期] を選択します。
重要
データソースから同期するすべてのデータは、データを取得する bedrock:Retrieve
アクセス許可を持つすべてのユーザーが利用できるようになります。これには、データソースのアクセス許可が制御されているデータを含めることもできます。詳細については、「Knowledge base permissions」を参照してください。
(基本認証を使用する場合) AWS Secrets Manager の認証情報には、次のキーと値のペアを含める必要があります。
-
username
:Atlassian アカウントの管理者ユーザーの E メールアドレス
-
password
:Confluence API トークン
(OAuth 2.0 認証を使用する場合) AWS Secrets Manager の認証情報には、次のキーと値のペアを含める必要があります。
-
confluenceAppKey
:アプリキー
-
confluenceAppSecret
:アプリシークレット
-
confluenceAccessToken
:アプリアクセストークン
-
confluenceRefreshToken
:アプリ更新トークン
注記
Confluence OAuth2.0 のアクセストークンの有効期限は、デフォルトでは 60 分です。データソースの同期 (同期ジョブ) 中にアクセストークンの有効期限が切れた場合、Amazon Bedrock は、指定された更新トークンを使用してアクセストークンを再生成します。その際は、アクセストークンと更新トークンの両方が更新されます。現在の同期ジョブから次の同期ジョブまでトークンを最新の状態で維持するために、Amazon Bedrock にはナレッジベースの IAM ロールの一部であるシークレット認証情報の書き込み/保存のアクセス許可が必要です。
注記
AWS Secrets Manager のシークレットは、ナレッジベースと同じリージョンを使用する必要があります。