翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Drupal
Drupal は、ウェブサイトやウェブアプリケーションの作成に使用できるオープンソースのコンテンツ管理システム (CMS) です。を使用して Amazon Kendra 、Drupal で次のインデックスを作成できます。
-
コンテンツ - 記事、基本ページ、基本ブロック、ユーザー定義コンテンツタイプ、ユーザー定義ブロックタイプ、カスタムコンテンツタイプ、カスタムブロックタイプ
-
コメント - すべてのコンテンツタイプとブロックタイプに対応
-
添付ファイル - すべてのコンテンツタイプとブロックタイプに対応
Amazon Kendra コンソール
Amazon Kendra Drupal データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。
サポートされている機能
Amazon Kendra Drupal データソースコネクタは、次の機能をサポートしています。
-
フィールドマッピング
-
ユーザーコンテキストフィルタリング
-
包含/除外フィルター
-
完全および増分コンテンツ同期
-
仮想プライベートクラウド (VPC)
前提条件
Amazon Kendra を使用して Drupal データソースのインデックスを作成する前に、Drupal および AWS アカウントでこれらの変更を行ってください。
Drupal で以下を確認してください。
-
Drupal (スタンダード) Suite のアカウントと管理者ロールを持つユーザーを作成しました。
-
Drupal サイト名をコピーし、ホスト URL を設定しました。例えば、
https://<hostname>/<drupalsitename>
。 -
ユーザー名 (Drupal ウェブサイトのログインユーザー名) とパスワード (Drupal ウェブサイトのパスワード) を含む基本認証情報を設定しました。
-
推奨: OAuth 2.0 認証情報トークンを設定しました。このトークンを、接続先の Drupal パスワード付与、クライアント ID、クライアントシークレット、ユーザー名 (Drupal ウェブサイトのログインユーザー名)、パスワード (Drupal ウェブサイトのパスワード) とともに使用して Amazon Kendraに接続します。
-
管理者ロールを使用して Drupal アカウントに次のアクセス許可を追加しました。
-
ブロックを管理
-
block_content の表示を管理
-
block_content フィールドを管理
-
block_content の形式表示を管理
-
ビューを管理
-
ユーザーの E メールアドレスを表示
-
自分の未公開コンテンツを表示
-
ページリビジョンを表示
-
記事のリビジョンを表示
-
すべてのリビジョンを表示
-
管理テーマを表示
-
コンテンツへのアクセス
-
コンテンツへのアクセスの概要
-
コメントへのアクセス
-
コンテンツを検索
-
ファイルへのアクセスの概要
-
コンテキストリンクへのアクセス
注記
ユーザー定義のコンテンツタイプまたはユーザー定義のブロックタイプがある場合、またはビューやブロックを Drupal ウェブサイトに追加する場合は、それらに管理者アクセスを提供する必要があります。
-
で AWS アカウント、以下があることを確認します。
-
Amazon Kendra インデックスを作成し、 API を使用している場合はインデックス ID を記録しました。
-
データソースの IAM ロールを作成し、 API を使用している場合は、 IAM ロールの ARN を記録しました。
注記
認証タイプと認証情報を変更する場合は、 IAM ロールを更新して正しい AWS Secrets Manager シークレット ID にアクセスする必要があります。
-
Drupal の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。
注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
既存の IAM ロールまたはシークレットがない場合は、Drupal データソースを接続するときに、コンソールを使用して新しい IAM ロールと Secrets Manager シークレットを作成できます Amazon Kendra。API を使用している場合は、既存の IAM ロールと Secrets Manager シークレットの ARN とインデックス ID を指定する必要があります。
接続手順
Drupal データソース Amazon Kendra に接続するには、 がデータ Amazon Kendra にアクセスできるように Drupal 認証情報の詳細を指定する必要があります。用に Drupal をまだ設定していない場合は、 Amazon Kendra 「」を参照してください前提条件。
Drupal Amazon Kendra に接続するには
-
にサインイン AWS Management Console し、 Amazon Kendra コンソール
を開きます。 -
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。
注記
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
-
[使用開始] ページで、[データソースを追加] を選択します。
-
データソースの追加ページで Drupal コネクタを選択し、コネクタの追加を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いた Drupal コネクタを選択します。
-
[データソースの詳細を指定] ページで、次の情報を入力します。
-
[名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
-
(オプション) [説明] - オプションで、データソースの説明を入力します。
-
デフォルト言語 - インデックスのドキュメントをフィルタリングする言語を選択します。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
-
タグで、新しいタグを追加する - リソースを検索およびフィルタリングしたり、 AWS コストを追跡したりするためのオプションのタグを含めます。
-
[Next (次へ)] を選択します。
-
-
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
-
[ソース] の [ホスト URL] - Drupal サイトのホスト URL。例えば、
https://<hostname>/<drupalsitename>
。 -
[SSL 証明書の場所] - Amazon S3 バケットに保存されている SSL 証明書へのパスを入力します。
-
認可 - ACL があり、アクセスコントロールに使用する場合は、ドキュメントのアクセスコントロールリスト (ACL) 情報をオンまたはオフにします。ACL は、ユーザーとグループがアクセスできるドキュメントを指定します。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
-
認証用 - ユースケースに応じて、[基本認証] と [OAuth 2.0 認証] のいずれかを選択します。
-
secret - 既存のシーAWS Secrets Manager クレットを選択するか、新しい Secrets Manager シークレットを作成して Drupal 認証情報を保存します。新しいシークレットの作成を選択すると、 AWS Secrets Manager シークレットウィンドウが開きます。
-
[ AWS Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
-
[基本認証] を選択した場合は、コピーした [シークレット名]、[ユーザー名] (Drupal サイトのユーザー名)、および [パスワード] (Drupal サイトのパスワード) を入力し、[保存してシークレットを追加] を選択します。
-
[OAuth 2.0 認証] を選択した場合は、Drupal アカウントで生成された [シークレット名]、[ユーザー名] (Drupal サイトのユーザー名)、[パスワード] (Drupal サイトのパスワード)、[クライアント ID]、および [クライアントシークレット] を入力して、[シークレットを保存して追加] を選択します。
-
-
[Save] を選択します。
-
-
[仮想プライベートクラウド (VPC)] - VPC の使用を選択できます。選択する場合は、[サブネット] と [VPC セキュリティグループ] を追加する必要があります。
-
ID クローラー - Amazon Kendraの ID クローラーを有効にするかどうかを指定します。ID クローラーは、ドキュメントのアクセスコントロールリスト (ACL) 情報を使用して、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて検索結果をフィルタリングします。ドキュメントの ACL があり、ACL を使用することを選択した場合は、 Amazon Kendra ID クローラーをオンにして、検索結果のユーザーコンテキストフィルタリングを設定することもできます。それ以外の場合、ID クローラーがオフになっていると、すべてのドキュメントをパブリックに検索できます。ドキュメントのアクセスコントロールを使用し、ID クローラーがオフになっている場合は、PutPrincipalMapping API を使用して、ユーザーコンテキストフィルタリングのためにユーザーとグループのアクセス情報をアップロードすることもできます。
-
IAM role - 既存の IAM ロールを選択するか、新しい IAM ロールを作成してリポジトリの認証情報とインデックスコンテンツにアクセスします。
注記
IAM インデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
-
[Next (次へ)] を選択します。
-
-
[同期設定の構成] ページで、次の情報を入力します。
-
[同期の範囲] は、次のオプションから選択します。
注記
[記事]、[基本ページ]、[基本ブロック] のクロールを選択すると、それぞれのデフォルトのフィールドが自動的に同期されます。コメント、添付ファイル、カスタムフィールド、その他のカスタムエンティティを同期することもできます。
-
[エンティティを選択] の場合。
-
記事 - [記事]、そのコメント [コメント]、および [添付ファイル]をクロールするかどうかを選択します。
-
[基本ページ] - [基本ページ]、その [コメント]、その [添付ファイル] をクロールするかどうかを選択します。
-
[基本ブロック] - [基本ブロック]、その [コメント]、その [添付ファイル] をクロールするかどうかを選択します。
-
[カスタムコンテンツタイプ] と [カスタムブロック] を追加することもできます。
-
-
-
[追加設定 - オプション]。
-
[正規表現パターン] - 特定のエンティティタイトルとファイル名を含めるか除外する正規表現パターンを追加します。最大 100 のパターンを追加できます。
-
-
[同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを Amazon Kendra と初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択しなくても、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。
-
完全同期: データソースがインデックスと同期するたびに既存のコンテンツを置き換え、すべてのコンテンツのインデックスを作成します。
-
新規、変更、削除された同期: データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendra は、データソースのメカニズムを使用して、前回の同期以降に変更されたコンテンツの変更とインデックスコンテンツを追跡できます。
-
-
[同期実行スケジュール] の [頻度] - Amazon Kendra がデータソースと同期する頻度。
-
[Next (次へ)] を選択します。
-
-
[フィールドマッピングを設定] ページで、次の情報を入力します。
-
コンテンツ、コメント、添付ファイル - インデックスにマッピングする、 Amazon Kendra 生成されたデフォルトのデータソースフィールドから選択します。
-
[フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。
-
[Next (次へ)] を選択します。
-
-
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。
メモ
-
Drupal API には公式なスロットリング制限はありません。
-
Java SDK は Drupal では使用できません。
-
Drupal データは、ネイティブ JSON API を使用してのみ取得できます。
-
どの Drupal [ビュー] にも関連付けられていないコンテンツタイプはクロールできません。
-
Drupal [ブロック] からデータをクロールするには、管理者権限が必要です。
-
HTTP 動詞を使用してユーザー定義コンテンツタイプを作成するための JSON API はありません。
-
[記事]、[基本ページ]、[基本ブロック]、ユーザー定義コンテンツタイプ、ユーザー定義ブロックタイプのドキュメント本文とコメントは HTML 形式で表示されます。HTML コンテンツの形式が正しくない場合、HTML 関連のタグがドキュメント本文とコメントに表示され、 Amazon Kendra 検索結果に表示されます。
-
説明や本文のないコンテンツタイプとブロックタイプは取り込まれません Amazon Kendra。そのようなコンテンツまたはブロックタイプのコメントと添付ファイルのみが Amazon Kendra インデックスに取り込まれます。