Google Drive-Anschluss V2.0 - Amazon Kendra

Unterstützte Features Voraussetzungen Anweisungen zur Verbindung Hinweise

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Google Drive-Anschluss V2.0

Google Drive ist ein Cloud-basierter Dateispeicherdienst. Sie können ihn verwenden Amazon Kendra , um Dokumente und Kommentare zu indizieren, die in den Ordnern „Geteilte Ablagen“, „Meine Ablagen“ und „Für mich freigegeben“ in Ihrer Google Drive-Datenquelle gespeichert sind. Sie können Google Workspace-Dokumente sowie Dokumente indizieren, die unter Dokumentationstypen aufgeführt sind. Sie können auch Inklusions- und Ausschlussfilter verwenden, um Inhalte nach Dateiname, Dateityp und Dateipfad zu indizieren.

Anmerkung

Der Google Drive-Connector V1.0/Google DriveConfiguration API wurde 2023 eingestellt. Wir empfehlen, zu Google Drive Connector V2.0/ API zu migrieren oder diesen zu verwenden. TemplateConfiguration

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Google Drive-Datenquellen-Connector finden Sie unter. Problembehandlung bei Datenquellen

Unterstützte Features

Feldzuordnungen
Steuerung des Benutzerzugriffs
Einschluss-/Ausschlussfilter
Vollständige und inkrementelle Inhaltssynchronisierung
Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Google Drive-Datenquelle Amazon Kendra zum Indizieren verwenden können, müssen Sie diese Änderungen in Ihrem Google Drive und AWS Ihren Konten vornehmen.

Stellen Sie in Google Drive sicher, dass Sie über Folgendes verfügen:

Entweder wurde der Zugriff durch eine Super-Admin-Rolle gewährt oder Sie sind ein Benutzer mit Administratorrechten. Sie benötigen keine Super-Admin-Rolle für sich selbst, wenn Ihnen der Zugriff durch eine Super-Admin-Rolle gewährt wurde.
Die Verbindungsdaten für das Google Drive-Dienstkonto wurden konfiguriert, die die E-Mail-Adresse Ihres Administratorkontos, die Kunden-E-Mail-Adresse (E-Mail-Adresse des Dienstkontos) und den privaten Schlüssel enthalten. Informationen zum Erstellen und Löschen von Dienstkontoschlüsseln finden Sie in der Google Cloud-Dokumentation.

Anmerkung
Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.
Sie haben ein Google Cloud-Dienstkonto (ein Konto mit delegierter Befugnis, eine Benutzeridentität anzunehmen) mit aktivierter Option Domänenweite G Suite-Delegierung aktivieren für die server-to-server Authentifizierung erstellt und anschließend mithilfe des Kontos einen privaten JSON-Schlüssel generiert.

Anmerkung
Der private Schlüssel sollte nach der Erstellung des Dienstkontos generiert werden.
Admin SDK API und Google Drive API zu Ihrem Benutzerkonto hinzugefügt.
Optional: Konfigurierte Google Drive OAuth 2.0-Verbindungsanmeldedaten, die Client-ID, Client-Schlüssel und Aktualisierungstoken als Verbindungsanmeldeinformationen für einen bestimmten Benutzer enthalten. Sie benötigen dies, um einzelne Kontodaten zu crawlen. Informationen zur Verwendung von OAuth 2.0 für den Zugriff APIs finden Sie in der Google-Dokumentation.
Die folgenden OAuth Bereiche wurden Ihrem Dienstkonto mithilfe einer Super-Admin-Rolle hinzugefügt (oder ein Nutzer mit einer Super-Admin-Rolle wurde gebeten, sie hinzuzufügen). Diese API-Bereiche werden benötigt, um alle Dokumente und Informationen zur Zugriffskontrolle (ACL) für alle Nutzer in einer Google Workspace-Domain zu crawlen:
- https://www.googleapis.com/auth/Drive.readonly — all Ihre Google Drive-Dateien anzeigen und herunterladen
- https://www.googleapis.com/auth/drive.metadata.ReadOnly — Zeigen Sie Metadaten für Dateien in Ihrem Google Drive an
- https://www.googleapis.com/auth/admin.directory.group.readonly — Bereich, in dem nur Gruppen-, Gruppenalias- und Mitgliederinformationen abgerufen werden. Dies wird für den Identity Amazon Kendra Crawler benötigt.
- https://www.googleapis.com/auth/admin.directory.user.readOnly — Bereich, in dem nur Benutzer oder Benutzeraliase abgerufen werden. Dies ist für die Auflistung von Benutzern im Identity Crawler und für die Einstellung erforderlich. Amazon Kendra ACLs
- https://www.googleapis.com/auth/Cloud-Plattform — Bereich für die Generierung von Zugriffstoken zum Abrufen von Inhalten großer Google Drive-Dateien.
- https://www.googleapis.com/auth/forms.body.readOnly — Bereich für das Abrufen von Daten aus Google Forms.
Um die Forms-API zu unterstützen, fügen Sie den folgenden zusätzlichen Bereich hinzu:
- https://www.googleapis.com/auth/forms.body.readonly
Aktiviert, dass jedes Dokument in Google Drive und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokumente IDs gelten für einen Index global und müssen für jeden Index eindeutig sein.

Stellen Sie in Ihrem sicher AWS-Konto, dass Sie Folgendes haben:

Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.
Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

Anmerkung
Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.
Haben Ihre Google Drive-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

Anmerkung
Wir empfehlen Ihnen, Ihre Anmeldedaten und Ihr Passwort regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Google Drive-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Google Drive-Datenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer Google Drive-Datenquelle angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Wenn Sie Google Drive noch nicht konfiguriert haben, Amazon Kendra sehen Sie nachVoraussetzungen.

Console

Um eine Verbindung Amazon Kendra zu Google Drive herzustellen

Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.
Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

Anmerkung
Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.
Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.
Wählen Sie auf der Seite Datenquelle hinzufügen die Option Google Drive-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Google Drive-Connector mit dem Tag „V2.0".
Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:
1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.
2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.
3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.
4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS
5. Wählen Sie Weiter.
Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:
1. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.
2. Zur Authentifizierung: Wählen Sie je nach Anwendungsfall zwischen Google-Dienstkonto und OAuth 2.0-Authentifizierung.
3. AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis aus, oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Google Drive-Authentifizierungsdaten zu speichern. Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.
  1. Wenn Sie sich für ein Google-Dienstkonto entschieden haben, geben Sie einen Namen für Ihr Geheimnis, die E-Mail-ID des Administratorbenutzers oder „Dienstkontonutzers“ in Ihrer Dienstkontokonfiguration (Admin-E-Mail), die E-Mail-ID des Dienstkontos (Kunden-E-Mail) und den privaten Schlüssel ein, den Sie in Ihrem Dienstkonto erstellt haben.
    
    Speichern Sie Ihr Geheimnis und fügen Sie es hinzu
  2. Wenn Sie sich für die OAuth 2.0-Authentifizierung entschieden haben, geben Sie einen Namen für Ihr Geheimnis, Ihre Client-ID, Ihr Client-Geheimnis und das Aktualisierungstoken ein, das Sie in Ihrem OAuth Konto erstellt haben. Die Benutzer-E-Mail-ID (Benutzer, dessen Verbindungsdetails konfiguriert sind) wird als ACL festgelegt. Der Connector legt aufgrund von API-Einschränkungen keine anderen Benutzer-/Gruppenprinzipalinformationen als ACL fest.
    
    Speichern Sie Ihr Geheimnis und fügen Sie es hinzu.
4. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.
5. (Nur für Nutzer der Google-Dienstkontoauthentifizierung)
  
  Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.
6. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.
  
  Anmerkung
  IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.
7. Wählen Sie Weiter.
Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:
1. Inhalte synchronisieren — Wählen Sie aus, welche Optionen oder welche Inhalte Sie crawlen möchten. Sie können wählen, ob Sie Meine Ablage (persönliche Ordner), Geteilte Ablage (für Sie geteilte Ordner) oder beides crawlen möchten. Sie können auch Dateikommentare hinzufügen.
2. Unter Zusätzliche Konfiguration — optional können Sie auch die folgenden optionalen Informationen eingeben:
  1. Maximale Dateigröße — Legt die maximale Größenbeschränkung für Dateien fest, die MBs gecrawlt werden sollen.
  2. Benutzer-E-Mail — Fügen Sie Benutzer-E-Mails hinzu, die Sie ein- oder ausschließen möchten.
  3. Geteilte Ablagen — Fügen Sie die Namen der geteilten Ablagen hinzu, die Sie ein- oder ausschließen möchten.
  4. MIME-Typen — Fügen Sie MIME-Typen hinzu, die Sie ein- oder ausschließen möchten.
  5. Entity-Regex-Muster — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Anlagen für alle unterstützten Entitäten ein- oder auszuschließen. Sie können bis zu 100 Muster hinzufügen.
    
    Sie können Regex-Muster zum Einschließen/Ausschließen von Regex-Mustern für Dateiname, Dateityp und Dateipfad konfigurieren.
    - Dateiname — Der Name der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise eine Datei mit einem Namen zu indizierenteamroster.txt, geben Sie anteamroster.
    - Dateityp — Der Typ der Datei, die ein- oder ausgeschlossen werden soll. Beispielsweise .pdf .txt .docx.
    - Dateipfad — Der Pfad der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise Dateien nur innerhalb Products list des Ordners eines Laufwerks zu indizieren, geben Sie an/Products list.
3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.
  - Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.
  - Neue, geänderte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
  - Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
  Wichtig
  Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare aus gelöschten Dateien können abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Connector Kommentare aus dem Index. Amazon Kendra
4. Wählen Sie im Zeitplan für die Synchronisierungsausführung für Häufigkeit aus, wie oft Ihre Datenquelleninhalte synchronisiert und Ihr Index aktualisiert werden soll.
5. Wählen Sie im Synchronisierungslaufverlauf aus, ob Amazon S3 beim Synchronisieren Ihrer Datenquelle automatisch generierte Berichte in einer gespeichert werden sollen. Dies ist nützlich, um Probleme beim Synchronisieren Ihrer Datenquelle nachzuverfolgen.
6. Wählen Sie Weiter.
Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:
1. Für Dateien — Wählen Sie aus den Amazon Kendra generierten Standard-Datenquellenfeldern aus, die Sie Ihrem Index zuordnen möchten.
  
  Anmerkung
  Die Google Drive-API unterstützt das Erstellen benutzerdefinierter Felder nicht. Die Zuordnung benutzerdefinierter Felder ist für den Google Drive-Connector nicht verfügbar.
2. Wählen Sie Weiter.
Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra zu Google Drive herzustellen

Sie müssen mithilfe der TemplateConfigurationAPI ein JSON des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

Datenquelle — Geben Sie den Datenquellentyp an, wie GOOGLEDRIVEV2 bei der Verwendung von TemplateConfigurationJSON-Schema. Geben Sie auch die Datenquelle anTEMPLATE, wie beim Aufrufen von CreateDataSourceAPI.
Authentifizierungstyp — Geben Sie an, ob die Dienstkontoauthentifizierung oder die OAuth 2.0-Authentifizierung verwendet werden soll.
Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:
- FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.
- FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
- CHANGE_LOGum jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird, nur neue und geänderte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
Wichtig
Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare aus gelöschten Dateien können abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Connector Kommentare aus dem Index. Amazon Kendra
Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten enthält, die Sie in Ihrem Google Drive-Konto erstellt haben. Wenn Sie die Google-Dienstkonto-Authentifizierung verwenden, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:
```
{
    "clientEmail": "user account email",
    "adminAccountEmail": "service account email",
    "privateKey": "private key"
}
```
Wenn Sie die OAuth 2.0-Authentifizierung verwenden, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:
```
{
    "clientID": "OAuth client ID",
    "clientSecret": "client secret",
    "refreshToken": "refresh token"
}
```
IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und für das Aufrufen der erforderlichen Öffentlichkeit APIs für den Google Drive-Connector und Amazon Kendra zu erteilen. Weitere Informationen finden Sie unter IAM Rollen für Google Drive-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfiguration für Amazon Kendra die Verwendung eines Amazon VPC.
Meine Ablagen, Geteilte Ablagen, Kommentare — Sie können angeben, ob diese Arten von Inhalten gecrawlt werden sollen.
Inklusions- und Ausschlussfilter — Sie können angeben, ob bestimmte Benutzerkonten, geteilte Ablagen und MIME-Typen ein- oder ausgeschlossen werden sollen.

Anmerkung
Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke. Dabei handelt es sich um Ein- oder Ausschlussmuster, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.
Zugriffskontrollliste (ACL) — Geben Sie an, ob die ACL-Informationen für Ihre Dokumente gecrawlt werden sollen, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.
Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.
Feldzuordnungen — Wählen Sie diese Option, um Ihre Google Drive-Datenquellenfelder Ihren Indexfeldern zuzuordnen. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

Anmerkung
Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unter Google Drive-Vorlagenschema.

anchor anchor

Um eine Verbindung Amazon Kendra zu Google Drive herzustellen

Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.
Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

Anmerkung
Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.
Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.
Wählen Sie auf der Seite Datenquelle hinzufügen die Option Google Drive-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Google Drive-Connector mit dem Tag „V2.0".
Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:
1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.
2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.
3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.
4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS
5. Wählen Sie Weiter.
Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:
1. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.
2. Zur Authentifizierung: Wählen Sie je nach Anwendungsfall zwischen Google-Dienstkonto und OAuth 2.0-Authentifizierung.
3. AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis aus, oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Google Drive-Authentifizierungsdaten zu speichern. Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.
  1. Wenn Sie sich für ein Google-Dienstkonto entschieden haben, geben Sie einen Namen für Ihr Geheimnis, die E-Mail-ID des Administratorbenutzers oder „Dienstkontonutzers“ in Ihrer Dienstkontokonfiguration (Admin-E-Mail), die E-Mail-ID des Dienstkontos (Kunden-E-Mail) und den privaten Schlüssel ein, den Sie in Ihrem Dienstkonto erstellt haben.
    
    Speichern Sie Ihr Geheimnis und fügen Sie es hinzu
  2. Wenn Sie sich für die OAuth 2.0-Authentifizierung entschieden haben, geben Sie einen Namen für Ihr Geheimnis, Ihre Client-ID, Ihr Client-Geheimnis und das Aktualisierungstoken ein, das Sie in Ihrem OAuth Konto erstellt haben. Die Benutzer-E-Mail-ID (Benutzer, dessen Verbindungsdetails konfiguriert sind) wird als ACL festgelegt. Der Connector legt aufgrund von API-Einschränkungen keine anderen Benutzer-/Gruppenprinzipalinformationen als ACL fest.
    
    Speichern Sie Ihr Geheimnis und fügen Sie es hinzu.
4. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.
5. (Nur für Nutzer der Google-Dienstkontoauthentifizierung)
  
  Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.
6. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.
  
  Anmerkung
  IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.
7. Wählen Sie Weiter.
Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:
1. Inhalte synchronisieren — Wählen Sie aus, welche Optionen oder welche Inhalte Sie crawlen möchten. Sie können wählen, ob Sie Meine Ablage (persönliche Ordner), Geteilte Ablage (für Sie geteilte Ordner) oder beides crawlen möchten. Sie können auch Dateikommentare hinzufügen.
2. Unter Zusätzliche Konfiguration — optional können Sie auch die folgenden optionalen Informationen eingeben:
  1. Maximale Dateigröße — Legt die maximale Größenbeschränkung für Dateien fest, die MBs gecrawlt werden sollen.
  2. Benutzer-E-Mail — Fügen Sie Benutzer-E-Mails hinzu, die Sie ein- oder ausschließen möchten.
  3. Geteilte Ablagen — Fügen Sie die Namen der geteilten Ablagen hinzu, die Sie ein- oder ausschließen möchten.
  4. MIME-Typen — Fügen Sie MIME-Typen hinzu, die Sie ein- oder ausschließen möchten.
  5. Entity-Regex-Muster — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Anlagen für alle unterstützten Entitäten ein- oder auszuschließen. Sie können bis zu 100 Muster hinzufügen.
    
    Sie können Regex-Muster zum Einschließen/Ausschließen von Regex-Mustern für Dateiname, Dateityp und Dateipfad konfigurieren.
    - Dateiname — Der Name der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise eine Datei mit einem Namen zu indizierenteamroster.txt, geben Sie anteamroster.
    - Dateityp — Der Typ der Datei, die ein- oder ausgeschlossen werden soll. Beispielsweise .pdf .txt .docx.
    - Dateipfad — Der Pfad der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise Dateien nur innerhalb Products list des Ordners eines Laufwerks zu indizieren, geben Sie an/Products list.
3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.
  - Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.
  - Neue, geänderte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
  - Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
  Wichtig
  Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare aus gelöschten Dateien können abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Connector Kommentare aus dem Index. Amazon Kendra
4. Wählen Sie im Zeitplan für die Synchronisierungsausführung für Häufigkeit aus, wie oft Ihre Datenquelleninhalte synchronisiert und Ihr Index aktualisiert werden soll.
5. Wählen Sie im Synchronisierungslaufverlauf aus, ob Amazon S3 beim Synchronisieren Ihrer Datenquelle automatisch generierte Berichte in einer gespeichert werden sollen. Dies ist nützlich, um Probleme beim Synchronisieren Ihrer Datenquelle nachzuverfolgen.
6. Wählen Sie Weiter.
Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:
1. Für Dateien — Wählen Sie aus den Amazon Kendra generierten Standard-Datenquellenfeldern aus, die Sie Ihrem Index zuordnen möchten.
  
  Anmerkung
  Die Google Drive-API unterstützt das Erstellen benutzerdefinierter Felder nicht. Die Zuordnung benutzerdefinierter Felder ist für den Google Drive-Connector nicht verfügbar.
2. Wählen Sie Weiter.
Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

Hinweise

Die Zuordnung benutzerdefinierter Felder ist für den Google Drive-Connector nicht verfügbar, da die Google Drive-Benutzeroberfläche das Erstellen benutzerdefinierter Felder nicht unterstützt.
Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare können jedoch für gelöschte Dateien abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Amazon Kendra Connector Kommentare aus dem Index. Amazon Kendra
Die Google Drive-API gibt keine Kommentare zurück, die in einer DOCX-Datei vorhanden sind.
Wenn die Erlaubnis für eine bestimmte Google document (Dokument, Tabelle, Folie usw.) ist auf Allgemeiner Zugriff eingestellt: Jeder, der den Link oder Shared für Ihre spezifische Unternehmensdomain hat, das Dokument ist für Benutzer der Amazon Kendra-Suche erst sichtbar, wenn der Benutzer, der die Anfrage stellt, auf das Dokument zugegriffen hat.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Google Drive-Konnektor V1.0

IBM DB2

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden

Google Drive-Anschluss V2.0

Anmerkung

Themen

Unterstützte Features

Voraussetzungen

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anweisungen zur Verbindung

Anmerkung

Anmerkung

Wichtig

Anmerkung

Wichtig

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Wichtig

Anmerkung

Hinweise

Hat Ihnen diese Seite geholfen?

Nächstes Thema:

Vorheriges Thema:

Brauchen Sie Hilfe?