Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Google Drive-Anschluss V2.0
Google Drive ist ein Cloud-basierter Dateispeicherdienst. Sie können ihn verwenden Amazon Kendra , um Dokumente und Kommentare zu indizieren, die in den Ordnern „Geteilte Ablagen“, „Meine Ablagen“ und „Für mich freigegeben“ in Ihrer Google Drive-Datenquelle gespeichert sind. Sie können Google Workspace-Dokumente sowie Dokumente indizieren, die unter Dokumentationstypen aufgeführt sind. Sie können auch Inklusions- und Ausschlussfilter verwenden, um Inhalte nach Dateiname, Dateityp und Dateipfad zu indizieren.
Anmerkung
Der Google Drive-Connector V1.0/Google DriveConfiguration API wurde 2023 eingestellt. Wir empfehlen, zu Google Drive Connector V2.0/ API zu migrieren oder diesen zu verwenden. TemplateConfiguration
Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Google Drive-Datenquellen-Connector finden Sie unter. Problembehandlung bei Datenquellen
Unterstützte Features
-
Feldzuordnungen
-
Steuerung des Benutzerzugriffs
-
Einschluss-/Ausschlussfilter
-
Vollständige und inkrementelle Inhaltssynchronisierung
-
Virtual Private Cloud (VPC)
Voraussetzungen
Bevor Sie Ihre Google Drive-Datenquelle Amazon Kendra zum Indizieren verwenden können, müssen Sie diese Änderungen in Ihrem Google Drive und AWS Ihren Konten vornehmen.
Stellen Sie in Google Drive sicher, dass Sie über Folgendes verfügen:
-
Entweder wurde der Zugriff durch eine Super-Admin-Rolle gewährt oder Sie sind ein Benutzer mit Administratorrechten. Sie benötigen keine Super-Admin-Rolle für sich selbst, wenn Ihnen der Zugriff durch eine Super-Admin-Rolle gewährt wurde.
-
Die Verbindungsdaten für das Google Drive-Dienstkonto wurden konfiguriert, die die E-Mail-Adresse Ihres Administratorkontos, die Kunden-E-Mail-Adresse (E-Mail-Adresse des Dienstkontos) und den privaten Schlüssel enthalten. Informationen zum Erstellen und Löschen von Dienstkontoschlüsseln finden Sie in der Google Cloud-Dokumentation
. Anmerkung
Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.
-
Sie haben ein Google Cloud-Dienstkonto (ein Konto mit delegierter Befugnis, eine Benutzeridentität anzunehmen) mit aktivierter Option Domänenweite G Suite-Delegierung aktivieren für die server-to-server Authentifizierung erstellt und anschließend mithilfe des Kontos einen privaten JSON-Schlüssel generiert.
Anmerkung
Der private Schlüssel sollte nach der Erstellung des Dienstkontos generiert werden.
-
Admin SDK API und Google Drive API zu Ihrem Benutzerkonto hinzugefügt.
-
Optional: Konfigurierte Google Drive OAuth 2.0-Verbindungsanmeldedaten, die Client-ID, Client-Schlüssel und Aktualisierungstoken als Verbindungsanmeldeinformationen für einen bestimmten Benutzer enthalten. Sie benötigen dies, um einzelne Kontodaten zu crawlen. Informationen zur Verwendung von OAuth 2.0 für den Zugriff APIs finden Sie in der Google-Dokumentation
. -
Die folgenden OAuth Bereiche wurden Ihrem Dienstkonto mithilfe einer Super-Admin-Rolle hinzugefügt (oder ein Nutzer mit einer Super-Admin-Rolle wurde gebeten, sie hinzuzufügen). Diese API-Bereiche werden benötigt, um alle Dokumente und Informationen zur Zugriffskontrolle (ACL) für alle Nutzer in einer Google Workspace-Domain zu crawlen:
-
https://www.googleapis.com/auth/Drive.readonly — all Ihre Google Drive-Dateien anzeigen und herunterladen
-
https://www.googleapis.com/auth/drive.metadata.ReadOnly — Zeigen Sie Metadaten für Dateien in Ihrem Google Drive an
-
https://www.googleapis.com/auth/admin.directory.group.readonly — Bereich, in dem nur Gruppen-, Gruppenalias- und Mitgliederinformationen abgerufen werden. Dies wird für den Identity Amazon Kendra Crawler benötigt.
-
https://www.googleapis.com/auth/admin.directory.user.readOnly — Bereich, in dem nur Benutzer oder Benutzeraliase abgerufen werden. Dies ist für die Auflistung von Benutzern im Identity Crawler und für die Einstellung erforderlich. Amazon Kendra ACLs
-
https://www.googleapis.com/auth/Cloud-Plattform — Bereich für die Generierung von Zugriffstoken zum Abrufen von Inhalten großer Google Drive-Dateien.
-
https://www.googleapis.com/auth/forms.body.readOnly — Bereich für das Abrufen von Daten aus Google Forms.
Um die Forms-API zu unterstützen, fügen Sie den folgenden zusätzlichen Bereich hinzu:
-
https://www.googleapis.com/auth/forms.body.readonly
-
-
Aktiviert, dass jedes Dokument in Google Drive und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokumente IDs gelten für einen Index global und müssen für jeden Index eindeutig sein.
Stellen Sie in Ihrem sicher AWS-Konto, dass Sie Folgendes haben:
-
Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.
-
Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.
Anmerkung
Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.
-
Haben Ihre Google Drive-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.
Anmerkung
Wir empfehlen Ihnen, Ihre Anmeldedaten und Ihr Passwort regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.
Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Google Drive-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.
Anweisungen zur Verbindung
Um eine Verbindung Amazon Kendra zu Ihrer Google Drive-Datenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer Google Drive-Datenquelle angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Wenn Sie Google Drive noch nicht konfiguriert haben, Amazon Kendra sehen Sie nachVoraussetzungen.
Um eine Verbindung Amazon Kendra zu Google Drive herzustellen
-
Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole
. -
Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.
Anmerkung
Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.
-
Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.
-
Wählen Sie auf der Seite Datenquelle hinzufügen die Option Google Drive-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Google Drive-Connector mit dem Tag „V2.0".
-
Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:
-
Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.
-
(Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.
-
In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.
-
Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS
-
Wählen Sie Weiter.
-
-
Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:
-
Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.
-
Zur Authentifizierung: Wählen Sie je nach Anwendungsfall zwischen Google-Dienstkonto und OAuth 2.0-Authentifizierung.
-
AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis aus, oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Google Drive-Authentifizierungsdaten zu speichern. Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.
-
Wenn Sie sich für ein Google-Dienstkonto entschieden haben, geben Sie einen Namen für Ihr Geheimnis, die E-Mail-ID des Administratorbenutzers oder „Dienstkontonutzers“ in Ihrer Dienstkontokonfiguration (Admin-E-Mail), die E-Mail-ID des Dienstkontos (Kunden-E-Mail) und den privaten Schlüssel ein, den Sie in Ihrem Dienstkonto erstellt haben.
Speichern Sie Ihr Geheimnis und fügen Sie es hinzu
-
Wenn Sie sich für die OAuth 2.0-Authentifizierung entschieden haben, geben Sie einen Namen für Ihr Geheimnis, Ihre Client-ID, Ihr Client-Geheimnis und das Aktualisierungstoken ein, das Sie in Ihrem OAuth Konto erstellt haben. Die Benutzer-E-Mail-ID (Benutzer, dessen Verbindungsdetails konfiguriert sind) wird als ACL festgelegt. Der Connector legt aufgrund von API-Einschränkungen keine anderen Benutzer-/Gruppenprinzipalinformationen als ACL fest.
Speichern Sie Ihr Geheimnis und fügen Sie es hinzu.
-
-
Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.
-
(Nur für Nutzer der Google-Dienstkontoauthentifizierung)
Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.
-
IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.
Anmerkung
IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.
-
Wählen Sie Weiter.
-
-
Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:
-
Inhalte synchronisieren — Wählen Sie aus, welche Optionen oder welche Inhalte Sie crawlen möchten. Sie können wählen, ob Sie Meine Ablage (persönliche Ordner), Geteilte Ablage (für Sie geteilte Ordner) oder beides crawlen möchten. Sie können auch Dateikommentare hinzufügen.
-
Unter Zusätzliche Konfiguration — optional können Sie auch die folgenden optionalen Informationen eingeben:
-
Maximale Dateigröße — Legt die maximale Größenbeschränkung für Dateien fest, die MBs gecrawlt werden sollen.
-
Benutzer-E-Mail — Fügen Sie Benutzer-E-Mails hinzu, die Sie ein- oder ausschließen möchten.
-
Geteilte Ablagen — Fügen Sie die Namen der geteilten Ablagen hinzu, die Sie ein- oder ausschließen möchten.
-
MIME-Typen — Fügen Sie MIME-Typen hinzu, die Sie ein- oder ausschließen möchten.
-
Entity-Regex-Muster — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Anlagen für alle unterstützten Entitäten ein- oder auszuschließen. Sie können bis zu 100 Muster hinzufügen.
Sie können Regex-Muster zum Einschließen/Ausschließen von Regex-Mustern für Dateiname, Dateityp und Dateipfad konfigurieren.
-
Dateiname — Der Name der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise eine Datei mit einem Namen zu indizieren
teamroster.txt
, geben Sie anteamroster
. -
Dateityp — Der Typ der Datei, die ein- oder ausgeschlossen werden soll. Beispielsweise .pdf .txt .docx.
-
Dateipfad — Der Pfad der Datei, die ein- oder ausgeschlossen werden soll. Um beispielsweise Dateien nur innerhalb
Products list
des Ordners eines Laufwerks zu indizieren, geben Sie an/Products list
.
-
-
-
Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.
-
Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.
-
Neue, geänderte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
-
Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.
Wichtig
Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare aus gelöschten Dateien können abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Connector Kommentare aus dem Index. Amazon Kendra
-
-
Wählen Sie im Zeitplan für die Synchronisierungsausführung für Häufigkeit aus, wie oft Ihre Datenquelleninhalte synchronisiert und Ihr Index aktualisiert werden soll.
-
Wählen Sie im Synchronisierungslaufverlauf aus, ob Amazon S3 beim Synchronisieren Ihrer Datenquelle automatisch generierte Berichte in einer gespeichert werden sollen. Dies ist nützlich, um Probleme beim Synchronisieren Ihrer Datenquelle nachzuverfolgen.
-
Wählen Sie Weiter.
-
-
Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:
-
Für Dateien — Wählen Sie aus den Amazon Kendra generierten Standard-Datenquellenfeldern aus, die Sie Ihrem Index zuordnen möchten.
Anmerkung
Die Google Drive-API unterstützt das Erstellen benutzerdefinierter Felder nicht. Die Zuordnung benutzerdefinierter Felder ist für den Google Drive-Connector nicht verfügbar.
-
Wählen Sie Weiter.
-
-
Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.
Hinweise
-
Die Zuordnung benutzerdefinierter Felder ist für den Google Drive-Connector nicht verfügbar, da die Google Drive-Benutzeroberfläche das Erstellen benutzerdefinierter Felder nicht unterstützt.
-
Die Google Drive-API unterstützt das Abrufen von Kommentaren aus einer dauerhaft gelöschten Datei nicht. Kommentare können jedoch für gelöschte Dateien abgerufen werden. Wenn eine Datei in den Papierkorb verschoben wird, löscht der Amazon Kendra Connector Kommentare aus dem Index. Amazon Kendra
-
Die Google Drive-API gibt keine Kommentare zurück, die in einer DOCX-Datei vorhanden sind.
-
Wenn die Erlaubnis für eine bestimmte Google document (Dokument, Tabelle, Folie usw.) ist auf Allgemeiner Zugriff eingestellt: Jeder, der den Link oder Shared für Ihre spezifische Unternehmensdomain hat, das Dokument ist für Benutzer der Amazon Kendra-Suche erst sichtbar, wenn der Benutzer, der die Anfrage stellt, auf das Dokument zugegriffen hat.