Alfresco - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Alfresco

Alfrescoist ein Content-Management-Service, der Kunden dabei unterstützt, ihre Inhalte zu speichern und zu verwalten. Sie können Amazon Kendra es verwenden, um Ihre Alfresco Dokumentbibliothek, Ihr Wiki und Ihren Blog zu indizieren.

Amazon Kendra unterstützt Alfresco On-Premise und Alfresco Cloud (Platform as a Service).

Sie können über Amazon Kendra die Amazon Kendra Konsole oder die TemplateConfigurationAPI eine Verbindung zu Ihrer Alfresco Datenquelle herstellen.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Alfresco-Datenquellen-Connector finden Sie unter. Problembehandlung bei Datenquellen

Unterstützte Features

Amazon Kendra AlfrescoDer Datenquellen-Connector unterstützt die folgenden Funktionen:

  • Feldzuordnungen

  • Steuerung des Benutzerzugriffs

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • OAuth 2.0 und Standardauthentifizierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Alfresco-Datenquelle Amazon Kendra zur Indexierung verwenden können, nehmen Sie diese Änderungen in Ihrem und vor. Alfresco AWS-Konten

Stellen Sie sicherAlfresco, dass Sie Folgendes haben:

  • Ihre Alfresco Repository-URL und die URL Ihrer Webanwendung wurden kopiert. Wenn Sie nur eine bestimmte Alfresco Site indexieren möchten, kopieren Sie auch die Site-ID.

  • Notieren Sie sich Ihre Alfresco Authentifizierungsdaten, die einen Benutzernamen und ein Passwort mit mindestens Leseberechtigungen beinhalten. Wenn Sie die OAuth 2.0-Authentifizierung verwenden möchten, sollten Sie den Benutzer der Alfresco Administratorgruppe hinzufügen.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • Optional: Konfigurierte OAuth 2.0-Anmeldeinformationen in. Alfresco Zu den Anmeldeinformationen gehören die Client-ID, der geheime Client-Schlüssel und die Token-URL. Weitere Informationen zur Konfiguration von Clients für Alfresco On-Premises finden Sie in der Alfresco-Dokumentation. Wenn Sie Alfresco Cloud (PaaS) verwenden, müssen Sie sich für die OAuth 2.0-Authentifizierung an den Hyland-Support wenden. Alfresco

  • Geprüft, ob jedes Dokument in Alfresco und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokument-IDs gelten für einen Index global und müssen pro Index eindeutig sein.

Stellen Sie sicher AWS-Konto, dass Sie Folgendes in Ihrem haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Ihre Alfresco-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Zugangsdaten und Ihr Secret regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Alfresco-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Alfresco-Datenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer Alfresco-Datenquelle angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Falls Sie Alfresco für noch nicht konfiguriert haben, finden Sie weitere Informationen unter. Amazon KendraVoraussetzungen

Console

Um eine Verbindung herzustellen Amazon Kendra Alfresco

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Alfresco Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie Alfresco Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter aus.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. AlfrescoTyp — Wählen Sie aus, ob Sie Alfresco On-Premises/Server oder Alfresco Cloud (Platform as a Service) verwenden möchten.

    2. Alfresco-Repository-URL — Geben Sie Ihre Alfresco-Repository-URL ein. Wenn Sie beispielsweise Alfresco Cloud (PaaS) verwenden, könnte die Repository-URL lauten. https://company.alfrescocloud.com Oder, wenn Sie Alfresco On-Premises verwenden, könnte die Repository-URL lauten. https://company-alfresco-instance.company-domain.suffix:port

    3. Alfresco-Benutzeranwendung. URL — Geben Sie die URL Ihrer Alfresco Benutzeroberfläche ein. Sie können die Repository-URL von Ihrem Alfresco Administrator erhalten. Die URL der Benutzeroberfläche könnte beispielsweise https://example.com lauten.

    4. Speicherort des SSL-Zertifikats — Geben Sie den Pfad zu dem in einem Amazon S3 Bucket gespeicherten SSL-Zertifikat ein. Sie verwenden dies, um über eine sichere SSL-Verbindung eine Verbindung zu Alfresco On-Premises herzustellen.

    5. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

    6. Authentifizierung — Wählen Sie Standardauthentifizierung oder OAuth 2.0-Authentifizierung. Wählen Sie dann ein vorhandenes Secrets Manager Geheimnis aus oder erstellen Sie ein neues Geheimnis, um Ihre Anmeldeinformationen zu speichern. Alfresco Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

      Wenn Sie die Standardauthentifizierung gewählt haben, geben Sie einen Namen für das Geheimnis, den Alfresco Benutzernamen und das Passwort ein.

      Wenn Sie sich für die OAuth 2.0-Authentifizierung entschieden haben, geben Sie einen Namen für das Geheimnis, die Client-ID, den geheimen Client-Schlüssel und die Token-URL ein.

    7. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    8. Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung der Suchergebnisse zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

    9. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    10. Wählen Sie Weiter aus.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Synchronisierungsbereich — Legen Sie Grenzwerte für das Crawlen bestimmter Inhalte fest und filtern Sie Inhalte mithilfe von Regex-Ausdrucksmustern.

      1. Inhalt — Wählen Sie aus, ob Inhalte, die mit „Aspekten“ gekennzeichnet sindAlfresco, Inhalte innerhalb einer bestimmten Alfresco Website oder Inhalte auf all Ihren Websites gecrawlt werden sollen. Alfresco

      2. (Optional) Zusätzliche Konfiguration — Legen Sie die folgenden Einstellungen fest:

        • Kommentare einbeziehen — Wählen Sie aus, ob Kommentare in die Alfresco Dokumentbibliothek und den Blog aufgenommen werden sollen.

        • Regex-Muster — Reguläre Ausdrucksmuster zum Ein- oder Ausschließen bestimmter Dateien.

    2. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie alle Inhalte neu und ersetzen vorhandene Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    3. Wählen Sie im Zeitplan für die Synchronisierungsausführung unter Frequenz aus, wie oft der Inhalt Ihrer Datenquelle synchronisiert und der Index aktualisiert werden soll.

    4. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Wählen Sie aus den Amazon Kendra generierten Standard-Datenquellenfeldern aus, die Sie Ihrem Index zuordnen möchten.

    2. Um benutzerdefinierte Datenquellenfelder hinzuzufügen, erstellen Sie einen Indexfeldnamen für die Zuordnung und den Felddatentyp.

    3. Wählen Sie Weiter aus.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra herzustellen Alfresco

Sie müssen mithilfe der TemplateConfigurationAPI ein JSON des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

  • Datenquelle — Geben Sie den Datenquellentyp wie ALFRESCO bei der Verwendung des TemplateConfigurationJSON-Schemas an. Geben Sie außerdem die Datenquelle so anTEMPLATE, wie Sie die CreateDataSourceAPI aufrufen.

  • AlfrescoSite-ID — Geben Sie die Alfresco-Site-ID an.

  • AlfrescoRepository-URL — Geben Sie die Repository-URL an. Alfresco Sie können die Repository-URL von Ihrem Alfresco Administrator erhalten. Wenn Sie beispielsweise Alfresco Cloud (PaaS) verwenden, könnte die Repository-URL lauten https://company.alfrescocloud.com. Oder, wenn Sie Alfresco On-Premises verwenden, könnte die Repository-URL lauten. https://company-alfresco-instance.company-domain.suffix:port

  • AlfrescoURL der Webanwendung — Geben Sie die URL der Alfresco Benutzeroberfläche an. Sie können die Repository-URL von Ihrem Alfresco Administrator abrufen. Die URL der Benutzeroberfläche könnte beispielsweise https://example.com lauten.

  • Authentifizierungstyp — Geben Sie an, welchen Authentifizierungstyp Sie verwenden möchten, ob OAuth2 oderBasic.

  • AlfrescoTyp — Geben Sie an, welchen Typ Alfresco Sie verwenden, ob PAAS (Cloud/Platform as a Service) oder ON_PREM (On-Premise).

  • Geheimer Amazon-Ressourcenname (ARN) — Wenn Sie die Standardauthentifizierung verwenden möchten, geben Sie ein Geheimnis an, in dem Ihre Authentifizierungsdaten mit Ihrem Benutzernamen und Passwort gespeichert werden. Sie geben den Amazon-Ressourcennamen (ARN) eines AWS Secrets Manager Geheimnisses an. Das Geheimnis wird in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "username": "user name", "password": "password" }

    Wenn Sie die OAuth 2.0-Authentifizierung verwenden möchten, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "clientId": "client ID", "clientSecret": "client secret", "tokenUrl": "token URL" }
  • IAM role — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und den Aufruf der erforderlichen öffentlichen APIs für den Alfresco-Connector und zu erteilen. Amazon Kendra Weitere Informationen finden Sie unter IAM Rollen für Alfresco-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfigurieren von Amazon Kendra für die Verwendung eines Amazon VPC.

  • Inhaltstyp — Der Inhaltstyp, den Sie crawlen möchten, unabhängig davon, ob es sich um Inhalte handelt, die mit „Aspekten“ gekennzeichnet sindAlfresco, Inhalte innerhalb einer bestimmten Alfresco Website oder Inhalte auf all Ihren Websites. Alfresco Sie können auch bestimmte „Aspekte“ -Inhalte auflisten.

  • Inklusions- und Ausschlussfilter — Geben Sie an, ob bestimmte Dateien ein- oder ausgeschlossen werden sollen.

    Anmerkung

    Die meisten Datenquellen verwenden Muster mit regulären Ausdrücken, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

  • Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung der Suchergebnisse zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

  • Feldzuordnungen — Wählen Sie diese Option, um Ihre Alfresco-Datenquellenfelder Ihren Indexfeldern zuzuordnen. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen zu können. Amazon Kendra Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unter AlfrescoVorlagenschema.

Weitere Informationen

Weitere Informationen zur Integration Amazon Kendra mit Ihrer Alfresco-Datenquelle finden Sie unter: