Microsoft SQL Server - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Microsoft SQL Server

Microsoft SQL Serverist ein von Microsoft entwickeltes relationales Datenbankmanagementsystem (RDBMS). Wenn Sie ein Microsoft SQL Server Benutzer sind, können Sie es verwenden, um Ihre Microsoft SQL Server Datenquelle Amazon Kendra zu indizieren. Der Amazon Kendra Microsoft SQL Server Datenquellenconnector unterstützt MS SQL Server 2019.

Sie können über Amazon Kendra die Amazon Kendra Konsole und die TemplateConfigurationAPI eine Verbindung zu Ihrer Microsoft SQL Server Datenquelle herstellen.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Microsoft SQL Server Datenquellen-Connector finden Sie unterProblembehandlung bei Datenquellen.

Unterstützte Features

  • Feldzuordnungen

  • Filterung des Benutzerkontextes

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Microsoft SQL Server Datenquelle Amazon Kendra zum Indizieren verwenden können, nehmen Sie diese Änderungen in Ihren Konten Microsoft SQL Server und AWS Konten vor.

Stellen Sie sicherMicrosoft SQL Server, dass Sie Folgendes haben:

  • Haben Sie sich Ihren Datenbank-Benutzernamen und Ihr Passwort notiert.

    Wichtig

    Es hat sich bewährt, nur lesbare Amazon Kendra Datenbankanmeldeinformationen zur Verfügung zu stellen.

  • Die URL, der Port und die Instanz Ihres Datenbank-Hosts wurden kopiert.

  • Vergewissert, dass jedes Dokument in Microsoft SQL Server und zwischen anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokument-IDs gelten für einen Index global und müssen pro Index eindeutig sein.

Stellen Sie sicher AWS-Konto, dass Sie Folgendes in Ihrem haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Wir haben Ihre Microsoft SQL Server Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Microsoft SQL Server Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Microsoft SQL Server Datenquelle herzustellen, müssen Sie Details zu Ihren Microsoft SQL Server Anmeldeinformationen angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Falls Sie das noch nicht konfiguriert haben, Amazon Kendra sehen Sie Microsoft SQL Server nachVoraussetzungen.

Console

Um eine Verbindung Amazon Kendra herzustellen Microsoft SQL Server

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Microsoft SQL ServerConnector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Microsoft SQL ServerConnector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter aus.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. Geben Sie im Feld Quelle die folgenden Informationen ein:

    2. Host — Geben Sie den Datenbank-Hostnamen ein.

    3. Port — Geben Sie den Datenbankport ein.

    4. Instanz — Geben Sie die Datenbankinstanz ein.

    5. Speicherort für SSL-Zertifikate aktivieren — Geben Sie hier den Amazon S3 Pfad zu Ihrer SSL-Zertifikatsdatei ein.

    6. Geben Sie im Feld Authentifizierung die folgenden Informationen ein:

      1. AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis aus, oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Microsoft SQL Server Authentifizierungsdaten zu speichern. Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

        1. Geben Sie die folgenden Informationen in das Fenster Create an AWS Secrets Manager Secret ein:

          1. Geheimer Name — Ein Name für Ihr Geheimnis. Das Präfix 'AmazonKendra- Microsoft SQL Server -' wird Ihrem geheimen Namen automatisch hinzugefügt.

          2. Geben Sie für Datenbankbenutzername und Passwort die Werte der Authentifizierungsdaten ein, die Sie aus Ihrer Datenbank kopiert haben.

        2. Wählen Sie Speichern.

    7. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    8. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    9. Wählen Sie Weiter aus.

  7. Geben Sie auf der Seite Synchronisierungseinstellungen konfigurieren die folgenden Informationen ein:

    1. Wählen Sie unter Synchronisierungsbereich eine der folgenden Optionen aus:

      • SQL-Abfrage — Geben Sie SQL-Abfrageanweisungen wie SELECT- und JOIN-Operationen ein. SQL-Abfragen müssen weniger als 32 KB groß sein. Amazon Kendra durchsucht den gesamten Datenbankinhalt, der Ihrer Abfrage entspricht.

        Anmerkung

        Wenn ein Tabellenname Sonderzeichen (nicht alphanumerisch) enthält, müssen Sie den Tabellennamen in eckige Klammern setzen. Wählen Sie beispielsweise * aus [] my-database-table

      • Primärschlüsselspalte — Geben Sie den Primärschlüssel für die Datenbanktabelle an. Dies identifiziert eine Tabelle in Ihrer Datenbank.

      • Titelspalte — Geben Sie den Namen der Titelspalte des Dokuments in Ihrer Datenbanktabelle an.

      • Hauptspalte — Geben Sie den Namen der Hauptspalte des Dokuments in Ihrer Datenbanktabelle an.

    2. Wählen Sie unter Zusätzliche Konfiguration — optional aus den folgenden Optionen, um bestimmte Inhalte zu synchronisieren, anstatt alle Dateien zu synchronisieren:

      • Spalten zur Erkennung von Änderungen — Geben Sie die Namen der Spalten ein, anhand derer Inhaltsänderungen erkannt Amazon Kendra werden sollen. Amazon Kendra indexiert den Inhalt neu, wenn sich eine dieser Spalten ändert.

      • Spalte mit Benutzer-IDs — Geben Sie den Namen der Spalte ein, die Benutzer-IDs enthält, um Zugriff auf Inhalte zu erhalten.

      • Spalte „Gruppen“ — Geben Sie den Namen der Spalte ein, die Gruppen enthält, denen der Zugriff auf Inhalte gewährt werden soll.

      • Spalte Quell-URLs — Geben Sie den Namen der Spalte ein, die Quell-URLs enthält, die indexiert werden sollen.

      • Spalte mit Zeitstempeln — Geben Sie den Namen der Spalte ein, die Zeitstempel enthält. Amazon Kendra verwendet Zeitstempelinformationen, um Änderungen an Ihren Inhalten zu erkennen und nur geänderte Inhalte zu synchronisieren.

      • Spalte „Zeitzonen“ — Geben Sie den Namen der Spalte ein, die Zeitzonen für den Inhalt enthält, der gecrawlt werden soll.

      • Zeitstempelformat — Geben Sie den Namen der Spalte ein, die Zeitstempelformate enthält, anhand derer Inhaltsänderungen erkannt und Ihre Inhalte erneut synchronisiert werden sollen.

    3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie alle Inhalte neu und ersetzen vorhandene Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    4. Im Synchronisierungslaufplan für Frequenz — Wie oft Amazon Kendra wird mit Ihrer Datenquelle synchronisiert?

    5. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Wählen Sie aus den generierten Standard-Datenquellenfeldern — Dokument-IDs, Dokumenttitel und Quell-URLs — aus, die Sie dem Index zuordnen möchten. Amazon Kendra

    2. Feld hinzufügen — Um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter aus.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra herzustellen Microsoft SQL Server

Mithilfe der TemplateConfigurationAPI müssen Sie Folgendes angeben:

  • Datenquelle — Geben Sie den Datenquellentyp wie JDBC bei der Verwendung des TemplateConfigurationJSON-Schemas an. Geben Sie außerdem die Datenquelle so anTEMPLATE, wie Sie die CreateDataSourceAPI aufrufen.

  • Datenbanktyp — Sie müssen den Datenbanktyp als sqlserver angeben.

  • SQL-Abfrage — Geben Sie SQL-Abfrageanweisungen wie SELECT- und JOIN-Operationen an. SQL-Abfragen müssen weniger als 32 KB groß sein. Amazon Kendra durchsucht den gesamten Datenbankinhalt, der Ihrer Abfrage entspricht.

    Anmerkung

    Wenn ein Tabellenname Sonderzeichen (nicht alphanumerisch) enthält, müssen Sie den Tabellennamen in eckige Klammern setzen. Wählen Sie beispielsweise * aus [] my-database-table

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    • CHANGE_LOGum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten enthält, die Sie in Ihrem Microsoft SQL Server Konto erstellt haben. Das Geheimnis wird in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "user name": "database user name", "password": "password" }
    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und den Aufruf der erforderlichen öffentlichen APIs für den Microsoft SQL Server Connector und zum Aufrufen der erforderlichen öffentlichen APIs zu erteilen. Amazon Kendra Weitere Informationen finden Sie unter IAM Rollen für Microsoft SQL Server Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfigurieren Amazon Kendra um eine zu verwenden Amazon VPC.

  • Inklusions- und Ausschlussfilter — Sie können mithilfe von Benutzer-IDs, Gruppen, Quell-URLs, Zeitstempeln und Zeitzonen angeben, ob bestimmte Inhalte eingeschlossen werden sollen.

  • Benutzerkontextfilterung und Zugriffskontrolle —Amazon Kendra durchsucht die Zugriffskontrollliste (ACL) für Ihre Dokumente, sofern Sie über eine ACL für Ihre Dokumente verfügen. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

  • Feldzuordnungen — Wählen Sie diese Option, um Ihre Microsoft SQL Server Datenquellenfelder Ihren Indexfeldern zuzuordnen. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unterMicrosoft SQL Server-Vorlagenschema.

Hinweise

  • Gelöschte Datenbankzeilen werden nicht nachverfolgt, wenn nach Amazon Kendra aktualisierten Inhalten gesucht wird.

  • Die Größe von Feldnamen und Werten in einer Zeile Ihrer Datenbank darf 400 KB nicht überschreiten.

  • Wenn Ihre Datenbankdatenquelle eine große Datenmenge enthält und Sie nicht Ihren gesamten Datenbankinhalt nach der ersten Synchronisierung indizieren möchten Amazon Kendra , können Sie wählen, ob nur neue, geänderte oder gelöschte Dokumente synchronisiert werden sollen.

  • Es hat sich bewährt, nur lesbare Amazon Kendra Datenbankanmeldeinformationen zur Verfügung zu stellen.

  • Es hat sich bewährt, das Hinzufügen von Tabellen mit sensiblen Daten oder personenbezogenen Daten (PII) zu vermeiden.