Connect zu Salesforce her, um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Connect zu Salesforce her, um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten

Salesforce ist ein Tool für das Kundenbeziehungsmanagement (CRM) zur Verwaltung von Support-, Vertriebs- und Marketingteams. Sie können eine Verbindung zu Ihrer Salesforce-Instanz für Ihre Amazon Bedrock-Wissensdatenbank herstellen, indem Sie entweder AWS Management-Konsole für Amazon Bedrock oder die CreateDataSourceAPI(siehe Amazon Bedrock) unterstützte und SDKs AWS CLI).

Anmerkung

Der Salesforce-Datenquellen-Connector befindet sich in der Vorschauversion und kann sich ändern.

Derzeit ist nur Amazon OpenSearch Serverless Vector Store für die Verwendung mit dieser Datenquelle verfügbar.

Die Anzahl der Dateien und MB pro Datei, die gecrawlt werden können, ist begrenzt. Informationen zu Wissensdatenbanken finden Sie unter Kontingente.

Unterstützte Features

  • Automatische Erkennung der wichtigsten Dokumentfelder

  • Inhaltsfilter zum Einschließen/Ausschließen

  • Inkrementelle Inhaltssynchronisierung für hinzugefügte, aktualisierte und gelöschte Inhalte

  • OAuth2.0-Authentifizierung

Voraussetzungen

Stellen Sie in Salesforce sicher, dass Sie:

  • Notieren Sie sich Ihre Salesforce-InstanzURL. Zum Beispiel https://company.salesforce.com/. Auf der Instanz muss eine Salesforce Connected-Anwendung ausgeführt werden.

  • Erstellen Sie eine Salesforce Connected-Anwendung und konfigurieren Sie die Kundenanmeldedaten. Kopieren Sie dann für Ihre ausgewählte Anwendung den Verbraucherschlüssel (Client-ID) und das Verbrauchergeheimnis (Kundengeheimnis) aus den OAuth Einstellungen. Weitere Informationen finden Sie in der Salesforce-Dokumentation zum Erstellen einer verbundenen Anwendung und zum Konfigurieren einer verbundenen Anwendung für die OAuth 2.0-Client-Anmeldeinformationen.

    Anmerkung

    Stellen Sie bei Salesforce Connected Apps unter Client Credentials Flow sicher, dass Sie im Feld „Run As“ den Namen oder Alias des Benutzers für Ihre Kundenanmeldedaten suchen und auswählen.

In Ihrem AWS Stellen Sie sicher, dass Sie:

  • Speichern Sie Ihre Authentifizierungsdaten in einem AWS Secrets Manager geheim und notieren Sie sich den Amazon-Ressourcennamen (ARN) des Geheimnisses. Folgen Sie den Anweisungen zur Verbindungskonfiguration auf dieser Seite, um die Schlüssel-Wert-Paare aufzunehmen, die in Ihrem Secret enthalten sein müssen.

  • Fügen Sie die erforderlichen Berechtigungen für die Verbindung mit Ihrer Datenquelle in Ihr AWS Identity and Access Management (IAM) Rollen-/Berechtigungsrichtlinie für Ihre Wissensdatenbank. Informationen zu den erforderlichen Berechtigungen für diese Datenquelle, die Sie Ihrer Wissensdatenbank hinzufügen können IAM Rolle finden Sie unter Berechtigungen für den Zugriff auf Datenquellen.

Anmerkung

Wenn Sie die Konsole verwenden, können Sie zu AWS Secrets Manager um Ihr Geheimnis hinzuzufügen oder ein vorhandenes Geheimnis als Teil des Konfigurationsschritts für die Datenquelle zu verwenden. Das Tool IAM Im Rahmen der Konsolenschritte zur Erstellung einer Wissensdatenbank kann für Sie eine Rolle mit allen erforderlichen Berechtigungen erstellt werden. Nachdem Sie Ihre Datenquelle und andere Konfigurationen konfiguriert haben, IAM Die Rolle mit allen erforderlichen Berechtigungen wird auf Ihre spezifische Wissensdatenbank angewendet.

Wir empfehlen, dass Sie Ihre Anmeldeinformationen und Ihren Geheimcode regelmäßig aktualisieren oder austauschen. Stellen Sie zu Ihrer eigenen Sicherheit nur die erforderliche Zugriffsebene bereit. Wir raten davon ab, Anmeldeinformationen und geheime Daten in verschiedenen Datenquellen wiederzuverwenden.

Konfiguration der Verbindung

Um eine Verbindung zu Ihrer Salesforce-Instanz herzustellen, müssen Sie die erforderlichen Konfigurationsinformationen angeben, damit Amazon Bedrock auf Ihre Daten zugreifen und sie crawlen kann. Sie müssen auch dem folgen. Voraussetzungen

Ein Beispiel für eine Konfiguration für diese Datenquelle ist in diesem Abschnitt enthalten.

Weitere Informationen zur auto Erkennung von Dokumentfeldern, Einschluss-/Ausschlussfiltern, inkrementeller Synchronisierung, geheimen Authentifizierungsdaten und deren Funktionsweise finden Sie unter:

Der Datenquellen-Connector erkennt und crawlt automatisch alle wichtigen Metadatenfelder Ihrer Dokumente oder Inhalte. Der Datenquellen-Connector kann beispielsweise den Dokumenttext durchsuchen, der Ihren Dokumenten entspricht, den Dokumenttitel, das Erstellungs- oder Änderungsdatum des Dokuments oder andere Kernfelder, die möglicherweise auf Ihre Dokumente zutreffen.

Wichtig

Wenn Ihr Inhalt vertrauliche Informationen enthält, Amazon Bedrock könnte mit vertraulichen Informationen antworten.

Sie können Filteroperatoren auf Metadatenfelder anwenden, um die Relevanz von Antworten weiter zu verbessern. Zum Beispiel das Dokument „epoch_modification_time“ oder die Anzahl der Sekunden, die seit dem 1. Januar 1970 vergangen sind, als das Dokument zuletzt aktualisiert wurde. Sie können nach den neuesten Daten filtern, wobei „epoch_modification_time“ größer als eine bestimmte Zahl ist. Weitere Informationen zu den Filteroperatoren, die Sie auf Ihre Metadatenfelder anwenden können, finden Sie unter Metadaten und Filterung.

Sie können das Crawlen bestimmter Inhalte ein- oder ausschließen. Sie können beispielsweise ein Ausschlusspräfix oder ein Muster für reguläre Ausdrücke angeben, um das Crawlen von Dateien zu überspringen, deren Dateiname „privat“ enthält. Sie können auch ein Einschlusspräfix/ein Muster für reguläre Ausdrücke angeben, um bestimmte Inhaltsentitäten oder Inhaltstypen einzubeziehen. Wenn Sie einen Inklusions- und Ausschlussfilter angeben und beide einem Dokument entsprechen, hat der Ausschlussfilter Vorrang und das Dokument wird nicht gecrawlt.

Ein Beispiel für ein Muster mit regulären Ausdrücken zum Ausschließen oder Herausfiltern von Kampagnen, die „privat“ im Kampagnennamen enthalten:“. *privat. *“

Sie können Einschluss-/Ausschlussfilter auf die folgenden Inhaltstypen anwenden:

  • Account: Kontonummer/Kennung

  • Attachment: Name der Anhangsdatei mit ihrer Erweiterung

  • Campaign: Kampagnenname und zugehörige Identifikatoren

  • ContentVersion: Version des Dokuments und zugehörige Identifikatoren

  • Partner: Felder mit Partnerinformationen, einschließlich der zugehörigen Kennungen

  • Pricebook2: Name der Produkt-/Preisliste

  • Case: Kundenanfrage-/Ausgabenummer und andere Informationsfelder, einschließlich der zugehörigen Kennungen (bitte beachten Sie: kann persönliche Informationen enthalten, die Sie ausschließen oder herausfiltern können)

  • Contact: Felder mit Kundeninformationen (bitte beachten Sie: Sie können persönliche Informationen enthalten, die Sie ausschließen oder herausfiltern können)

  • Contract: Vertragsname und zugehörige Identifikatoren

  • Document: Dateiname mit seiner Erweiterung

  • Idea: Informationsfelder für Ideen und zugehörige Identifikatoren

  • Lead: Felder mit potenziellen neuen Kundeninformationen (bitte beachten Sie: Sie können persönliche Informationen enthalten, die Sie ausschließen oder herausfiltern können)

  • Opportunity: Informationsfelder für ausstehende Verkaufs-/Geschäftsabschlüsse und zugehörige Kennungen

  • Product2: Felder mit Produktinformationen und zugehörige Kennungen

  • Solution: Lösungsname für eine Kundenanfrage/ein Kundenproblem und die zugehörigen Kennungen

  • Task: Felder mit Aufgabeninformationen und zugehörige Kennungen

  • FeedItem: Kennung des Chatter-Feed-Posts

  • FeedComment: Kennung des Chatter-Feed-Posts, zu dem die Kommentare gehören

  • Knowledge__kav: Version des Knowledge-Artikels und zugehörige Identifikatoren

  • User: Benutzeralias innerhalb Ihrer Organisation

  • CollaborationGroup: Chatter-Gruppenname (eindeutig)

Der Datenquellen-Connector crawlt bei jeder Synchronisierung Ihrer Datenquelle mit Ihrer Wissensdatenbank neue, geänderte und gelöschte Inhalte. Amazon Bedrock kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu crawlen, die sich seit der letzten Synchronisierung geändert haben. Wenn Sie Ihre Datenquelle zum ersten Mal mit Ihrer Wissensdatenbank synchronisieren, werden alle Inhalte standardmäßig gecrawlt.

Um Ihre Datenquelle mit Ihrer Wissensdatenbank zu synchronisieren, verwenden Sie die StartIngestionJobAPIoder wählen Sie Ihre Wissensdatenbank in der Konsole aus und wählen Sie im Bereich Datenquellenübersicht die Option Synchronisieren aus.

Wichtig

Alle Daten, die Sie aus Ihrer Datenquelle synchronisieren, stehen allen Personen zur Verfügung, die zum bedrock:Retrieve Abrufen der Daten berechtigt sind. Dies kann auch alle Daten mit kontrollierten Datenquellenberechtigungen einschließen. Weitere Informationen finden Sie unter Knowledgebase-Berechtigungen.

(Für die OAuth 2.0-Authentifizierung) Ihre geheimen Authentifizierungsdaten in AWS Secrets Manager sollte diese Schlüssel-Wert-Paare enthalten:

  • consumerKey: app client ID

  • consumerSecret: app client secret

  • authenticationUrl: Salesforce instance URL or the URL to request the authentication token from

Anmerkung

Dein Geheimnis in AWS Secrets Manager muss dieselbe Region Ihrer Wissensdatenbank verwenden.

Console

Im Folgenden finden Sie ein Beispiel für eine Konfiguration für die Verbindung mit Salesforce für Ihre Amazon Bedrock-Wissensdatenbank. Sie konfigurieren Ihre Datenquelle im Rahmen der Schritte zur Erstellung der Wissensdatenbank in der Konsole.

  1. Melden Sie sich an bei AWS Management Console Verwenden Sie eine IAMRolle mit Amazon Bedrock-Berechtigungen und öffnen Sie die Amazon Bedrock-Konsole unter. https://console.aws.amazon.com/bedrock/

  2. Wählen Sie im linken Navigationsbereich Wissensdatenbanken aus.

  3. Wählen Sie im Abschnitt Wissensdatenbanken die Option Wissensdatenbank erstellen aus.

  4. Geben Sie die Details der Wissensdatenbank an.

    1. Geben Sie den Namen der Wissensdatenbank und optional eine Beschreibung an.

    2. Geben Sie den AWS Identity and Access Management Rolle für die erforderlichen Zugriffsberechtigungen, die zum Erstellen einer Wissensdatenbank erforderlich sind.

      Anmerkung

      Das Tool IAM Eine Rolle mit allen erforderlichen Berechtigungen kann im Rahmen der Konsolenschritte zum Erstellen einer Wissensdatenbank für Sie erstellt werden. Nachdem Sie die Schritte zum Erstellen einer Wissensdatenbank abgeschlossen haben, IAM Die Rolle mit allen erforderlichen Berechtigungen wird auf Ihre spezifische Wissensdatenbank angewendet.

    3. Erstellen Sie alle Tags, die Sie Ihrer Wissensdatenbank zuweisen möchten.

    Gehen Sie zum nächsten Abschnitt, um Ihre Datenquelle zu konfigurieren.

  5. Wählen Sie Salesforce als Ihre Datenquelle und geben Sie die Details zur Verbindungskonfiguration an.

    1. Geben Sie den Namen der Datenquelle und eine optionale Beschreibung an.

    2. Geben Sie Ihre Salesforce-Instanz anURL. Zum Beispiel https://company.salesforce.com/. Auf der Instanz muss eine Salesforce Connected-Anwendung ausgeführt werden.

    Überprüfen Sie die erweiterten Einstellungen. Sie können optional die ausgewählten Standardeinstellungen ändern.

  6. Legen Sie in den erweiterten Einstellungen Ihren Schlüssel für die Verschlüsselung transienter Daten und die Richtlinie zum Löschen von Daten fest.

    Wählen Sie in der &Snowconsole; Ihren Auftrag aus der Tabelle. KMS key In den Einstellungen können Sie entweder einen benutzerdefinierten Schlüssel auswählen oder den standardmäßig bereitgestellten Datenverschlüsselungsschlüssel verwenden.

    Bei der Konvertierung Ihrer Daten in Einbettungen Amazon Bedrock verschlüsselt Ihre transienten Daten mit einem Schlüssel, der AWS besitzt und verwaltet standardmäßig. Sie können Ihren eigenen KMS Schlüssel verwenden. Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.

    Für die Richtlinieneinstellungen zum Löschen von Daten können Sie eine der folgenden Optionen wählen:

    • Löschen: Löscht alle Daten aus Ihrer Datenquelle, die beim Löschen einer Wissensdatenbank- oder Datenquellenressource in Vektoreinbettungen konvertiert wurden. Beachten Sie, dass nicht der Vektorspeicher selbst gelöscht wird, sondern nur die Daten. Dieses Flag wird ignoriert, wenn ein AWS Konto ist gelöscht.

    • Beibehalten: Behält alle Daten aus Ihrer Datenquelle bei, die beim Löschen einer Wissensdatenbank oder Datenquellenressource in Vektoreinbettungen umgewandelt wurden. Beachten Sie, dass der Vektorspeicher selbst nicht gelöscht wird, wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen.

    Fahren Sie mit der Konfiguration Ihrer Datenquelle fort.

  7. Geben Sie die Authentifizierungsinformationen ein, um eine Verbindung zu Ihrer Salesforce-Instanz herzustellen:

    1. Informationen zur OAuth 2.0-Authentifizierung finden Sie unter AWS Secrets Manager um Ihre geheimen Authentifizierungsdaten hinzuzufügen oder einen vorhandenen Amazon-Ressourcennamen (ARN) für das von Ihnen erstellte Geheimnis zu verwenden. Ihr geheimer Schlüssel muss den Verbraucherschlüssel (Client-ID) der Salesforce Connected App, den geheimen Verbraucherschlüssel (Kundengeheimnis) und die Salesforce-Instanz URL oder die, von der Sie das Authentifizierungstoken anfordern URL möchten, enthalten. Weitere Informationen finden Sie in der Salesforce-Dokumentation unter Erstellen einer verbundenen Anwendung und Konfigurieren einer verbundenen Anwendung für die OAuth 2.0-Client-Anmeldeinformationen.

    Fahren Sie mit der Konfiguration Ihrer Datenquelle fort.

  8. Wählen Sie, ob Sie Filter oder Muster mit regulären Ausdrücken verwenden möchten, um bestimmte Inhalte ein- oder auszuschließen. Andernfalls werden alle Standardinhalte gecrawlt.

    Fahren Sie mit der Konfiguration Ihrer Datenquelle fort.

  9. Wählen Sie entweder die Standard- oder die benutzerdefinierte Konfiguration für Chunking und Parsing.

    1. Wenn Sie benutzerdefinierte Einstellungen wählen, wählen Sie eine der folgenden Chunking-Optionen:

      • Chunking mit fester Größe: Inhalt, aufgeteilt in Textblöcke mit der von Ihnen festgelegten ungefähren Token-Größe. Sie können die maximale Anzahl von Tokens festlegen, die für einen Abschnitt nicht überschritten werden darf, und den Prozentsatz der Überlappungen zwischen aufeinanderfolgenden Blöcken festlegen.

      • Standard-Chunking: Inhalt wird in Textblöcke von bis zu 300 Tokens aufgeteilt. Wenn ein einzelnes Dokument oder ein Inhalt weniger als 300 Token enthält, wird das Dokument nicht weiter aufgeteilt.

      • Hierarchisches Chunking: Inhalt, der in verschachtelten Strukturen aus über- und untergeordneten Blöcken organisiert ist. Sie legen die maximale Größe des übergeordneten Chunk-Tokens und die maximale Größe des untergeordneten Chunk-Tokens fest. Sie legen auch die absolute Anzahl von Überlappungstoken zwischen aufeinanderfolgenden übergeordneten Chunks und aufeinanderfolgenden untergeordneten Chunks fest.

      • Semantisches Chunking: Inhalt, der in semantisch ähnliche Textblöcke oder Satzgruppen unterteilt ist. Sie legen die maximale Anzahl von Sätzen fest, die den Ziel-/aktuellen Satz umgeben, die gruppiert werden sollen (Puffergröße). Sie legen auch den Schwellenwert für das Perzentil am Breakpoint fest, um den Text in sinnvolle Abschnitte zu unterteilen. Beim semantischen Chunking wird ein Basismodell verwendet. Anzeigen von Amazon Bedrock Preisgestaltung für Informationen über die Kosten von Foundation-Modellen.

      • Keine Unterteilung: Jedes Dokument wird als einzelner Textblock behandelt. Möglicherweise möchten Sie Ihre Dokumente vorab verarbeiten, indem Sie sie in separate Dateien aufteilen.

      Anmerkung

      Sie können die Chunking-Strategie nicht ändern, nachdem Sie die Datenquelle erstellt haben.

    2. Sie können wählen, ob Amazon Bedrock das Basismodell für das Parsen von Dokumenten, um mehr als Standardtext zu analysieren. Sie können beispielsweise Tabellendaten in Dokumenten analysieren, deren Struktur intakt bleibt. Anzeigen von Amazon Bedrock Preisgestaltung für Informationen über die Kosten von Basismodellen.

    3. Sie können wählen, ob Sie eine verwenden möchten AWS Lambda Funktion, mit der Sie Ihre Chunking-Strategie und die Art und Weise, wie die Attribute/Felder Ihrer Dokumentmetadaten behandelt und aufgenommen werden, individuell anpassen können. Stellen Sie die bereit Amazon S3 Bucket-Position für die Eingabe und Ausgabe der Lambda-Funktion.

    Gehen Sie zum nächsten Abschnitt, um Ihren Vector Store zu konfigurieren.

  10. Wählen Sie ein Modell für die Konvertierung Ihrer Daten in Vektoreinbettungen.

    Erstellen Sie einen Vektorspeicher, um dies zu ermöglichen Amazon Bedrock um Einbettungen zu speichern, zu aktualisieren und zu verwalten. Sie können schnell einen neuen Vektorspeicher erstellen oder aus einem unterstützten Vektorspeicher auswählen, den Sie erstellt haben. Derzeit ist nur Amazon OpenSearch Serverless Vector Store für die Verwendung mit dieser Datenquelle verfügbar. Wenn Sie einen neuen Vektorspeicher erstellen, wird eine Amazon OpenSearch Serverless-Vektorsuchsammlung und ein Index mit den erforderlichen Feldern für Sie eingerichtet. Wenn Sie aus einem unterstützten Vektorspeicher auswählen, müssen Sie die Vektorfeldnamen und die Metadatenfeldnamen zuordnen.

    Gehen Sie zum nächsten Abschnitt, um Ihre Wissensdatenbank-Konfigurationen zu überprüfen.

  11. Überprüfen Sie die Details Ihrer Wissensdatenbank. Sie können jeden Abschnitt bearbeiten, bevor Sie Ihre Wissensdatenbank erstellen.

    Anmerkung

    Die Zeit, die für die Erstellung der Wissensdatenbank benötigt wird, hängt von Ihren spezifischen Konfigurationen ab. Wenn die Erstellung der Wissensdatenbank abgeschlossen ist, ändert sich der Status der Wissensdatenbank entweder in den Status „Bereit“ oder „Verfügbar“.

    Sobald Ihre Wissensdatenbank fertig und verfügbar ist, synchronisieren Sie Ihre Datenquelle zum ersten Mal und wann immer Sie Ihre Inhalte auf dem neuesten Stand halten möchten. Wählen Sie Ihre Wissensdatenbank in der Konsole aus und klicken Sie im Bereich Datenquellenübersicht auf Synchronisieren.

API

Im Folgenden finden Sie ein Beispiel für eine Konfiguration für die Verbindung mit Salesforce für Ihre Amazon Bedrock-Wissensdatenbank. Sie konfigurieren Ihre Datenquelle API mit dem AWS CLI oder unterstütztSDK, wie Python. Nach dem Aufrufen rufen Sie an CreateKnowledgeBase, CreateDataSourceum Ihre Datenquelle mit Ihren Verbindungsinformationen zu erstellendataSourceConfiguration. Denken Sie daran, auch Ihre Strategie bzw. Ihren Ansatz zum Chunking unter vectorIngestionConfiguration und Ihre Richtlinie zum Löschen von Daten unter anzugeben dataDeletionPolicy

AWS Command Line Interface

aws bedrock create-data-source \ --name "Salesforce connector" \ --description "Salesforce data source connector for Amazon Bedrock to use content in Salesforce" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://salesforce-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE" \ --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}' salesforce-bedrock-connector-configuration.json { "salesforceConfiguration": { "sourceConfiguration": { "hostUrl": "https://company.salesforce.com/", "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Salesforce" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "Campaign", "inclusionFilters": [ ".*public.*" ], "exclusionFilters": [ ".*private.*" ] } ] } } } }, "type": "SALESFORCE" }