

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Generative künstliche Intelligenz von Amazon DocumentDB
<a name="generative-ai"></a>

Amazon DocumentDB bietet Funktionen, mit denen Modelle für maschinelles Lernen (ML) und generative künstliche Intelligenz (KI) in Echtzeit mit in Amazon DocumentDB gespeicherten Daten arbeiten können. Kunden müssen keine Zeit mehr damit verbringen, separate Infrastrukturen zu verwalten, Code für die Verbindung mit einem anderen Service zu schreiben und Daten aus ihrer Primärdatenbank zu duplizieren.

Weitere Informationen zu künstlicher Intelligenz und dazu, wie Sie Ihre KI-Anforderungen unterstützen AWS können, finden Sie in diesem [„Was ist“ -Artikel](https://aws.amazon.com/what-is/artificial-intelligence/).

**Topics**
+ [Maschinelles Lernen ohne Code mit Amazon SageMaker AI Canvas](no-code-machine-learning.md)
+ [Vektorsuche für Amazon DocumentDB](vector-search.md)

# Maschinelles Lernen ohne Code mit Amazon SageMaker AI Canvas
<a name="no-code-machine-learning"></a>

Mit [Amazon SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html) können Sie Ihre eigenen AI/ML Modelle erstellen, ohne eine einzige Codezeile schreiben zu müssen. Sie können ML-Modelle für gängige Anwendungsfälle wie Regression und Prognose erstellen und auf Fundamentmodelle (FMs) von Amazon Bedrock zugreifen und diese auswerten. Sie können auch FMs von Amazon SageMaker AI aus auf public zugreifen, JumpStart um Inhalte zu generieren, Text zu extrahieren und Text zusammenzufassen, um generative KI-Lösungen zu unterstützen.

## Wie erstellt man ML-Modelle ohne Code mit AI Canvas SageMaker
<a name="w2aac21b9b5"></a>

Amazon DocumentDB ist jetzt in Amazon SageMaker AI Canvas integriert, um maschinelles Lernen (ML) ohne Code mit in Amazon DocumentDB gespeicherten Daten zu ermöglichen. Sie können jetzt ML-Modelle für Regressions- und Prognoseanforderungen erstellen und Basismodelle für die Zusammenfassung und Generierung von Inhalten verwenden, indem Sie in Amazon DocumentDB gespeicherte Daten verwenden, ohne eine einzige Codezeile schreiben zu müssen.

SageMaker AI Canvas bietet eine visuelle Oberfläche, über die Amazon DocumentDB-Kunden Prognosen erstellen können, ohne dass AI/ML Fachwissen erforderlich ist oder eine einzige Codezeile geschrieben werden muss. Kunden können jetzt den SageMaker AI Canvas-Workspace aus Amazon DocumentDB DocumentDB-Daten für die AWS-Managementkonsole Datenvorbereitung und das Modelltraining starten, importieren und verknüpfen. Daten in Amazon DocumentDB können jetzt in SageMaker AI Canvas verwendet werden, um Modelle zur Vorhersage der Kundenabwanderung, zur Aufdeckung von Betrug, zur Vorhersage von Wartungsausfällen, zur Prognose von Geschäftskennzahlen und zur Generierung von Inhalten zu erstellen und zu erweitern. Kunden können nun mithilfe der systemeigenen Integration von SageMaker AI Canvas mit Quick ML-gestützte Erkenntnisse veröffentlichen und teamübergreifend teilen. Datenerfassungspipelines in SageMaker AI Canvas werden standardmäßig auf sekundären Amazon DocumentDB DocumentDB-Instances ausgeführt, wodurch sichergestellt wird, dass die Leistung von Anwendungs- und SageMaker AI Canvas-Erfassungs-Workloads nicht beeinträchtigt wird.

Amazon DocumentDB-Kunden können mit SageMaker AI Canvas beginnen, indem sie zur neuen Amazon DocumentDB No-Code ML Console-Seite navigieren und sich mit neuen oder verfügbaren SageMaker AI Canvas-Workspaces verbinden.

## Konfiguration der AI-Domäne und des Benutzerprofils SageMaker
<a name="sagemaker-domain"></a>

Sie können von SageMaker AI-Domänen aus, die im Modus Nur VPC ausgeführt werden, eine Verbindung zu Amazon DocumentDB-Clustern herstellen. Durch den Start einer SageMaker KI-Domain in Ihrer VPC können Sie den Datenfluss von Ihren SageMaker AI Studio- und Canvas-Umgebungen aus steuern. Auf diese Weise können Sie den Internetzugang einschränken, den Datenverkehr mithilfe standardmäßiger AWS Netzwerk- und Sicherheitsfunktionen überwachen und überprüfen und über VPC-Endpunkte eine Verbindung zu anderen AWS Ressourcen herstellen. Informationen zur Erstellung Ihrer [ SageMaker KI-Domain für die Verbindung mit Ihrem Amazon DocumentDB-Cluster finden Sie unter Amazon SageMaker AI Canvas Getting started](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html) [und Configure Amazon SageMaker AI Canvas in a VPC without internet access](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-vpc.html) *im Amazon SageMaker AI Developer Guide*.

## Konfiguration von IAM-Zugriffsberechtigungen für Amazon DocumentDB und AI Canvas SageMaker
<a name="iam-access-canvas"></a>

Ein Amazon DocumentDB DocumentDB-Benutzer, `AmazonDocDBConsoleFullAccess` der seiner zugehörigen Rolle und Identität zugeordnet ist, kann auf die AWS-Managementkonsole zugreifen. Fügen Sie der oben genannten Rolle oder Identität die folgenden Aktionen hinzu, um Zugriff auf maschinelles Lernen ohne Code mit Amazon SageMaker AI Canvas zu gewähren.

```
"sagemaker:CreatePresignedDomainUrl",
"sagemaker:DescribeDomain",
"sagemaker:ListDomains",
"sagemaker:ListUserProfiles"
```

## Datenbankbenutzer und Rollen für SageMaker AI Canvas erstellen
<a name="w2aac21b9c11"></a>

Mithilfe der rollenbasierten Zugriffskontrolle (RBAC) in Amazon DocumentDB können Sie den Zugriff auf die Aktionen einschränken, die Benutzer an Datenbanken ausführen können. Bei RBAC werden einem Benutzer eine oder mehrere Rollen gewährt. Diese Rollen bestimmen die Operationen, die ein Benutzer mit Datenbankressourcen ausführen kann. 

Als Canvas-Benutzer stellen Sie mit Benutzernamen und Passwort eine Verbindung zu einer Amazon DocumentDB DocumentDB-Datenbank her. Mithilfe der Amazon DocumentDB RBAC-Funktionalität können Sie eine Datenbank user/role für einen Canvas-Benutzer erstellen, der Lesezugriff auf die jeweiligen Datenbanken hat.

Verwenden Sie zum Beispiel den Vorgang: `createUser`

```
db.createUser({
user: "canvas_user", 
pwd: "<insert-password>", 
roles: [{role: "read", db: "sample-database-1"}]
})
```

Dadurch wird eine erstellt`canvas_user`, die über Leseberechtigungen für die `sample-database-1` Datenbank verfügt. Ihre Canvas-Analysten können diese Anmeldeinformationen verwenden, um auf Daten in Ihrem Amazon DocumentDB-Cluster zuzugreifen. Weitere Informationen finden [Datenbankzugriff mithilfe der rollenbasierten Zugriffskontrolle](role_based_access_control.md) Sie unter. 

## Verfügbare Regionen
<a name="available-regions"></a>

Die No-Code-Integration ist in Regionen verfügbar, in denen sowohl Amazon DocumentDB als auch Amazon SageMaker AI Canvas unterstützt werden. Zu den Regionen gehören:
+ us-east-1 (N. Virginia)
+ us-east-2 (Ohio)
+ us-west-2 (Oregon)
+ ap-northeast-1 (Tokyo)
+ ap-northeast-2 (Seoul)
+ ap-south-1 (Mumbai)
+ ap-southeast-1 (Singapur)
+ ap-southeast-2 (Sydney)
+ eu-central-1 (Frankfurt)
+ eu-west-1 (Ireland)

Die aktuelle Verfügbarkeit in der Region finden Sie unter [Amazon SageMaker SageMaker AI Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html) *im Amazon AI Developer Guide*.

# Vektorsuche für Amazon DocumentDB
<a name="vector-search"></a>

Die Vektorsuche ist eine Methode, die beim maschinellen Lernen verwendet wird, um Datenpunkte zu finden, die einem bestimmten Datenpunkt ähneln, indem ihre Vektordarstellungen anhand von Entfernungs- oder Ähnlichkeitsmetriken verglichen werden. Je näher sich die beiden Vektoren im Vektorraum befinden, desto ähnlicher wird davon ausgegangen, dass sich die zugrunde liegenden Elemente ähneln. Diese Technik hilft dabei, die semantische Bedeutung der Daten zu erfassen. Dieser Ansatz ist in verschiedenen Anwendungen nützlich, z. B. in Empfehlungssystemen, Verarbeitung natürlicher Sprache und Bilderkennung.

Die Vektorsuche für Amazon DocumentDB kombiniert die Flexibilität und die umfangreichen Abfragefunktionen einer JSON-basierten Dokumentendatenbank mit der Leistungsfähigkeit der Vektorsuche. Wenn Sie Ihre vorhandenen Amazon DocumentDB-Daten oder eine flexible Dokumentendatenstruktur verwenden möchten, um Anwendungsfälle für maschinelles Lernen und generative KI wie semantische Suche, Produktempfehlungen, Personalisierung, Chatbots, Betrugserkennung und Anomalieerkennung zu erstellen, dann ist die Vektorsuche für Amazon DocumentDB die ideale Wahl für Sie. Die Vektorsuche ist auf instanzbasierten Amazon DocumentDB 5.0-Clustern verfügbar.

**Topics**
+ [Vektoren einfügen](#w2aac21c11b9)
+ [Einen Vektorindex erstellen](#w2aac21c11c11)
+ [Eine Indexdefinition abrufen](#w2aac21c11c13)
+ [Abfragen von Vektoren](#w2aac21c11c15)
+ [Funktionen und Einschränkungen](#vector-limitations)
+ [Best Practices](#w2aac21c11c19)

## Vektoren einfügen
<a name="w2aac21c11b9"></a>

Um Vektoren in Ihre Amazon DocumentDB DocumentDB-Datenbank einzufügen, können Sie bestehende Einfügemethoden verwenden: 

**Beispiel**

Im folgenden Beispiel wird eine Sammlung von fünf Dokumenten in einer Testdatenbank erstellt. Jedes Dokument enthält zwei Felder: den Produktnamen und die entsprechende Vektoreinbettung.

```
db.collection.insertMany([
  {"product_name": "Product A", "vectorEmbedding": [0.2, 0.5, 0.8]},
  {"product_name": "Product B", "vectorEmbedding": [0.7, 0.3, 0.9]},
  {"product_name": "Product C", "vectorEmbedding": [0.1, 0.2, 0.5]},
  {"product_name": "Product D", "vectorEmbedding": [0.9, 0.6, 0.4]},
  {"product_name": "Product E", "vectorEmbedding": [0.4, 0.7, 0.2]}
]);
```

## Einen Vektorindex erstellen
<a name="w2aac21c11c11"></a>

Amazon DocumentDB unterstützt die Indexierungsmethoden Hierarchical Navigable Small World (HNSW) und Inverted File with Flat Compression (). IVFFlat Ein IVFFlat Index unterteilt Vektoren in Listen und durchsucht anschließend eine ausgewählte Teilmenge der Listen, die dem Abfragevektor am nächsten sind. Andererseits organisiert ein HNSW-Index die Vektordaten in einem vielschichtigen Diagramm. HNSW hat zwar im Vergleich zu langsamere Erstellungszeiten IVFFlat, bietet aber eine bessere Abfrageleistung und einen besseren Abruf. Im IVFFlat Gegensatz zu HNSW ist kein Trainingsschritt erforderlich, sodass der Index ohne anfängliches Laden von Daten generiert werden kann. Für die meisten Anwendungsfälle empfehlen wir, den HNSW-Indextyp für die Vektorsuche zu verwenden.

Wenn Sie keinen Vektorindex erstellen, führt Amazon DocumentDB eine exakte Suche nach dem nächsten Nachbarn durch und gewährleistet so einen perfekten Wiedererkennungswert. In Produktionsszenarien ist Geschwindigkeit jedoch entscheidend. Wir empfehlen die Verwendung von Vektorindizes, bei denen ein gewisser Rückruf gegen eine höhere Geschwindigkeit eingetauscht werden kann. Es ist wichtig zu beachten, dass das Hinzufügen eines Vektorindexes zu unterschiedlichen Abfrageergebnissen führen kann.

**Vorlagen**

Sie können die folgenden `createIndex` oder `runCommand` Vorlagen verwenden, um einen Vektorindex für ein Vektorfeld zu erstellen:

------
#### [ Using createIndex ]

In bestimmten Treibern, wie z. B. Mongosh und Java, `createIndex` kann die Verwendung der `vectorOptions` Parameter in zu einem Fehler führen. In solchen Fällen empfehlen wir die Verwendung von`runCommand`:

```
db.collection.createIndex(
  { "<vectorField>": "vector" },
  { "name": "<indexName>",
    "vectorOptions": {
      "type": " <hnsw> | <ivfflat> ",
      "dimensions": <number_of_dimensions>,
      "similarity": " <euclidean> | <cosine> | <dotProduct> ",
      "lists": <number_of_lists> [applicable for IVFFlat],
      "m": <max number of connections> [applicable for HNSW],
      "efConstruction": <size of the dynamic list for index build> [applicable for HNSW]
    }
  }
);
```

------
#### [ Using runCommand ]

In bestimmten Treibern wie Mongosh und Java `createIndex` kann die Verwendung der `vectorOptions` Parameter in zu einem Fehler führen. In solchen Fällen empfehlen wir die Verwendung von`runCommand`:

```
db.runCommand(
  { "createIndexes": "<collection>", 
  "indexes": [{
      key: { "<vectorField>": "vector" },
      vectorOptions: {
          type: " <hnsw> | <ivfflat> ",
          dimensions: <number of dimensions>,
          similarity: " <euclidean> | <cosine> | <dotProduct> ",
          lists: <number_of_lists> [applicable for IVFFlat],
          m: <max number of connections> [applicable for HNSW],
          efConstruction: <size of the dynamic list for index build> [applicable for HNSW]
          },
      name: "myIndex" 
      }] 
  }
);
```

------


| Parameter | Anforderung | Datentyp | Description | Wert (e) | 
| --- | --- | --- | --- | --- | 
|  **name**  |  optional  |  Zeichenfolge  |  Gibt den Namen des Indexes an.  |  Alphanumerisch  | 
|  **type**  |  optional  |    |  Gibt den Indextyp an.  |  Unterstützt: hnsw oder ivfflat Standard: HNSW (Engine-Patch 3.0.4574 und höher)  | 
|  **dimensions**  |  Erforderlich  |  Ganzzahl  |  Gibt die Anzahl der Dimensionen in den Vektordaten an.  |  Maximal 2.000 Dimensionen.  | 
|  **similarity**  |  Erforderlich  |  Zeichenfolge  |  Gibt die Entfernungsmetrik an, die für die Ähnlichkeitsberechnung verwendet wird.  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/documentdb/latest/developerguide/vector-search.html)  | 
|  **lists**  |  erforderlich für IVFFlat  |  Ganzzahl  |  Gibt die Anzahl der Cluster an, die der IVFFlat Index verwendet, um die Vektordaten zu gruppieren. Die empfohlene Einstellung ist die Anzahl der Dokumente/1000 für bis zu 1 Mio. Dokumente und `sqrt(# of documents)` für über 1 Mio. Dokumente.  |  Minimum: 1 Maximum: Weitere Informationen finden Sie in der folgenden Tabelle mit den Listen pro Instanztyp. [Funktionen und Einschränkungen](#vector-limitations)  | 
|  **m**  |  optional  |  Ganzzahl  |  Gibt die maximale Anzahl von Verbindungen für einen HNSW-Index an  |  Standard: 16 Bereich [2, 100]  | 
|  **efConstruction**  |  optional  |  Ganzzahl  |  Gibt die Größe der dynamischen Kandidatenliste für die Erstellung des Graphen für den HNSW-Index an. `efConstruction`muss größer oder gleich (2 \$1 m) sein  |  Standard: 64 Bereich [4, 1000]  | 

Es ist wichtig, dass Sie den Wert von Unterparametern wie `lists` für IVFFlat und `m` und `efConstruction` für HNSW entsprechend festlegen, da sich dies auf die Genauigkeit/den Abruf, die Erstellungszeit und die Leistung Ihrer Suche auswirkt. Ein höherer Listenwert erhöht die Geschwindigkeit der Abfrage, da dadurch die Anzahl der Vektoren in jeder Liste reduziert wird, was zu kleineren Regionen führt. Eine kleinere Regionsgröße kann jedoch zu mehr Erinnerungsfehlern führen, was wiederum zu einer geringeren Genauigkeit führt. Bei HNSW `efConstruction` erhöht sich durch die Erhöhung des Werts von `m` und die Genauigkeit, aber auch die Zeit und Größe der Indexerstellung. Im Folgenden sind einige Beispiele aufgeführt:

**Beispiele**

------
#### [ HNSW ]

```
db.collection.createIndex(
  { "vectorEmbedding": "vector" },
  { "name": "myIndex",
    "vectorOptions": {
      "type": "hnsw",
      "dimensions": 3,
      "similarity": "euclidean",
      "m": 16,
      "efConstruction": 64
    }
  }
);
```

------
#### [ IVFFlat ]

```
db.collection.createIndex(
  { "vectorEmbedding": "vector" },
  { "name": "myIndex",
    "vectorOptions": {
      "type": "ivfflat",
      "dimensions": 3,
      "similarity": "euclidean",
      "lists":1
    }
  }
)
```

------

## Eine Indexdefinition abrufen
<a name="w2aac21c11c13"></a>

Sie können die Details Ihrer Indizes, einschließlich Vektorindizes, mit dem `getIndexes` folgenden Befehl anzeigen:

**Beispiel**

```
db.collection.getIndexes()
```

**Beispielausgabe**

```
[
 {
  "v" : 4,
  "key" : {
   "_id" : 1
  },
  "name" : "_id_",
  "ns" : "test.collection"
 },
 {
  "v" : 4,
  "key" : {
   "vectorEmbedding" : "vector"
  },
  "name" : "myIndex",
  "vectorOptions" : {
   "type" : "ivfflat",
   "dimensions" : 3,
   "similarity" : "euclidean",
   "lists" : 1
  },
  "ns" : "test.collection"
 }
]
```

## Abfragen von Vektoren
<a name="w2aac21c11c15"></a>

Amazon DocumentDB unterstützt zwei Vektorsuchoperatoren für die Abfrage von Vektoren:

### Klassischer Vektor-Suchoperator
<a name="w2aac21c11c15b5"></a>

Verwenden Sie die folgende Vorlage, um einen Vektor abzufragen:

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": <query vector>, 
        "path": "<vectorField>", 
        "similarity": "<distance metric>",
        "k": <number of results>,
        "probes":<number of probes> [applicable for IVFFlat],
        "efSearch":<size of the dynamic list during search> [applicable for HNSW]
      }
    }
  }
]);
```


| Parameter | Anforderung | Typ | Description | Wert (e) | 
| --- | --- | --- | --- | --- | 
|  **vectorSearch**  |  Erforderlich  |  operator  |  Wird im Befehl \$1search verwendet, um die Vektoren abzufragen.  |    | 
|  **vector**  |  Erforderlich  |  Array  |  Gibt den Abfragevektor an, der verwendet wird, um ähnliche Vektoren zu finden.  |    | 
|  **path**  |  Erforderlich  |  Zeichenfolge  |  Definiert den Namen des Vektorfeldes.  |    | 
|  **k**  |  Erforderlich  |  Ganzzahl  |  Gibt die Anzahl der Ergebnisse an, die die Suche zurückgibt.  |    | 
|  **similarity**  |  Erforderlich  |  Zeichenfolge  |  Gibt die Entfernungsmetrik an, die für die Ähnlichkeitsberechnung verwendet wird.  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/documentdb/latest/developerguide/vector-search.html)  | 
|  **probes**  |  optional  |  Ganzzahl  |  Die Anzahl der Cluster, die bei der Vektorsuche untersucht werden sollen. Ein höherer Wert sorgt für einen besseren Abruf auf Kosten der Geschwindigkeit. Er kann auf die Anzahl der Listen für die exakte Suche nach dem nächsten Nachbarn gesetzt werden (ab diesem Zeitpunkt verwendet der Planer den Index nicht mehr). Die empfohlene Einstellung, um mit der Feinabstimmung zu beginnen, ist`sqrt(# of lists)`.  |  Standard: 1  | 
|  **efSearch**  |  optional  |  Ganzzahl  |  Gibt die Größe der dynamischen Kandidatenliste an, die der HNSW-Index bei der Suche verwendet. Ein höherer Wert von `efSearch` ermöglicht einen besseren Abruf auf Kosten der Geschwindigkeit.  |  Standard: 40 Bereich [1, 1000]  | 

Es ist wichtig, den Wert von `efSearch` (HNSW) oder `probes` (IVFFlat) genau einzustellen, um die gewünschte Leistung und Genauigkeit zu erreichen. Sehen Sie sich die folgenden Beispieloperationen an:

------
#### [ HNSW ]

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": [0.2, 0.5, 0.8], 
        "path": "vectorEmbedding", 
        "similarity": "euclidean",
        "k": 2,
        "efSearch": 40
      }
    }
  }
]);
```

------
#### [ IVFFlat ]

```
db.collection.aggregate([
  {
    $search: {
      "vectorSearch": {
        "vector": [0.2, 0.5, 0.8], 
        "path": "vectorEmbedding", 
        "similarity": "euclidean",
        "k": 2,
        "probes": 1
      }
    }
  }
]);
```

------

**Beispielausgabe**

Die Ausgabe dieser Operation sieht in etwa wie folgt aus:

```
{ "_id" : ObjectId("653d835ff96bee02cad7323c"), "product_name" : "Product A", "vectorEmbedding" : [ 0.2, 0.5, 0.8 ] }
{ "_id" : ObjectId("653d835ff96bee02cad7323e"), "product_name" : "Product C", "vectorEmbedding" : [ 0.1, 0.2, 0.5 ] }
```

### `$vectorSearch`Operator (ab Amazon DocumentDB 8.0 verfügbar)
<a name="w2aac21c11c15b7"></a>

Verwenden Sie die folgende Vorlage, um einen Vektor abzufragen:

```
db.collection.aggregate([
{
  "$vectorSearch": {
    "exact": true | false,
    "index": "<index-name>" [supports only HNSW index],
    "limit": <number-of-results> [same as k],
    "path": "<vector field-to-search>",
    "queryVector": <array-of-numbers>,
    "numCandidates": <number-of-candidates> [same as efSearch], 
  }
}])
```

## Funktionen und Einschränkungen
<a name="vector-limitations"></a>

**Versionskompatibilität**
+ Die Vektorsuche für Amazon DocumentDB ist nur auf Amazon DocumentDB 5.0\$1 instanzbasierten Clustern verfügbar.

**Vektoren**
+ Amazon DocumentDB kann Vektoren mit bis zu 2.000 Dimensionen indizieren. Es können jedoch bis zu 16.000 Dimensionen ohne Index gespeichert werden.

**Indizes**
+ Für die IVFFlat Indexerstellung ist die empfohlene Einstellung für den Listenparameter die Anzahl der Dokumente/1000 für bis zu 1 Million Dokumente und `sqrt(# of documents)` für über 1 Million Dokumente. Aufgrund eines Arbeitsspeicherlimits unterstützt Amazon DocumentDB je nach Anzahl der Dimensionen einen bestimmten Höchstwert des Lists-Parameters. Zu Ihrer Information enthält die folgende Tabelle die Höchstwerte des Listenparameters für Vektoren mit 500, 1000 und 2.000 Dimensionen:    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/documentdb/latest/developerguide/vector-search.html)
+ Keine anderen Indexoptionen wie `compound` Vektorindizes `sparse` oder `partial` werden von Vektorindizes unterstützt.
+ Die parallele Indexerstellung wird für den HNSW-Index in Amazon DocumentDB 5.0 nicht unterstützt.

**Vektor-Abfrage**
+ Bei der Vektor-Suchanfrage ist es wichtig, die Parameter wie `probes` oder `efSearch` für optimale Ergebnisse zu optimieren. Je höher der Wert des `efSearch` Parameters `probes` oder, desto höher der Abruf und desto niedriger die Geschwindigkeit. Die empfohlene Einstellung, um mit der Feinabstimmung des Sondenparameters zu beginnen, ist`sqrt(# of lists)`. 

## Best Practices
<a name="w2aac21c11c19"></a>

Lernen Sie bewährte Methoden für die Arbeit mit der Vektorsuche in Amazon DocumentDB kennen. Dieser Abschnitt wird fortlaufend aktualisiert, wenn neue bewährte Methoden identifiziert werden.
+ Bei der Indexerstellung von Inverted File with Flat Compression (IVFFlat) werden die Datenpunkte auf der Grundlage von Ähnlichkeiten gruppiert und organisiert. Damit ein Index effektiver ist, empfehlen wir daher, vor der Indexerstellung zumindest einige Daten zu laden. 
+ Bei Vektor-Suchanfragen ist es wichtig, die Parameter genau einzustellen, um `efSearch` optimale Ergebnisse zu erzielen. `probes` Je höher der Wert des `efSearch` Parameters `probes` oder ist, desto höher ist der Recall und desto niedriger ist die Geschwindigkeit. Die empfohlene Einstellung, um mit der Feinabstimmung des `probes` Parameters zu beginnen, ist`sqrt(lists)`. 

**Ressourcen**
+ [Vektorsuche: Was ist ein neuer Blogbeitrag?](https://aws.amazon.com/blogs/aws/vector-search-for-amazon-documentdb-with-mongodb-compatibility-is-now-generally-available)
+ [Beispiel für einen semantischen Suchcode](https://github.com/aws-samples/amazon-documentdb-samples/tree/master/blogs/semanticsearch-docdb)
+ [Codebeispiele für die Vektorsuche in Amazon DocumentDB](https://github.com/aws-samples/amazon-documentdb-samples/tree/master/samples/vector-search)