Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Was ist Amazon OpenSearch Serverless?
Amazon OpenSearch Serverless ist eine serverlose On-Demand-Option für Amazon OpenSearch Service, die die betriebliche Komplexität der Bereitstellung, Konfiguration und Optimierung von Clustern überflüssig macht. OpenSearch Es ist ideal für Unternehmen, die es vorziehen, ihre Cluster nicht selbst zu verwalten, oder die nicht über die speziellen Ressourcen und das Fachwissen verfügen, um umfangreiche Bereitstellungen zu betreiben. Mit OpenSearch Serverless können Sie große Datenmengen durchsuchen und analysieren, ohne die zugrunde liegende Infrastruktur verwalten zu müssen.
Eine OpenSearch serverlose Sammlung ist eine Gruppe von OpenSearch Indizes, die zusammenarbeiten, um eine bestimmte Arbeitslast oder einen bestimmten Anwendungsfall zu unterstützen. Sammlungen vereinfachen den Betrieb im Vergleich zu selbstverwalteten OpenSearch Clustern, die eine manuelle Bereitstellung erfordern.
Sammlungen verwenden denselben verteilten und hochverfügbaren Speicher mit hoher Kapazität wie bereitgestellte OpenSearch Dienstdomänen, reduzieren jedoch die Komplexität weiter, da die manuelle Konfiguration und Optimierung entfällt. Daten innerhalb einer Sammlung werden bei der Übertragung verschlüsselt. OpenSearch Serverless unterstützt auch OpenSearch Dashboards und bietet so eine Schnittstelle für die Datenanalyse.
Derzeit wird für serverlose Sammlungen die Version 2.0.x ausgeführt OpenSearch . Wenn neue Versionen veröffentlicht werden, aktualisiert OpenSearch Serverless Sammlungen automatisch, um neue Funktionen, Bugfixes und Leistungsverbesserungen zu integrieren.
OpenSearch Serverless unterstützt dieselben Ingest- und Abfrage-API-Operationen wie die OpenSearch Open-Source-Suite, sodass Sie Ihre vorhandenen Clients und Anwendungen weiterhin verwenden können. Ihre Clients müssen mit OpenSearch 2.x kompatibel sein, um mit Serverless arbeiten zu können. OpenSearch Weitere Informationen finden Sie unter Daten in Amazon OpenSearch Serverless-Sammlungen aufnehmen.
Themen
Anwendungsfälle für Serverless OpenSearch
OpenSearch Serverless unterstützt zwei Hauptanwendungsfälle:
-
Protokollanalyse – Das Segment Protokollanalyse befasst sich mit der Analyse großer Mengen an halbstrukturierten, maschinell generierten Zeitreihendaten, um Einblicke in das Betriebs- und Benutzerverhalten zu erhalten.
-
Volltextsuche – Das Segment der Volltextsuche unterstützt Anwendungen in Ihren internen Netzwerken (Content-Management-Systeme, Rechtsdokumente) und mit dem Internet verbundene Anwendungen, wie z. B. die Inhaltssuche von E-Commerce-Websites.
Wenn Sie eine Sammlung erstellen, wählen Sie einen dieser Anwendungsfälle aus. Weitere Informationen finden Sie unter Auswahl eines Sammlungstyps.
Funktionsweise
Herkömmliche OpenSearch Cluster verfügen über einen einzigen Satz von Instances, die sowohl Indizierungs- als auch Suchvorgänge ausführen, und der Indexspeicher ist eng mit der Rechenkapazität verknüpft. Im Gegensatz dazu verwendet OpenSearch Serverless eine cloudnative Architektur, die die Indexierungskomponenten (Ingest) von den Such- (Abfrage-) Komponenten trennt, wobei Amazon S3 der primäre Datenspeicher für Indizes ist.
Diese entkoppelte Architektur ermöglicht es Ihnen, Such- und Indizierungsfunktionen unabhängig voneinander und unabhängig von den indizierten Daten in S3 zu skalieren. Die Architektur bietet auch eine Isolierung für Aufnahme- und Abfragevorgänge, so dass sie ohne Ressourcenkonflikte gleichzeitig ausgeführt werden können.
Wenn Sie Daten in eine Sammlung schreiben, verteilt OpenSearch Serverless sie an die Recheneinheiten für die Indexierung. Die indizierenden Recheneinheiten nehmen die eingehenden Daten auf und verschieben die Indizes zu S3. Wenn Sie eine Suche nach den Sammlungsdaten durchführen, leitet OpenSearch Serverless Anfragen an die Recheneinheiten für die Suche weiter, die die abgefragten Daten enthalten. Die Recheneinheiten für die Suche laden die indizierten Daten direkt von S3 herunter (wenn sie nicht bereits lokal zwischengespeichert sind), führen Suchvorgänge aus und führen Aggregationen durch.
Das folgende Image veranschaulicht diese entkoppelte Architektur:

OpenSearch Serverlose Rechenkapazität für Datenaufnahme, Suche und Abfrage wird in Recheneinheiten () gemessen. OpenSearch OCUs Jede OCU ist eine Kombination aus 6 GB Speicher und entsprechender virtueller CPU (vCPU) und erstellt eine Daten-Pipeline zu Amazon S3. Jede OCU enthält ausreichend flüchtigen Hot-Speicher für 120 GiB Indexdaten.
Wenn Sie Ihre erste Sammlung erstellen, instanziiert OpenSearch Serverless zwei OCUs — eine für die Indizierung und eine für die Suche. Um eine hohe Verfügbarkeit zu gewährleisten, wird auch eine Reihe von Standby-Knoten in einer anderen Availability Zone gestartet. Zu Entwicklungs- und Testzwecken können Sie die Einstellung Redundanz aktivieren für eine Sammlung deaktivieren, wodurch die beiden Standby-Replikate entfernt und nur zwei instanziiert werden. OCUs Standardmäßig sind die redundanten aktiven Replikate aktiviert, was bedeutet, dass insgesamt vier für die erste Sammlung in einem Konto instanziiert OCUs werden.
Diese sind auch dann OCUs vorhanden, wenn auf keinem Sammlungsendpunkt eine Aktivität stattfindet. Alle nachfolgenden Sammlungen haben diese OCUs gemeinsam. Wenn Sie weitere Sammlungen in demselben Konto erstellen, fügt OpenSearch Serverless nur dann zusätzliche OCUs für die Suche und Aufnahme hinzu, wenn dies zur Unterstützung der Sammlungen gemäß den von Ihnen angegebenen Kapazitätsgrenzen erforderlich ist. Die Kapazität wird mit sinkender Computernutzung wieder herunterskaliert.
Informationen darüber, wie Ihnen diese in Rechnung gestellt werden OCUs, finden Sie unterPreisgestaltung.
Auswahl eines Sammlungstyps
OpenSearch Serverless unterstützt drei primäre Erfassungstypen:
Zeitreihen — Das Segment der Protokollanalysen, das große Mengen halbstrukturierter, maschinengenerierter Daten in Echtzeit analysiert und so Einblicke in Betrieb, Sicherheit, Benutzerverhalten und Unternehmensleistung bietet.
Suche — Volltextsuche, die Anwendungen innerhalb interner Netzwerke, wie Content-Management-Systeme und Ablagen für juristische Dokumente, sowie Internetanwendungen wie E-Commerce-Sitesuche und Content-Discovery ermöglicht.
Vektorsuche — Die semantische Suche nach Vektor-Einbettungen vereinfacht die Verwaltung von Vektordaten und ermöglicht durch maschinelles Lernen (ML) erweiterte Sucherlebnisse. Es unterstützt generative KI-Anwendungen wie Chatbots, persönliche Assistenten und Betrugserkennung.
Sie wählen einen Sammlungstyp aus, wenn Sie zum ersten Mal eine Sammlung erstellen:

Der ausgewählte Sammlungstyp hängt von der Art der Daten ab, die Sie in die Sammlung aufnehmen möchten, und davon, wie Sie diese abfragen möchten. Sie können den Sammlungstyp nach dem Erstellen nicht mehr ändern.
Die Sammlungstypen weisen die folgenden bemerkenswerten Unterschiede auf:
-
Bei Such - und Vektorsuchsammlungen werden alle Daten im Hot-Storage gespeichert, um schnelle Antwortzeiten bei Abfragen zu gewährleisten. Zeitreihen-Sammlungen verwenden eine Kombination aus Hot- und Warm-Speicher, wobei die aktuellsten Daten im Hot-Speicher aufbewahrt werden, um die Reaktionszeiten bei Abfragen für Daten mit häufigerem Zugriff zu optimieren.
-
Bei Sammlungen mit Zeitreihen und Vektorsuche können Sie weder anhand einer benutzerdefinierten Dokument-ID indexieren noch anhand von Upsert-Anfragen aktualisieren. Dieser Vorgang ist Suchanwendungsfällen vorbehalten. Stattdessen können Sie die Aktualisierung anhand der Dokument-ID vornehmen. Weitere Informationen finden Sie unter Unterstützte Operationen OpenSearch API und Berechtigungen.
-
Für Such - und Zeitreihensammlungen können Sie keine Indizes vom Typ k-NN verwenden.
Preisgestaltung
AWS berechnet Ihnen die folgenden OpenSearch serverlosen Komponenten:
-
Datenerfassungsleistung
-
Such- und Abfrageleistung
-
In Amazon S3 verbleibender Speicher
Die OCU wird stündlich mit einer Genauigkeit pro Sekunde abgerechnet. In Ihrem Kontoauszug finden Sie einen Eintrag für die Berechnung in OCU-Stunden mit einer Bezeichnung für Datenaufnahme und einer Bezeichnung für Suche. AWS stellt Ihnen auch monatlich die in Amazon S3 gespeicherten Daten in Rechnung. Für die Nutzung von OpenSearch Dashboards fallen keine Gebühren an.
Ihnen werden mindestens 2 (0,5 OCU x 2) für die Aufnahme und 1 OCU OCUs (0,5 OCU x 2) für die Suche in Rechnung gestellt, wenn Sie eine Sammlung erstellen und redundante aktive Replikate aktivieren. Ihnen wird mindestens 1 OCU (0,5 OCU x 2) für die erste Sammlung in Ihrem Konto in Rechnung gestellt, wenn Sie redundante aktive Replikate deaktivieren. Alle nachfolgenden Sammlungen können diese gemeinsam nutzen. OCUs
OpenSearch Serverless fügt je nach OCUs Rechenleistung und Speicherplatz, die zur Unterstützung Ihrer Sammlungen benötigt werden, schrittweise um 1 OCU hinzu. Sie können eine maximale Anzahl von OCUs für Ihr Konto konfigurieren, um die Kosten zu kontrollieren.
Anmerkung
Sammlungen, die einzigartig sind, AWS KMS keys können nicht OCUs mit anderen Sammlungen geteilt werden.
OpenSearch Serverlose Versuche, die minimal erforderlichen Ressourcen zu verwenden, um wechselnden Workloads Rechnung zu tragen. Die Anzahl der zu einem beliebigen Zeitpunkt OCUs bereitgestellten Dateien kann variieren und ist nicht exakt. Im Laufe der Zeit wird der von OpenSearch Serverless verwendete Algorithmus weiter verbessert, um die Systemnutzung besser zu minimieren.
Vollständige Preisinformationen finden Sie unter Amazon OpenSearch Service-Preise
Unterstützt AWS-Regionen
OpenSearch Serverless ist in einer Teilmenge verfügbar AWS-Regionen , in der der OpenSearch Service verfügbar ist. Eine Liste der unterstützten Regionen finden Sie unter Amazon OpenSearch Service-Endpunkte und Kontingente in der Allgemeine AWS-Referenz.
Einschränkungen
OpenSearch Serverless hat die folgenden Einschränkungen:
-
Einige OpenSearch API-Operationen werden nicht unterstützt. Siehe Unterstützte Operationen OpenSearch API und Berechtigungen.
-
Einige OpenSearch Plugins werden nicht unterstützt. Siehe Unterstützte Plugins OpenSearch .
-
Derzeit gibt es keine Möglichkeit, Ihre Daten automatisch von einer verwalteten OpenSearch Dienstdomäne zu einer serverlosen Sammlung zu migrieren. Sie müssen Ihre Daten von einer Domain zu einer Sammlung neu indizieren.
-
Kontoübergreifender Zugriff auf Sammlungen wird nicht unterstützt. Sie können Sammlungen von anderen Konten nicht in Ihre Verschlüsselungs- oder Datenzugriffsrichtlinien aufnehmen.
-
Benutzerdefinierte OpenSearch Plug-ins werden nicht unterstützt.
-
Sie können keine Snapshots von OpenSearch serverlosen Sammlungen erstellen oder wiederherstellen.
-
Regionsübergreifende Suche und Replikation werden nicht unterstützt.
-
Die Anzahl der Serverless-Ressourcen, die Sie in einem einzigen Konto und einer Region haben können, ist begrenzt. Siehe OpenSearch Serverlose Kontingente.
-
Das Aktualisierungsintervall für Indizes in Vektorsuchsammlungen beträgt ungefähr 60 Sekunden. Das Aktualisierungsintervall für Indizes in Such- und Zeitreihensammlungen beträgt ungefähr 10 Sekunden.
-
Die Anzahl der Shards, die Anzahl der Intervalle und das Aktualisierungsintervall können nicht geändert werden und werden von Serverless verwaltet. OpenSearch Die Sharding-Strategie basiert auf der Art der Erfassung und dem Datenverkehr. Beispielsweise skaliert eine Zeitreihen-Sammlung primäre Shards auf der Grundlage von Engpässen im Schreibdatenverkehr.
-
Geodatenfunktionen, die in OpenSearch Versionen bis 2.1 verfügbar sind, werden unterstützt.