Lernen Sie die Konzepte von Amazon Redshift kennen - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Lernen Sie die Konzepte von Amazon Redshift kennen

Mit Amazon Redshift Serverless können Sie auf Daten zugreifen und diese analysieren, ohne alle Konfigurationen wie bei einem bereitgestellten Data Warehouse vornehmen zu müssen. Ressourcen werden automatisch bereitgestellt und die Data-Warehouse-Kapazität wird intelligent skaliert, um eine schnelle Leistung selbst für anspruchsvollste und unvorhersehbare Workloads zu erzielen. Es fallen keine Kosten an, wenn das Data Warehouse inaktiv ist, Sie zahlen also nur für das, was Sie tatsächlich nutzen. Sie können Daten laden und sofort mit der Abfrage beginnen. Hierfür können Sie Amazon Redshift Query Editor v2 oder Ihr bevorzugtes Business Intelligence (BI)-Tool nutzen. Genießen Sie das beste Preis-Leistungs-Verhältnis und die vertrauten SQL Funktionen in einer easy-to-use Umgebung ohne Verwaltungsaufwand.

Wenn Sie Amazon Redshift zum ersten Mal verwenden, empfehlen wir Ihnen, zunächst die folgenden Abschnitte zu lesen:

Wenn Sie Ihre Amazon-Redshift-Ressourcen lieber manuell verwalten möchten, können Sie bereitgestellte Cluster für Ihre Datenabfrageanforderungen erstellen. Weitere Informationen finden Sie unter Amazon-Redshift-Cluster.

Wenn Ihre Organisation berechtigt ist und Ihr Cluster in einem Gebiet erstellt wird, in AWS-Region dem Amazon Redshift Serverless nicht verfügbar ist, können Sie möglicherweise im Rahmen des kostenlosen Testprogramms von Amazon Redshift einen Cluster erstellen. Wählen Sie entweder Produktion oder Kostenlose Testversion als Antwort auf die Frage: Wofür möchten Sie diesen Cluster verwenden? Wenn Sie Kostenlose Testversion auswählen, erstellen Sie eine Konfiguration mit dem Knotentyp dc2.large. Weitere Informationen zur Auswahl einer kostenlosen Testversion finden Sie unter Kostenloses Testprogramm für Amazon Redshift. Eine Liste, AWS-Regionen wo Amazon Redshift Serverless verfügbar ist, finden Sie in den Amazon Redshift Redshift-Endpunkten, die für Redshift Serverless aufgeführt sind, im. API Allgemeine Amazon Web Services-Referenz

Im Folgenden sind einige wichtige Konzepte von Amazon Redshift Serverless aufgeführt.

  • Namespace – Eine Sammlung von Datenbankobjekten und Benutzern. In Namespaces sind alle Ressourcen zusammengefasst, die Sie in Amazon Redshift Serverless verwenden, wie Schemas, Tabellen, Benutzer, Datashares und Snapshots.

  • Arbeitsgruppe – Eine Sammlung von Rechenressourcen. In Arbeitsgruppen sind Rechenressourcen enthalten, die Amazon Redshift Serverless zur Ausführung von Datenverarbeitungsaufgaben verwendet. Einige Beispiele für solche Ressourcen sind Redshift Processing Units (RPUs), Sicherheitsgruppen und Nutzungsbeschränkungen. Arbeitsgruppen verfügen über Netzwerk- und Sicherheitseinstellungen, die Sie mit der Amazon Redshift Serverless-Konsole AWS Command Line Interface, dem oder dem Amazon Redshift Serverless konfigurieren können. APIs

Weitere Informationen zum Konfigurieren von Namespace- und Arbeitsgruppenressourcen finden Sie unter Arbeiten mit Namespaces und Arbeiten mit Arbeitsgruppen.

Im Folgenden sind einige wichtige Konzepte im Zusammenhang mit von Amazon Redshift bereitgestellten Clustern aufgeführt:

  • Cluster – Die zentrale Infrastrukturkomponente eines Amazon-Redshift-Data-Warehouse ist ein Cluster.

    Ein Cluster besteht aus einem oder mehreren Datenverarbeitungsknoten. Die Datenverarbeitungsknoten führen den kompilierten Code aus.

    Wird ein Cluster mit zwei oder mehr Datenverarbeitungsknoten bereitgestellt, koordiniert ein zusätzlicher Führungsknoten die Datenverarbeitungsknoten. Der Führungsknoten übernimmt die externe Kommunikation mit Anwendungen, wie Business-Intelligence-Tools und Abfrage-Editoren. Ihre Client-Anwendung interagiert nur mit dem Führungsknoten direkt. Die Datenverarbeitungsknoten sind für externe Anwendungen transparent.

  • Datenbank – Ein Cluster enthält eine oder mehrere Datenbanken.

    Benutzerdaten werden in einer oder mehreren Datenbanken auf den Datenverarbeitungsknoten gespeichert. Ihr SQL Client kommuniziert mit dem Leader-Node, der wiederum laufende Abfragen mit den Rechenknoten koordiniert. Weitere Informationen zu Datenverarbeitungs- und Führungsknoten finden Sie unter Data-Warehouse-Systemarchitektur. Innerhalb einer Datenbank sind Benutzerdaten in einem Schema oder mehreren Schemata organisiert.

    Amazon Redshift ist ein relationales Datenbankverwaltungssystem (RDBMS) und mit anderen RDBMS Anwendungen kompatibel. Es bietet die gleiche Funktionalität wie ein StandardproduktRDBMS, einschließlich Funktionen zur Online-Transaktionsverarbeitung (OLTP) wie das Einfügen und Löschen von Daten. Amazon Redshift ist auch für leistungsfähige Batchanalysen und Berichterstattung von Datensätzen optimiert.

Im Folgenden finden Sie eine Beschreibung des typischen Datenverarbeitungsablaufs in Amazon Redshift sowie Beschreibungen verschiedener Teile im Ablauf. Weitere Informationen zur Amazon-Redshift-Systemarchitektur finden Sie unter Architektur des Data-Warehouse-Systems.

Das folgende Diagramm zeigt einen typischen Datenverarbeitungsablauf in Amazon Redshift.

Diagramm, das den Datenfluss in Amazon Redshift zeigt. Daten werden aus externen Quellen aufgenommen, verarbeitet und in Redshift geladen und dann konsumiert.

Ein Amazon-Redshift-Data-Warehouse ist eine Abfrage- und Verwaltungssystem der Enterprise-Klasse für relationale Datenbanken. Amazon Redshift unterstützt Client-Verbindungen mit vielen Arten von Anwendungen, einschließlich Business Intelligence (BI), Berichterstellung, Daten und Analysetools. Bei Analyseabfragen werden große Datenmengen in mehrphasigen Operationen abgerufen, verglichen und bewertet, um ein Endergebnis zurückzugeben.

In der Ebene der Datenerfassung laden verschiedene Arten von Datenquellen kontinuierlich strukturierte, halbstrukturierte oder unstrukturierte Daten in die Datenspeicher-Ebene hoch. Dieser Datenspeicherbereich dient als Staging-Bereich, der Daten in verschiedenen Zuständen der Nutzungsbereitschaft speichert. Ein Beispiel für einen solchen Speicher ist ein Amazon Simple Storage Service (Amazon S3)-Bucket.

Auf der optionalen Datenverarbeitungsebene werden die Quelldaten mithilfe von Extraktions-, Transformations-, Load () - oder Extrahieren, Laden, Transformieren (ETL) -Pipelines vorverarbeitet, validiert und transformiert. ELT Diese Rohdatensätze werden dann mithilfe von Operationen verfeinert. ETL Ein Beispiel für eine ETL Engine ist AWS Glue.

In der Ebene Datennutzung werden Daten in Ihren Amazon-Redshift-Cluster geladen, wo Sie Analyse-Workloads ausführen können.

Beispiele für Analyse-Workloads finden Sie unter Abfragen von externen Datenquellen.