Erste Schritte mit Amazon Redshift Serverless Data Warehouses - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit Amazon Redshift Serverless Data Warehouses

Wenn Sie Amazon Redshift Serverless zum ersten Mal verwenden, empfehlen wir Ihnen, die folgenden Abschnitte zu lesen, um Ihnen den Einstieg in die Verwendung von Amazon Redshift Serverless zu erleichtern. Der grundlegende Ablauf von Amazon Redshift Serverless besteht darin, Serverless-Ressourcen zu erstellen, eine Verbindung zu Amazon Redshift Serverless herzustellen, Beispieldaten zu laden und dann Abfragen für die Daten auszuführen. Bei Verwendung dieses Handbuchs haben Sie die Möglichkeit, Beispieldaten aus Amazon Redshift Serverless oder aus einem Amazon-S3-Bucket zu laden. Die Beispieldaten werden in der gesamten Amazon Redshift Redshift-Dokumentation verwendet, um Funktionen zu demonstrieren. Erste Schritte mit der Verwendung von von Amazon Redshift bereitgestellten Data Warehouses finden Sie unter. Erste Schritte mit von Amazon Redshift bereitgestellten Data Warehouses

Melden Sie sich an für AWS

Wenn Sie noch kein AWS Konto haben, registrieren Sie sich für eines. Wenn Sie bereits ein Konto besitzen, können Sie diesen Schritt überspringen und Ihr vorhandenes Konto verwenden.

  1. Öffne https://portal.aws.amazon.com/billing/die Registrierung.

  2. Folgen Sie den Online-Anweisungen.

    Wenn Sie sich für ein AWS Konto registrieren, wird ein Root-Benutzer für das AWS Konto erstellt. Der Root-Benutzer hat Zugriff auf alle AWS Dienste und Ressourcen im Konto. Als bewährte Methode zur Gewährleistung der Sicherheit sollten Sie den administrativen Zugriff einem administrativen Benutzer zuweisen und nur den Root-Benutzer verwenden, um Aufgaben auszuführen, die Root-Benutzerzugriff erfordern.

Erstellen eines Data Warehouse mit Amazon Redshift Serverless

Wenn Sie sich zum ersten Mal bei der Amazon-Redshift-Serverless-Konsole anmelden, werden Sie aufgefordert, auf die Informationen zu den ersten Schritten zuzugreifen, die Sie zum Erstellen und Verwalten von Serverless-Ressourcen verwenden können. In diesem Handbuch werden Sie Serverless-Ressourcen unter Verwendung der Standardeinstellungen von Amazon Redshift Serverless erstellen.

Wenn Sie Ihre Einrichtung genauer kontrollieren möchten, wählen Sie Customize settings (Einstellungen anpassen) aus.

Anmerkung

Redshift Serverless erfordert ein Amazon VPC mit drei Subnetzen in drei verschiedenen Verfügbarkeitszonen. Redshift Serverless benötigt außerdem mindestens 37 verfügbare IP-Adressen. Stellen Sie sicher, dass das AmazonVPC, das Sie für Redshift Serverless verwenden, drei Subnetze in drei verschiedenen Verfügbarkeitszonen und mindestens 37 verfügbare IP-Adressen hat, bevor Sie fortfahren. Weitere Informationen zum Erstellen von Subnetzen in einem Amazon VPC finden Sie unter Erstellen eines Subnetzes im Amazon Virtual Private Cloud Cloud-Benutzerhandbuch. Weitere Informationen zu IP-Adressen in einem VPC Amazon-Netzwerk finden Sie unter IP-Adressierung für Sie VPCs und Subnetze.

So nehmen Sie die Konfiguration mit Standardeinstellungen vor:
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Redshift Redshift-Konsole unter https://console.aws.amazon.com/redshiftv2/.

    Wählen Sie Redshift Serverless Free Trial testen.

  2. Wählen Sie unter Configuration (Konfiguration) die Option Use default settings (Standardeinstellungen verwenden) aus. Amazon Redshift Serverless erstellt einen Standard-Namespace mit einer Standardarbeitsgruppe, die diesem Namespace zugeordnet ist. Wählen Sie Save configuration (Konfiguration speichern) aus.

    Anmerkung

    Ein Namespace ist eine Sammlung von Datenbankobjekten und Benutzern. Namespaces gruppieren alle Ressourcen, die Sie in Redshift Serverless verwenden, wie Schemas, Tabellen, Benutzer, Datenfreigaben und Snapshots.

    Eine Arbeitsgruppe ist eine Sammlung von Rechenressourcen. Arbeitsgruppen beherbergen Rechenressourcen, die Redshift Serverless zur Ausführung von Rechenaufgaben verwendet.

    Der folgende Screenshot zeigt die Standardeinstellungen für Amazon Redshift Serverless.

    Wählen Sie die Standardeinstellungen aus, um die Standardeinstellungen für Amazon Redshift Serverless zu verwenden.
  3. Nachdem die Einrichtung abgeschlossen ist, wählen Sie Continue (Weiter), um zu Serverless Dashboard zu wechseln. Wie Sie sehen, sind die Serverless-Arbeitsgruppe und der Serverless-Namespace verfügbar.

    Nach erfolgter Einrichtung können die Arbeitsgruppe und der Namespace verwendet werden.
    Anmerkung

    Wenn Redshift Serverless die Arbeitsgruppe nicht erfolgreich erstellt, können Sie wie folgt vorgehen:

    • Beheben Sie alle Fehler, die Redshift Serverless meldet, wie z. B. zu wenige Subnetze in Ihrem Amazon. VPC

    • Löschen Sie den Namespace, indem Sie im Redshift Serverless-Dashboard die Option default-namespace und dann Actions, Delete namespace auswählen. Das Löschen eines Namespaces dauert mehrere Minuten.

    • Wenn Sie die Redshift Serverless-Konsole erneut öffnen, wird der Willkommensbildschirm angezeigt.

Laden von Beispieldaten

Nachdem Sie Ihr Data Warehouse mit Amazon Redshift Serverless eingerichtet haben, können Sie den Amazon Redshift Query Editor v2 verwenden, um Beispieldaten zu laden.

  1. Um Query Editor v2 über die Amazon-Redshift-Serverless-Konsole zu starten, wählen Sie Daten abfragen aus. Wenn Sie den Abfrage-Editor v2 über die Amazon-Redshift-Serverless-Konsole aufrufen, wird er in einer neuen Browser-Registerkarte geöffnet. Der Abfrage-Editor v2 stellt eine Verbindung von Ihrem Clientcomputer mit der Amazon-Redshift-Serverless-Umgebung her.

    Über die Schaltfläche „Daten abfragen“ in der Amazon-Redshift-Serverless-Konsole wird Query Editor v2 gestartet.
  2. Für dieses Handbuch verwenden Sie Ihr AWS Administratorkonto und das Standardkonto. AWS KMS key Informationen zur Konfiguration des Abfrage-Editors v2, einschließlich der erforderlichen Berechtigungen, finden Sie unter Konfiguration Ihres AWS-Konto im Amazon Redshift Management Guide. Informationen zur Konfiguration von Amazon Redshift für die Verwendung eines vom Kunden verwalteten Schlüssels oder zur Änderung des von Amazon Redshift verwendeten KMS Schlüssels finden Sie unter Ändern des AWS KMS Schlüssels für einen Namespace.

  3. Um eine Verbindung zu einer Arbeitsgruppe herzustellen, wählen Sie den Namen der Arbeitsgruppe im Strukturansichtsbereich aus.

    Um eine Verbindung zu einer Arbeitsgruppe herzustellen, wählen Sie den Namen der Arbeitsgruppe im Strukturansichtsbereich aus.
  4. Wenn Sie in Query Editor v2 zum ersten Mal eine Verbindung zu einer neuen Arbeitsgruppe herstellen, müssen Sie den Authentifizierungstyp auswählen, der für die Verbindung zur Arbeitsgruppe verwendet werden soll. Lassen Sie für diese Anleitung die Option Verbundbenutzer ausgewählt und wählen Sie Verbindung erstellen aus.

    Sie können wählen, ob Sie eine Verbindung mit einem temporären Passwort oder einer Kombination aus Datenbankbenutzername und Passwort herstellen möchten.

    Sobald Sie verbunden sind, können Sie Beispieldaten aus Amazon Redshift Serverless oder aus einem Amazon-S3-Bucket laden.

  5. Erweitern Sie unter der Standardarbeitsgruppe von Amazon Redshift Serverless die Datenbank sample_data_dev. Es gibt drei Beispielschemata, die drei Beispieldatensätzen entsprechen, die Sie in die Amazon-Redshift-Serverless-Datenbank laden können. Wählen Sie den Beispieldatensatz, den Sie laden möchten, und dann Beispiel-Notebooks öffnen aus.

    Erweitern Sie die Datenbank sample_data_dev und wählen Sie dann das Schema aus, das Sie laden möchten.
    Anmerkung

    Ein SQL Notizbuch ist ein Container für SQL und Markdown-Zellen. Sie können Notizbücher verwenden, um mehrere SQL Befehle in einem einzigen Dokument zu organisieren, zu kommentieren und gemeinsam zu nutzen.

  6. Wenn Sie zum ersten Mal Daten laden, fordert Query Editor v2 Sie auf, eine Beispieldatenbank zu erstellen. Wählen Sie Create (Erstellen) aus.

    Dialogfenster mit der Aufforderung, eine Beispieldatenbank zu erstellen.

Ausführen von Beispielabfragen

Nachdem Sie Amazon Redshift Serverless eingerichtet haben, können Sie einen Beispieldatensatz in Amazon Redshift Serverless verwenden. Amazon Redshift Serverless lädt den Beispieldatensatz, z.  B. den Tickit-Datensatz, automatisch und Sie können die Daten sofort abfragen.

  • Sobald Amazon Redshift Serverless mit dem Laden der Beispieldaten fertig ist, werden alle Beispielabfragen in den Editor geladen. Sie können Alle ausführen auswählen, um alle Abfragen aus den Beispiel-Notebooks auszuführen.

    Wählen Sie die Schaltfläche „Alle ausführen“ aus, um alle Beispielabfragen auszuführen.

    Sie können die Ergebnisse auch als JSON CSV OR-Datei exportieren oder die Ergebnisse in einem Diagramm anzeigen.

    Die Schaltfläche Exportieren im Abfrage-Editor v2 neben der Schaltfläche Diagrammansicht.

Sie können Daten auch aus einem Amazon-S3-Bucket laden. Weitere Informationen hierzu finden Sie unter Laden von Daten aus Amazon S3.

Laden von Daten aus Amazon S3

Nachdem Sie Ihr Data Warehouse erstellt haben, können Sie Daten aus Amazon S3 laden.

An diesem Punkt verfügen Sie über eine Datenbank namens dev. Als Nächstes legen Sie Tabellen in der Datenbank an, laden Daten in die Tabellen hoch und führen testweise eine Abfrage durch. Die Beispieldaten werden der Einfachheit halber in einem Amazon-S3-Bucket bereitgestellt.

  1. Bevor Sie Daten aus Amazon S3 laden können, müssen Sie zunächst eine IAM Rolle mit den erforderlichen Berechtigungen erstellen und sie an Ihren serverlosen Namespace anhängen. Wählen Sie dazu im Navigationsmenü Namespace-Konfiguration, wählen Sie Ihren Namespace und dann Sicherheit und Verschlüsselung. Wählen Sie dann Rollen verwalten IAM aus.

    Wählen Sie auf der Namespace-Konfigurationsseite Sicherheit und Verschlüsselung und anschließend IAM Rollen verwalten aus.
  2. Erweitern Sie das Menü IAMRollen verwalten und wählen Sie IAMRolle erstellen aus.

    Erweitern Sie das Menü IAM Rollen verwalten und wählen Sie IAM Rolle erstellen aus.
  3. Wählen Sie die Ebene des S3-Bucket-Zugriffs aus, die Sie dieser Rolle gewähren möchten, und wählen Sie standardmäßig IAM Rolle erstellen aus.

    Erstellen Sie eine IAM Rolle, die Sie als Standardrolle verwenden möchten.
  4. Wählen Sie Änderungen speichern. Sie können jetzt Beispieldaten aus Amazon S3 laden.

Die folgenden Schritte verwenden Daten in einem öffentlichen Amazon Redshift S3-Bucket, aber Sie können dieselben Schritte mit Ihrem eigenen S3-Bucket und SQL Befehlen replizieren.

Laden von Beispieldaten aus Amazon S3
  1. Wählen Sie im Abfrage-Editor v2 The add button, represented by a plus sign. Hinzufügen und dann Notizbuch, um ein neues SQLNotizbuch zu erstellen.

    Erstellen Sie ein neues Notizbuch im Abfrage-Editor v2.
  2. Wechseln Sie zur dev-Datenbank.

    Wechseln Sie zur Dev-Datenbank, um Daten aus einem S3-Bucket zu laden.
  3. Erstellen Sie Tabellen.

    Wenn Sie Query Editor v2 verwenden, kopieren Sie die folgenden Create-Table-Anweisungen und führen Sie sie aus, um Tabellen in der dev-Datenbank zu erstellen. Weitere Informationen zur Syntax finden Sie CREATETABLEim Amazon Redshift Database Developer Guide.

    create table users( userid integer not null distkey sortkey, username char(8), firstname varchar(30), lastname varchar(30), city varchar(30), state char(2), email varchar(100), phone char(14), likesports boolean, liketheatre boolean, likeconcerts boolean, likejazz boolean, likeclassical boolean, likeopera boolean, likerock boolean, likevegas boolean, likebroadway boolean, likemusicals boolean); create table event( eventid integer not null distkey, venueid smallint not null, catid smallint not null, dateid smallint not null sortkey, eventname varchar(200), starttime timestamp); create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);
  4. Erstellen Sie im Abfrage-Editor v2 eine neue SQL Zelle in Ihrem Notizbuch.

    Erstellen Sie im Abfrage-Editor v2 eine neue SQL Zelle, um SQL Befehle auszuführen.
  5. Verwenden Sie jetzt den COPY Befehl im Abfrage-Editor v2, um große Datensätze aus Amazon S3 oder Amazon DynamoDB in Amazon Redshift zu laden. Weitere Informationen zur COPY Syntax finden Sie COPYim Amazon Redshift Database Developer Guide.

    Sie können den COPY Befehl mit einigen Beispieldaten ausführen, die in einem öffentlichen S3-Bucket verfügbar sind. Führen Sie die folgenden SQL Befehle im Abfrage-Editor v2 aus.

    COPY users FROM 's3://redshift-downloads/tickit/allusers_pipe.txt' DELIMITER '|' TIMEFORMAT 'YYYY-MM-DD HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default; COPY event FROM 's3://redshift-downloads/tickit/allevents_pipe.txt' DELIMITER '|' TIMEFORMAT 'YYYY-MM-DD HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default; COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' IGNOREHEADER 1 REGION 'us-east-1' IAM_ROLE default;
  6. Erstellen Sie nach dem Laden der Daten eine weitere SQL Zelle in Ihrem Notizbuch und probieren Sie einige Beispielabfragen aus. Weitere Informationen zur Arbeit mit dem SELECT Befehl finden Sie SELECTim Amazon Redshift Developer Guide. Verwenden Sie Query Editor v2, um die Struktur und die Schemata der Beispieldaten zu verstehen.

    -- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc; -- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc;

Nachdem Sie nun Daten geladen und einige Beispielabfragen ausgeführt haben, können Sie andere Bereiche von Amazon Redshift Serverless erkunden. In der folgenden Übersicht erfahren Sie mehr über die Verwendungsmöglichkeiten von Amazon Redshift Serverless.

  • Sie können Daten aus einem Amazon-S3-Bucket laden. Weitere Informationen finden Sie unter Laden von Daten aus Amazon S3.

  • Sie können Query Editor v2 verwenden, um Daten aus einer lokalen zeichengetrennten Datei mit weniger als 5 MB zu laden. Weitere Informationen finden Sie unter Laden von Daten aus einer lokalen Datei.

  • Mit dem UND-Treiber können Sie mit SQL Tools von Drittanbietern eine Verbindung zu Amazon Redshift Serverless herstellen. JDBC ODBC Weitere Informationen finden Sie unter Verbinden mit Amazon Redshift Serverless.

  • Sie können die Amazon Redshift-Daten auch verwenden, API um eine Verbindung zu Amazon Redshift Serverless herzustellen. Weitere Informationen finden Sie unter Amazon Redshift Redshift-Daten API verwenden.

  • Sie können Ihre Daten in Amazon Redshift Serverless mit Redshift ML verwenden, um Modelle für maschinelles Lernen mit dem Befehl zu erstellen. CREATE MODEL Im Tutorial: Erstellen von Kundenabwanderungsmodellen erfahren Sie, wie Sie ein Redshift-ML-Modell erstellen.

  • Sie können Daten aus einem Amazon S3 Data Lake abfragen, ohne Daten in Amazon Redshift Serverless laden zu müssen. Weitere Informationen finden Sie unter Abfragen eines Data Lake.