Erstellen eines DB-Clusters für parallel Abfragen in Aurora My SQL - Amazon Aurora

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines DB-Clusters für parallel Abfragen in Aurora My SQL

Um einen Aurora SQL My-Cluster mit parallel Abfrage zu erstellen, ihm neue Instances hinzuzufügen oder andere Verwaltungsvorgänge durchzuführen, verwenden Sie dieselben AWS Management Console AWS CLI Techniken wie bei anderen Aurora SQL My-Clustern. Sie können einen neuen Cluster erstellen, auf dem Sie parallele Abfragen ausführen können. Sie können auch einen DB-Cluster für die Arbeit mit parallel Abfragen erstellen, indem Sie die Daten aus einem Snapshot eines My SQL -kompatiblen Aurora-DB-Clusters wiederherstellen. Wenn Sie mit dem Verfahren zur Erstellung eines neuen Aurora SQL My-Clusters nicht vertraut sind, finden Sie Hintergrundinformationen und Voraussetzungen unterErstellen eines Amazon Aurora-DB Clusters.

Wenn Sie sich für eine Aurora My SQL Engine-Version entscheiden, empfehlen wir Ihnen, die neueste verfügbare Version zu wählen. Derzeit unterstützen Aurora SQL My-Versionen 2.09 und höher parallel Abfragen. Sie haben mehr Flexibilität, um parallel Abfragen ein- und auszuschalten oder parallel Abfragen mit vorhandenen Clustern zu verwenden, wenn Sie Aurora My SQL 2.09 und höher verwenden.

Unabhängig davon, ob Sie einen neuen Cluster erstellen oder aus einem Snapshot wiederherstellen, verwenden Sie dieselben Techniken zum Hinzufügen neuer DB-Instances wie bei anderen Aurora SQL My-Clustern.

Sie können einen parallel Abfragecluster mit der RDS Amazon-Konsole oder dem erstellen AWS CLI.

Erstellen eines Parallel Query-Clusters über die Konsole

Sie können wie folgt über die Konsole einen neuen Parallelabfragecluster erstellen.

Um einen parallel Abfragecluster mit dem AWS Management Console
  1. Folgen Sie dem allgemeinen AWS Management Console Verfahren unterErstellen eines Amazon Aurora-DB Clusters.

  2. Wählen Sie auf dem Bildschirm Select Engine die Option Aurora My ausSQL.

    Wählen Sie für die Engine-Version Aurora My SQL 2.09 oder höher. Bei diesen Versionen haben Sie die geringsten Einschränkungen für die Verwendung der parallelen Abfrage. Diese Versionen haben auch die größte Flexibilität, um die parallele Abfrage jederzeit ein- oder auszuschalten.

    Wenn es nicht praktikabel ist, eine aktuelle Aurora SQL My-Version für diesen Cluster zu verwenden, wählen Sie Versionen anzeigen, die die Funktion für parallel Abfragen unterstützen. Dadurch wird das Menü Version so gefiltert, dass nur die spezifischen Aurora SQL My-Versionen angezeigt werden, die mit parallel Abfrage kompatibel sind.

  3. Wählen Sie unter Zusätzliche Konfiguration eine Parametergruppe aus, die Sie für die DB-Cluster-Parametergruppe erstellt haben. Die Verwendung einer solchen benutzerdefinierten Parametergruppe ist für Aurora My SQL 2.09 und höher erforderlich. Geben Sie in Ihrer DB-Cluster-Parametergruppe die Parametereinstellungen aurora_parallel_query=ON und aurora_disable_hash_join=OFF an. Dadurch wird die parallele Abfrage für den Cluster und die Hash-Join-Optimierung aktiviert, die in Kombination mit der parallelen Abfrage funktioniert.

So kontrollieren Sie, ob ein neuer Cluster parallelabfragefähig ist:
  1. Erstellen Sie einen Cluster, wie vorhergehend beschrieben.

  2. (Für Aurora My SQL Version 2 oder 3) Vergewissern Sie sich, dass die aurora_parallel_query Konfigurationseinstellung wahr ist.

    mysql> select @@aurora_parallel_query; +-------------------------+ | @@aurora_parallel_query | +-------------------------+ | 1 | +-------------------------+
  3. (Für Aurora My SQL Version 2) Vergewissern Sie sich, dass die aurora_disable_hash_join Einstellung falsch ist.

    mysql> select @@aurora_disable_hash_join; +----------------------------+ | @@aurora_disable_hash_join | +----------------------------+ | 0 | +----------------------------+
  4. Überprüfen Sie bei einigen großen Tabellen und datenintensiven Abfragen die Abfragepläne, um zu bestätigen, dass einige Ihrer Abfragen die Optimierung für die parallele Abfrage verwenden. Eine Schritt-für-Schritt-Anleitung hierzu finden Sie unter Überprüfen, welche Anweisungen die parallel Abfrage für Aurora My verwenden SQL.

Erstellen eines parallel Abfrageclusters mit dem CLI

Sie können einen neuen parallel Abfragecluster mit dem erstellen, CLI wie im Folgenden beschrieben.

Um einen parallel Abfragecluster mit dem AWS CLI
  1. (Optional) Prüfen Sie, welche Aurora SQL My-Versionen mit parallel Abfrageclustern kompatibel sind. Verwenden Sie dazu den Befehl describe-db-engine-versions und überprüfen Sie den Wert des Feldes SupportsParallelQuery. Ein Beispiel finden Sie unter Überprüfung der Kompatibilität SQL von Aurora My Version für parallel Abfragen.

  2. (Optional) Erstellen Sie eine benutzerdefinierte DB-Cluster-Parametergruppe mit den Einstellungen aurora_parallel_query=ON und aurora_disable_hash_join=OFF. Verwenden Sie Befehle wie die folgenden.

    aws rds create-db-cluster-parameter-group --db-parameter-group-family aurora-mysql5.7 --db-cluster-parameter-group-name pq-enabled-57-compatible aws rds modify-db-cluster-parameter-group --db-cluster-parameter-group-name pq-enabled-57-compatible \ --parameters ParameterName=aurora_parallel_query,ParameterValue=ON,ApplyMethod=pending-reboot aws rds modify-db-cluster-parameter-group --db-cluster-parameter-group-name pq-enabled-57-compatible \ --parameters ParameterName=aurora_disable_hash_join,ParameterValue=OFF,ApplyMethod=pending-reboot

    Wenn Sie diesen Schritt ausführen, geben Sie die Option --db-cluster-parameter-group-name my_cluster_parameter_group in der nachfolgenden create-db-cluster-Anweisung an. Geben Sie den Namen Ihrer eigenen Parametergruppe an. Wenn Sie diesen Schritt auslassen, erstellen Sie die Parametergruppe und ordnen sie später dem Cluster zu, wie unter beschriebe parallel Abfragen in Aurora My ein- und ausschalten SQL.

  3. Folgen Sie dem allgemeinen AWS CLI Verfahren unterErstellen eines Amazon Aurora-DB Clusters.

  4. Geben Sie die folgenden Optionen an:

    • Verwenden Sie für die Option --engine den Wert aurora-mysql. Diese Werte erzeugen parallel Abfragecluster, die mit My SQL 5.7 oder 8.0 kompatibel sind.

    • Geben Sie für die Option --db-cluster-parameter-group-name den Namen einer DB-Cluster-Parametergruppe an, die Sie erstellt und für die Sie den Parameterwert aurora_parallel_query=ON zugewiesen haben. Wenn Sie diese Option auslassen, können Sie den Cluster mit einer Standardparametergruppe erstellen und ihn später so ändern, dass er eine solche benutzerdefinierte Parametergruppe verwendet.

    • Verwenden Sie für --engine-version diese Option eine Aurora SQL My-Version, die mit parallel Abfragen kompatibel ist. Verwenden Sie das Verfahren aus Optimierung der parallel Abfrage in Aurora My SQL, um bei Bedarf eine Liste der Versionen abzurufen. Verwenden Sie mindestens Version 2.09.0. Diese und alle höheren Versionen enthalten wesentliche Verbesserungen für parallelen Abfragen.

      Wie das aussehen kann, sehen Sie am nachfolgenden Beispielcode. Ersetzen Sie jede der Umgebungsvariablen durch Ihren eigenen Wert, z. B. $CLUSTER_ID. Dieses Beispiel spezifiziert auch die --manage-master-user-password Option, das Masterbenutzerkennwort zu generieren und es in Secrets Manager zu verwalten. Weitere Informationen finden Sie unter Passwortverwaltung mit , Amazon Aurora und AWS Secrets Manager. Alternativ können Sie die Option --master-password verwenden, um das Passwort selbst festzulegen und zu verwalten.

      aws rds create-db-cluster --db-cluster-identifier $CLUSTER_ID \ --engine aurora-mysql --engine-version 5.7.mysql_aurora.2.11.1 \ --master-username $MASTER_USER_ID --manage-master-user-password \ --db-cluster-parameter-group-name $CUSTOM_CLUSTER_PARAM_GROUP aws rds create-db-instance --db-instance-identifier ${INSTANCE_ID}-1 \ --engine same_value_as_in_create_cluster_command \ --db-cluster-identifier $CLUSTER_ID --db-instance-class $INSTANCE_CLASS
  5. Überprüfen Sie, ob ein von Ihnen erstellter oder wiederhergestellter Cluster parallelabfragefähig ist.

    Prüfen Sie, ob auf die Konfigurationseinstellung aurora_parallel_query vorhanden ist. Wenn diese Einstellung den Wert „1“ hat, können Sie die parallele Abfrage verwenden. Wenn diese Einstellung den Wert „0“ hat, müssen Sie ihn auf „1“ festlegen, bevor Sie die parallele Abfrage verwenden können. In jedem Fall ist der Cluster in der Lage, die parallele Abfrage durchzuführen.

    mysql> select @@aurora_parallel_query; +------------------------+ | @@aurora_parallel_query| +------------------------+ | 1 | +------------------------+
Um einen Snapshot in einem parallel Abfragecluster wiederherzustellen, verwenden Sie den AWS CLI
  1. Prüfen Sie, welche Aurora SQL My-Versionen mit parallel Abfrageclustern kompatibel sind. Verwenden Sie dazu den Befehl describe-db-engine-versions und überprüfen Sie den Wert des Feldes SupportsParallelQuery. Ein Beispiel finden Sie unter Überprüfung der Kompatibilität SQL von Aurora My Version für parallel Abfragen. Entscheiden Sie, welche Version für den wiederhergestellten Cluster verwendet werden soll. Wählen Sie Aurora My SQL 2.09.0 oder höher für einen My SQL 5.7-kompatiblen Cluster.

  2. Suchen Sie einen Aurora My SQL -kompatiblen Cluster-Snapshot.

  3. Folgen Sie dem allgemeinen AWS CLI Verfahren unterWiederherstellen aus einem DB-Cluster-Snapshot.

    aws rds restore-db-cluster-from-snapshot \ --db-cluster-identifier mynewdbcluster \ --snapshot-identifier mydbclustersnapshot \ --engine aurora-mysql
  4. Überprüfen Sie, ob ein von Ihnen erstellter oder wiederhergestellter Cluster parallelabfragefähig ist. Verwenden Sie das gleiche Verifizierungsverfahren wie in Erstellen eines parallel Abfrageclusters mit dem CLI.