Vérification des instructions utilisant les requêtes parallèles pour Aurora MySQL

En règle générale, aucune action spécifique n’est requise de votre part pour tirer parti des requêtes parallèles. Lorsqu’une requête est compatible avec la fonction de requête parallèle, l’optimiseur détermine automatiquement dans quel cas utiliser cette fonction pour chaque requête.

Si vous effectuez des expérimentations dans un environnement de développement ou de test, vous constaterez peut-être que la fonction de requête parallèle n’est pas utilisée, car vos tables ne contiennent pas assez de lignes ou pas assez de données. Les données associées à la table, notamment celles que vous avez créées récemment pour réaliser ces expérimentations, peuvent également se trouver entièrement dans un groupe de mémoires tampons.

À mesure que vous surveillez ou ajustez les performances de vos clusters, veillez à déterminer si les requêtes parallèles sont déclenchées dans les contextes appropriés. Pour tirer parti de cette fonction, vous pouvez ajuster le schéma de base de données, les paramètres, les requêtes SQL, voire la topologie du cluster et les paramètres de connexion de l’application.

Pour vérifier si une requête utilise la fonction de requête parallèle, consultez le plan de requête (ou « plan d’explication ») en exécutant l’instruction EXPLAIN. Pour consulter des exemples de l’impact des expressions, des clauses et des instructions SQL sur la sortie EXPLAIN, reportez-vous à Constructions SQL pour les requêtes parallèles dans Aurora MySQL.

L’exemple suivant illustre la différence entre un plan de requête traditionnel et un plan de requête parallèle. Ce plan d'explication est tiré de la requête 3 du TPC-H benchmark. La plupart des exemples de requêtes présentés dans cette section utilisent les tables de l' TPC-H ensemble de données. Vous pouvez obtenir les définitions des tables, les requêtes et le dbgen programme qui génère des exemples de données à partir du TPC-h site Web.


EXPLAIN SELECT l_orderkey,
  sum(l_extendedprice * (1 - l_discount)) AS revenue,
  o_orderdate,
  o_shippriority
FROM customer,
  orders,
  lineitem
WHERE c_mktsegment = 'AUTOMOBILE'
AND c_custkey = o_custkey
AND l_orderkey = o_orderkey
AND o_orderdate < date '1995-03-13'
AND l_shipdate > date '1995-03-13'
GROUP BY l_orderkey,
  o_orderdate,
  o_shippriority
ORDER BY revenue DESC,
  o_orderdate LIMIT 10;

Par défaut, la requête peut avoir un plan semblable au suivant. Si vous ne voyez pas la jointure par hachage utilisée dans le plan de requête, assurez-vous que l’optimisation est activée en premier.


+----+-------------+----------+------------+------+---------------+------+---------+------+----------+----------+----------------------------------------------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows     | filtered | Extra                                              |
+----+-------------+----------+------------+------+---------------+------+---------+------+----------+----------+----------------------------------------------------+
|  1 | SIMPLE      | customer | NULL       | ALL  | NULL          | NULL | NULL    | NULL |  1480234 |    10.00 | Using where; Using temporary; Using filesort       |
|  1 | SIMPLE      | orders   | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 14875240 |     3.33 | Using where; Using join buffer (Block Nested Loop) |
|  1 | SIMPLE      | lineitem | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 59270573 |     3.33 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+----------+------------+------+---------------+------+---------+------+----------+----------+----------------------------------------------------+

Pour Aurora MySQL version 3, vous activez la jointure par hachage au niveau de la session en exécutant l’instruction suivante.


SET optimizer_switch='block_nested_loop=on';

Pour Aurora MySQL version 2.09 et versions ultérieures, vous définissez le paramètre de base de données aurora_disable_hash_join ou le paramètre de cluster de bases de données sur 0 (off). La désactivation de aurora_disable_hash_join définit optimizer_switch sur la valeur hash_join=on.

Après avoir activé la jointure par hachage, réessayez d’exécuter l’instruction EXPLAIN. Pour plus d’informations sur la façon d’utiliser les jointures par hachage efficacement, consultez Optimisation des requêtes de jointure MySQL Aurora volumineuses avec des jointures de hachage.

Lorsque la jointure par hachage est activée et que la fonction de requête parallèle est désactivée, la requête peut avoir un plan d’exécution semblable au suivant, qui utilise la jointure par hachage, mais pas la requête parallèle.


+----+-------------+----------+...+-----------+-----------------------------------------------------------------+
| id | select_type | table    |...| rows      | Extra                                                           |
+----+-------------+----------+...+-----------+-----------------------------------------------------------------+
|  1 | SIMPLE      | customer |...|   5798330 | Using where; Using index; Using temporary; Using filesort       |
|  1 | SIMPLE      | orders   |...| 154545408 | Using where; Using join buffer (Hash Join Outer table orders)   |
|  1 | SIMPLE      | lineitem |...| 606119300 | Using where; Using join buffer (Hash Join Outer table lineitem) |
+----+-------------+----------+...+-----------+-----------------------------------------------------------------+

Lorsque la fonction de requête parallèle est activée, deux étapes de ce plan de requête peuvent utiliser l’optimisation de requête parallèle, comme l’indique la colonne Extra de la sortie EXPLAIN. Le CPU-intensive traitement I/O-intensive et de ces étapes est transféré vers la couche de stockage.


+----+...+--------------------------------------------------------------------------------------------------------------------------------+
| id |...| Extra                                                                                                                          |
+----+...+--------------------------------------------------------------------------------------------------------------------------------+
|  1 |...| Using where; Using index; Using temporary; Using filesort                                                                      |
|  1 |...| Using where; Using join buffer (Hash Join Outer table orders); Using parallel query (4 columns, 1 filters, 1 exprs; 0 extra)   |
|  1 |...| Using where; Using join buffer (Hash Join Outer table lineitem); Using parallel query (4 columns, 1 filters, 1 exprs; 0 extra) |
+----+...+--------------------------------------------------------------------------------------------------------------------------------+

Pour plus d’informations sur l’interprétation de la sortie EXPLAIN pour une requête parallèle et sur les parties des instructions SQL auxquelles s’appliquent les requêtes parallèles, consultez Constructions SQL pour les requêtes parallèles dans Aurora MySQL.

L’exemple de sortie suivant présente les résultats de l’exécution de la requête précédente au niveau d’une instance db.r4.2xlarge avec un groupe de mémoires tampons à froid. L’exécution de la requête est beaucoup plus rapide avec la fonction de requête parallèle.

Note

Comme la durée dépend de nombreux facteurs environnementaux, vos résultats peuvent différer. Menez toujours vos propres tests de performances pour confirmer ces résultats avec votre propre environnement, votre charge de travail, etc.


-- Without parallel query
+------------+-------------+-------------+----------------+
| l_orderkey | revenue     | o_orderdate | o_shippriority |
+------------+-------------+-------------+----------------+
|   92511430 | 514726.4896 | 1995-03-06  |              0 |
.
.
|   28840519 | 454748.2485 | 1995-03-08  |              0 |
+------------+-------------+-------------+----------------+
10 rows in set (24 min 49.99 sec)


-- With parallel query
+------------+-------------+-------------+----------------+
| l_orderkey | revenue     | o_orderdate | o_shippriority |
+------------+-------------+-------------+----------------+
|   92511430 | 514726.4896 | 1995-03-06  |              0 |
.
.
|   28840519 | 454748.2485 | 1995-03-08  |              0 |
+------------+-------------+-------------+----------------+
10 rows in set (1 min 49.91 sec)

La plupart des exemples de requêtes présentés dans cette section utilisent les tables de cet TPC-H ensemble de données, en particulier la PART table, qui comporte 20 millions de lignes et la définition suivante.


+---------------+---------------+------+-----+---------+-------+
| Field         | Type          | Null | Key | Default | Extra |
+---------------+---------------+------+-----+---------+-------+
| p_partkey     | int(11)       | NO   | PRI | NULL    |       |
| p_name        | varchar(55)   | NO   |     | NULL    |       |
| p_mfgr        | char(25)      | NO   |     | NULL    |       |
| p_brand       | char(10)      | NO   |     | NULL    |       |
| p_type        | varchar(25)   | NO   |     | NULL    |       |
| p_size        | int(11)       | NO   |     | NULL    |       |
| p_container   | char(10)      | NO   |     | NULL    |       |
| p_retailprice | decimal(15,2) | NO   |     | NULL    |       |
| p_comment     | varchar(23)   | NO   |     | NULL    |       |
+---------------+---------------+------+-----+---------+-------+

Faites les expérimentations nécessaires avec votre charge de travail afin de déterminer si les instructions SQL individuelles peuvent tirer parti de la fonction de requête parallèle. Utilisez ensuite les techniques de surveillance suivantes pour identifier la fréquence d’utilisation des requêtes parallèles dans les charges de travail réelles au fil du temps. Pour les charges de travail réelles, des facteurs supplémentaires tels que les limites de simultanéité s’appliquent.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Optimisation des requêtes parallèles

Surveillance de la fonction de requête parallèle