Clusters Amazon Redshift provisionnés - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Clusters Amazon Redshift provisionnés

Un entrepôt des données Amazon Redshift est un ensemble de ressources informatiques appelées nœuds, qui sont organisées en un groupe appelé cluster. Chaque cluster exécute un moteur Amazon Redshift et contient une ou plusieurs bases de données.

Note

À ce jour, le moteur Amazon Redshift version 1.0 est disponible. Toutefois, à mesure que le moteur est mis à jour, plusieurs versions du moteur Amazon Redshift peuvent être disponibles pour la sélection.

Clusters et nœuds dans Amazon Redshift

Un cluster Amazon Redshift est constitué de nœuds. Chaque cluster possède un nœud principal et un ou plusieurs nœuds de calcul. Le nœud principal reçoit les requêtes d’applications clientes, analyse les requêtes et développe les plans d’exécution de requête. Le nœud principal coordonne ensuite l’exécution parallèle de ces plans avec les nœuds de calcul et regroupe les résultats intermédiaires de ces nœuds. Enfin, il renvoie ensuite les résultats aux applications clientes.

Les nœuds de calcul exécutent les plans d’exécution de requête et communiquent les données entre eux afin de traiter ces requêtes. Les résultats intermédiaires sont renvoyés au nœud « leader » afin d’être compilés, puis transmis aux applications clientes. Pour plus d’informations sur les nœuds principaux et les nœuds de calcul, consultez Architecture du système d’entrepôt des données dans le Guide du développeur de la base de données Amazon Redshift.

Note

Lorsque vous créez un cluster sur la console Amazon Redshift (https://console.aws.amazon.com/redshiftv2/), vous pouvez obtenir une recommandation concernant la configuration de votre cluster en fonction de la taille de vos données et des caractéristiques de vos requêtes. Pour utiliser ce calculateur de dimensionnement, recherchez Aidez-moi à choisir sur la console dans AWS Régions qui prennent en charge les types de RA3 nœuds. Pour de plus amples informations, veuillez consulter Création d’un cluster.

Lorsque vous lancez un cluster, vous spécifiez notamment l’option correspondant au type de nœud. Le type de nœud détermine l’UC, la RAM, la capacité de stockage et le type de disque de stockage de chaque nœud.

Amazon Redshift propose différents types de nœuds adaptés à vos charges de travail, et nous vous recommandons de choisir RA3 ou DC2 de vous fier aux performances requises, à la taille des données et à la croissance attendue des données.

RA3 les nœuds dotés d'un stockage géré vous permettent d'optimiser votre entrepôt de données en dimensionnant et en payant le calcul et le stockage géré de manière indépendante. Avec RA3, vous choisissez le nombre de nœuds en fonction de vos exigences de performance et vous ne payez que pour le stockage géré que vous utilisez. Dimensionnez votre RA3 cluster en fonction de la quantité de données que vous traitez quotidiennement. Vous lancez des clusters qui utilisent les types de RA3 nœuds d'un cloud privé virtuel (VPC). Pour de plus amples informations, veuillez consulter Création d'un cluster provisionné par Redshift ou d'un groupe de travail Amazon Redshift Serverless dans un VPC.

Le stockage géré Amazon Redshift utilise une grande capacité de stockage SSDs à hautes performances dans chaque RA3 nœud pour un stockage local rapide et Amazon S3 pour un stockage durable à long terme. Si les données d'un nœud dépassent la taille d'un nœud local de grande taille SSDs, le stockage géré par Amazon Redshift transfère automatiquement ces données vers Amazon S3. Vous payez le même tarif modique pour le stockage géré par Amazon Redshift, que les données se trouvent sur Amazon S3 SSDs ou à hautes performances. Pour les charges de travail qui nécessitent un stockage en constante augmentation, le stockage géré vous permet d'adapter automatiquement la capacité de stockage de votre entrepôt de données indépendamment des nœuds de calcul.

DC2 les nœuds vous permettent de disposer d'entrepôts de données gourmands en calcul avec stockage SSD local inclus. Vous choisissez le nombre de nœuds dont vous avez besoin en fonction de la taille des données et des exigences de performance. DC2 les nœuds stockent vos données localement pour des performances élevées, et à mesure que la taille des données augmente, vous pouvez ajouter d'autres nœuds de calcul pour augmenter la capacité de stockage du cluster. Pour les ensembles de données de moins de 1 To (compressés), nous recommandons les types de DC2 nœuds pour obtenir les meilleures performances au prix le plus bas. Si vous pensez que vos données augmenteront, nous vous recommandons d'utiliser des RA3 nœuds afin de pouvoir dimensionner le calcul et le stockage de manière indépendante afin d'améliorer le prix et les performances. Vous lancez des clusters qui utilisent les types de DC2 nœuds d'un cloud privé virtuel (VPC). Pour de plus amples informations, veuillez consulter Création d'un cluster provisionné par Redshift ou d'un groupe de travail Amazon Redshift Serverless dans un VPC.

Les types de nœuds sont disponibles en différentes tailles. La taille de nœud et le nombre de nœuds de déterminent le stockage total d’un cluster. Pour plus d'informations, consultez Détails de type de nœud.

Certains types de nœud autorisent un nœud (type à nœud unique) ou deux ou plusieurs nœuds (type à plusieurs nœuds). Le nombre minimum de nœuds pour les clusters de certains types de nœuds est de deux nœuds. Sur un cluster à un seul nœud, le nœud est partagé pour les fonctionnalités « principal » et « calcul ». Les clusters à nœud unique ne sont pas recommandés pour l’exécution de charges de travail de production. Sur un cluster à plusieurs nœuds, le nœud principal est distinct des nœuds de calcul. Le nœud de ligne est le même type de nœud que les nœuds de calcul. Vous ne payez que pour les nœuds de calcul.

Amazon Redshift applique des quotas aux ressources pour chaque AWS compte dans chaque AWS région. Un quota limite le nombre de ressources que votre compte peut créer pour un type de ressource donné, comme les nœuds ou les instantanés, au sein d'une AWS région. Pour plus d'informations sur les quotas par défaut qui s'appliquent aux ressources Amazon Redshift, consultez. Quotas et limites d’Amazon Redshift

Le coût de votre cluster dépend de la AWS région, du type de nœud, du nombre de nœuds et du fait que les nœuds sont réservés à l'avance ou non. Pour plus d’informations sur le coût des nœuds, consultez la page de Tarification d’Amazon Redshift.

Détails de type de nœud

Les tableaux suivants résument les spécifications de nœud de chaque type de nœud et taille. Les en-têtes dans les tableaux ont les significations suivantes :

  • vCPU est le nombre de connexions virtuelles CPUs pour chaque nœud.

  • RAM correspond à la quantité de mémoire en gibioctets (Gio) de chaque nœud.

  • Tranches par nœud est le nombre de tranches dans lesquelles un nœud de calcul est partitionné lorsqu’un cluster est créé ou redimensionné avec un redimensionnement classique.

    Le nombre de sections par nœud peut changer si le cluster est redimensionné à l’aide du redimensionnement Elastic. Cependant, le nombre total de tranches sur tous les nœuds de calcul dans le cluster reste le même après le redimensionnement élastique.

    Lorsque vous créez un cluster avec l’opération de restauration à partir d’un instantané, le nombre de tranches du cluster résultant peut changer par rapport au cluster d’origine si vous modifiez le type de nœud.

  • Stockage correspond à la capacité et au type de stockage de chaque nœud.

  • La plage de nœuds est le nombre minimum et maximum de nœuds qu’Amazon Redshift prend en charge pour le type et la taille de nœud.

    Note

    Il se peut que vous soyez limité à un nombre de nœuds inférieur en fonction du quota appliqué à votre AWS compte dans la AWS région sélectionnée. Pour plus d'informations sur les quotas par défaut qui s'appliquent aux ressources Amazon Redshift, consultez. Quotas et limites d’Amazon Redshift

  • Capacité totale correspond à la capacité de stockage totale du cluster si vous déployez le nombre maximal de nœuds spécifié dans la plage de nœuds.

Le tableau suivant décrit les spécifications relatives RA3 aux nœuds.

Type de nœud vCPU RAM (Gio) Tranches par défaut par nœud Limite de stockage géré par nœud 1 Plage de nœuds avec la création d’un cluster Capacité de stockage géré totale 2
ra3.large (nœud unique) 2 16 2 1 To 1 1 To 3
ra3.large (multi-nœuds) 2 16 2 8 TO 2-16 128 To
ra3.xlplus (nœud unique) 4 32 2 4 To 1 4 To3
ra3.xlplus (multi-nœuds) 4 32 2 32 To 2–164 1 024 To4
ra3.4xlarge 12 96 4 128 To 2–325 8 192 To5
ra3.16xlarge 48 384 16 128 To 2–128 16 384 To

1 La limite de stockage pour le stockage géré Amazon Redshift. Il s’agit d’une limite stricte.

2 La limite de stockage géré totale correspond au nombre maximal de nœuds multiplié par la limite de stockage géré par nœud.

3 Pour redimensionner un cluster à nœud unique en cluster à plusieurs nœuds, seul le redimensionnement classique est pris en charge.

4 Vous pouvez créer un cluster avec le type de nœud ra3.xlplus (multi-nœuds) qui a jusqu’à 16 nœuds. Pour les clusters à plusieurs nœuds, vous pouvez redimensionner avec le redimensionnement Elastic jusqu’à 32 nœuds maximum.

5 Vous pouvez créer un cluster avec le type de nœud ra3.4xlarge qui a jusqu’à 32 nœuds. Vous pouvez le redimensionner avec un redimensionnement Elastic jusqu’à un maximum de 64 nœuds.

Le tableau suivant décrit les spécifications relatives aux nœuds de calcul denses.

Type de nœud vCPU RAM (Gio) Tranches par défaut par nœud Stockage par nœud Plage de nœuds Capacité totale
dc2.large 2 15 2 SSD DE 160 GO NVMe 1–32 5.12 To
dc2.8xlarge 32 244 16 SSD DE 2,56 TO NVMe 2–128 326 To
Note

Les types de nœuds de stockage dense (DS2) ne sont plus disponibles.

Noms précédents des types de nœud

Dans les versions précédentes d’Amazon Redshift, certains types de nœuds avaient des noms différents. Vous pouvez utiliser les anciens noms dans l'API Amazon Redshift et. AWS CLI Néanmoins, nous vous recommandons de mettre à jour tous les scripts qui font référence à ces noms afin d’utiliser les noms actuels à la place. Les noms anciens et actuels sont les suivants.

Nom actuel Noms précédents
ds2.xlarge ds1.xlarge, dw.hs1.xlarge, dw1.xlarge
ds2.8xlarge ds1.8xlarge, dw.hs1.8xlarge, dw1.8xlarge
dc1.large dw2.large
dc1.8xlarge dw2.8xlarge

Détermination du nombre de nœuds

Étant donné qu’Amazon Redshift distribue et exécute les requêtes en parallèle sur l’ensemble des nœuds de calcul d’un cluster, vous pouvez augmenter les performances des requêtes en ajoutant des nœuds à votre cluster. Lorsque vous exécutez un cluster équipé d’au moins deux nœuds de calcul, les données présentes sur chaque nœud sont toujours mises en miroir sur les disques de l’autre nœud, réduisant ainsi le risque de perte de données.

Vous pouvez surveiller les performances des requêtes dans la console Amazon Redshift et à l'aide des métriques Amazon CloudWatch . Vous pouvez également ajouter ou supprimer des nœuds si nécessaire pour atteindre l’équilibre entre le prix et les performances de votre cluster. Lorsque vous demandez un nœud supplémentaire, Amazon Redshift prend en charge tous les détails du déploiement, de l’équilibrage de charge et de la maintenance des données. Pour plus d’informations sur les performances des clusters, consultez Surveiller les performances de cluster Amazon Redshift.

Les nœuds réservés conviennent aux charges de travail régulières en production et vous permettent de réaliser d’importantes économies par rapport aux nœuds à la demande. Vous pouvez acheter des nœuds réservés après avoir effectué des tests et proof-of-concepts pour valider votre configuration de production. Pour de plus amples informations, veuillez consulter Nœuds réservés.

Lorsque vous mettez en pause un cluster, vous suspendez la facturation à la demande pendant la période de mise en pause du cluster. Pendant cette période de pause, vous ne payez que pour le stockage de sauvegarde. Vous n’avez donc pas à vous soucier de la planification et de l’achat de capacités pour l’entrepôt des données en amont, ce qui vous permet de gérer de manière rentable vos environnements à des fins de test ou de développement.

Pour plus d’informations sur la tarification des nœuds à la demande et réservés, consultez la Tarification Amazon Redshift.

EC2 À utiliser pour créer votre cluster

Les clusters Amazon Redshift s'exécutent dans des EC2 instances Amazon configurées pour le type et la taille du nœud Amazon Redshift que vous sélectionnez. Pour plus d'informations sur ces plateformes réseau, consultez la section Plateformes prises en charge dans le guide de EC2 l'utilisateur Amazon.

Note

Afin d’éviter les problèmes de connexion entre les outils clients SQL et la base de données Amazon Redshift, nous vous conseillons d’opter pour l’une des deux approches suivantes. Vous pouvez configurer une règle de trafic entrant qui permet aux hôtes de négocier la taille des paquets. Vous pouvez également désactiver les trames jumbo TCP/IP en réglant l'unité de transmission maximale (MTU) à 1500 sur l'interface réseau (NIC) de vos instances Amazon. EC2 Pour plus d’informations sur ces approches, consultez Des requêtes semblent se bloquer et parfois échouent à atteindre le cluster.

Amazon Virtual Private Cloud (Amazon VPC)

Lorsque vous utilisez Amazon VPC, votre cluster s'exécute dans un cloud privé virtuel (VPC) qui est logiquement isolé de votre compte. AWS Si vous approvisionnez votre cluster avec Amazon VPC, vous contrôlez l'accès à votre cluster en lui associant un ou plusieurs groupes de sécurité VPC. Pour plus d’informations, consultez Groupes de sécurité pour votre VPC dans le manuel Amazon VPC Guide de l’utilisateur.

Pour créer un cluster dans un VPC, vous devez d’abord créer un groupe de sous-réseau de cluster Amazon Redshift en fournissant les informations de sous-réseau de votre VPC, puis renseigner le groupe de sous-réseau lors du lancement du cluster. Pour plus d'informations, consultez Sous-réseaux pour les ressources Redshift.

Pour plus d’informations sur Amazon Virtual Private Cloud (Amazon VPC), consultez la Page détaillée du produit Amazon VPC.

Alarme d’espace disque par défaut

Lorsque vous créez un cluster Amazon Redshift, vous pouvez éventuellement configurer une CloudWatch alarme Amazon pour surveiller le pourcentage moyen d'espace disque utilisé sur tous les nœuds de votre cluster. Nous nous référons à cette alarme comme alarme d’espace disque par défaut.

Le but d’une alarme d’espace disque par défaut consiste à vous aider à surveiller la capacité de stockage de votre cluster. Vous pouvez configurer cette alarme selon les besoins de votre entrepôt des données. Par exemple, vous pouvez utiliser l’avertissement comme indicateur vous signalant que vous devez redimensionner le cluster. Vous pouvez redimensionner votre cluster soit en un type de nœud différent, soit pour ajouter des nœuds, ou encore pour acheter des nœuds réservés en vue d’une expansion future.

L’alarme d’espace disque par défaut se déclenche lorsque l’utilisation du disque atteint ou dépasse un pourcentage spécifié un certain nombre de fois et sur une durée spécifiée. Par défaut, l’alarme se déclenche lorsque le pourcentage que vous spécifiez est atteint, puis demeure à cette valeur ou à une valeur supérieure pendant cinq minutes ou plus. Vous pouvez modifier les valeurs par défaut après que vous avez lancé le cluster.

Lorsque l' CloudWatch alarme se déclenche, Amazon Simple Notification Service (Amazon SNS) envoie une notification aux destinataires spécifiés pour les avertir que le seuil de pourcentage est atteint. Amazon SNS utilise une rubrique pour spécifier les destinataires et le message transmis dans une notification. Vous pouvez utiliser une rubrique Amazon SNS existant ; sinon, une rubrique est créée en fonction des paramètres que vous spécifiez lorsque vous lancez le cluster. Vous pouvez modifier la rubrique de cette alarme après avoir lancé le cluster. Pour plus d’informations sur la création de sujets Amazon SNS, consultez Démarrage avec Amazon Simple Notification Service.

Après avoir lancé le cluster, vous pouvez afficher et modifier l'alarme depuis la fenêtre État du cluster sous CloudWatch Alarmes. Le nom est percentage-disk-space-usedstring-default-< >. Vous pouvez ouvrir l’alarme pour afficher la rubrique Amazon SNS à laquelle elle est associée et modifier les paramètres de l’alarme. Si vous n'avez pas sélectionné de rubrique Amazon SNS existante à utiliser, celle créée pour vous s'appelle < clustername >-default-alarm (< recipient >) ; par exemple, (notify@example.com). examplecluster-default-alarms

Pour plus d’informations sur la configuration et la modification de l’alarme d’espace disque par défaut, consultez Création d’un cluster et Création d'une alarme d'espace disque.

Note

Si vous supprimez votre cluster, l’alarme associée au cluster n’est pas supprimée, mais elle ne se déclenchera pas. Vous pouvez supprimer l'alarme de la CloudWatch console si vous n'en avez plus besoin.

Statut du cluster

L’état actuel du cluster s’affiche. Le tableau suivant fournit une description de chaque état du cluster.

État Description
available Le cluster est en cours d’exécution et disponible.
available, prep-for-resize Le cluster est préparé pour le redimensionnement Elastic. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
available, resize-cleanup L’opération de redimensionnement Elastic finalise le transfert des données vers les nouveaux nœuds du cluster. Le cluster est exécuté et disponible pour les requêtes d’écriture et de lecture, mais les opérations du cluster, comme la création d’un instantané, ne sont pas disponibles.
cancelling-resize L’opération de redimensionnement est en cours d’annulation.
creating Amazon Redshift crée le cluster. Pour plus d'informations, consultez Création d’un cluster.
deleting Amazon Redshift supprime le cluster. Pour de plus amples informations, veuillez consulter Arrêt et suppression d'un cluster.
final-snapshot Amazon Redshift prend un instantané final du cluster avant de le supprimer. Pour de plus amples informations, veuillez consulter Arrêt et suppression d'un cluster.
hardware-failure

Le cluster subit une défaillance matérielle.

Si vous avez un cluster à nœud unique, le nœud ne peut pas être remplacé. Pour récupérer votre cluster, restaurez un instantané. Pour plus d'informations, consultez Instantanés et sauvegardes Amazon Redshift.

incompatible-hsm Amazon Redshift ne peut pas se connecter au module de sécurité matérielle (HSM). Vérifiez la configuration du HSM entre le cluster et le module de sécurité matérielle. Pour plus d'informations, consultez Chiffrement à l'aide de modules de sécurité matériels.
incompatible-network Il y a un problème avec la configuration du réseau sous-jacent. Assurez-vous que le VPC dans lequel vous avez lancé le cluster existe et que ses paramètres sont corrects. Pour plus d'informations, consultez Ressources Redshift dans un VPC.
incompatible-parameters Problème avec une ou plusieurs valeurs du groupe de paramètres associé, et la ou les valeurs de paramètre ne peuvent pas s’appliquer. Modifiez le groupe de paramètres et mettez à jour les valeurs non valides. Pour plus d'informations, consultez Groupes de paramètres Amazon Redshift.
incompatible-restore Problème de restauration du cluster à partir de l’instantané. Essayez de restaurer le cluster à nouveau avec un autre instantané. Pour plus d'informations, consultez Instantanés et sauvegardes Amazon Redshift.
modifying Amazon Redshift applique les modifications au cluster. Pour plus d'informations, consultez Modification d’un cluster.
paused Le cluster est mis en pause. Pour plus d'informations, consultez Suspension et reprise d'un cluster.
rebooting Amazon Redshift redémarre le cluster. Pour plus d'informations, consultez Redémarrage d’un cluster.
renaming Amazon Redshift applique un nouveau nom au cluster. Pour plus d'informations, consultez Modification du nom d'un cluster.
resizing Amazon Redshift redimensionne le cluster. Pour plus d'informations, consultez Redimensionnement d’un cluster.
rotating-keys Amazon Redshift effectue une rotation des clés de chiffrement pour le cluster. Pour plus d'informations, consultez Rotation des clés de chiffrement.
storage-full Le cluster a atteint sa capacité de stockage. Redimensionnez le cluster pour ajouter des nœuds ou choisir une autre taille de nœud. Pour de plus amples informations, veuillez consulter Redimensionnement d’un cluster.
updating-hsm Amazon Redshift est en train de mettre à jour la configuration du HSM.