Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Activation de l'optimiseur de compactage

Mode de mise au point
Activation de l'optimiseur de compactage - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vous pouvez utiliser AWS Glue la console ou l' AWS API pour activer le compactage de vos tables Apache Iceberg dans le catalogue de AWS Glue données. AWS CLI Pour les nouvelles tables, vous pouvez choisir Apache Iceberg comme format de table et activer le compactage lors de la création de la table. Le compactage est désactivé par défaut pour les nouvelles tables.

Console
Pour activer le compactage
  1. Ouvrez la AWS Glue console https://console.aws.amazon.com/glue/et connectez-vous en tant qu'administrateur du lac de données, créateur de table ou utilisateur ayant obtenu les lakeformation:GetDataAccess autorisations glue:UpdateTable et sur la table.

  2. Dans le panneau de navigation, sous Catalogue de données, choisissez Tables.

  3. Sur la page Tables, choisissez une table au format de table ouverte pour laquelle vous souhaitez activer le compactage, puis dans le menu Actions, choisissez Optimisation, puis sélectionnez Activer.

    Vous pouvez également activer le compactage en sélectionnant l'onglet Optimisation des tables sur la page des détails des tables. Choisissez l'onglet Optimisation des tables dans la partie inférieure de la page, puis sélectionnez Activer le compactage.

    L'option Activer l'optimisation est également disponible lorsque vous créez une nouvelle table Iceberg dans le catalogue de données.

  4. Sur la page Activer l'optimisation, sélectionnez Compaction sous Options d'optimisation.

    Page de détails de la table Apache Iceberg avec l'option Activer le compactage.
  5. Ensuite, sélectionnez un rôle IAM dans le menu déroulant avec les autorisations indiquées dans la Conditions préalables requises pour l'optimisation des tables section.

    Vous pouvez également choisir l'option Créer un nouveau rôle IAM pour créer un rôle personnalisé doté des autorisations requises pour exécuter le compactage.

    Suivez les étapes ci-dessous pour mettre à jour un rôle IAM existant :

    1. Pour mettre à jour la stratégie d'autorisation pour le rôle IAM, dans la console IAM, accédez au rôle IAM utilisé pour exécuter le compactage.

    2. Dans la section Ajouter des autorisations, choisissez Créer une politique. Dans la fenêtre du navigateur nouvellement ouverte, créez une nouvelle stratégie à utiliser avec votre rôle.

    3. Sur la page Créer une politique, choisissez l'JSONonglet. Copiez le code JSON affiché dans les conditions préalables dans le champ de l'éditeur de politiques.

  6. Si vous avez des configurations de politique de sécurité dans lesquelles l'optimiseur de table Iceberg doit accéder aux compartiments Amazon S3 à partir d'un Virtual Private Cloud (VPC) spécifique, créez AWS Glue une connexion réseau ou utilisez une connexion réseau existante.

    Si aucune connexion AWS Glue VPC n'est déjà configurée, créez-en une nouvelle en suivant les étapes de la section Création de connexions pour les connecteurs à l'aide de la AWS Glue console ou du /SDK. AWS CLI

  7. Choisissez Activer l'optimisation.

AWS CLI

L'exemple suivant montre comment activer le compactage. Remplacez l'identifiant de compte par un identifiant de AWS compte valide. Remplacez le nom de la base de données et le nom de la table par un nom réel de la table Iceberg et le nom de la base de données. Remplacez le roleArn par le nom de AWS ressource (ARN) du rôle IAM et le nom du rôle IAM disposant des autorisations requises pour exécuter le compactage.

aws glue create-table-optimizer \ --catalog-id 123456789012 \ --database-name iceberg_db \ --table-name iceberg_table \ --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'true', "vpcConfiguration":{"glueConnectionName":"glue_connection_name"}}' \ --type compaction
AWS API

Appelez une opération CreateTableOptimizer pour activer le compactage d'une table.

Pour activer le compactage
  1. Ouvrez la AWS Glue console https://console.aws.amazon.com/glue/et connectez-vous en tant qu'administrateur du lac de données, créateur de table ou utilisateur ayant obtenu les lakeformation:GetDataAccess autorisations glue:UpdateTable et sur la table.

  2. Dans le panneau de navigation, sous Catalogue de données, choisissez Tables.

  3. Sur la page Tables, choisissez une table au format de table ouverte pour laquelle vous souhaitez activer le compactage, puis dans le menu Actions, choisissez Optimisation, puis sélectionnez Activer.

    Vous pouvez également activer le compactage en sélectionnant l'onglet Optimisation des tables sur la page des détails des tables. Choisissez l'onglet Optimisation des tables dans la partie inférieure de la page, puis sélectionnez Activer le compactage.

    L'option Activer l'optimisation est également disponible lorsque vous créez une nouvelle table Iceberg dans le catalogue de données.

  4. Sur la page Activer l'optimisation, sélectionnez Compaction sous Options d'optimisation.

    Page de détails de la table Apache Iceberg avec l'option Activer le compactage.
  5. Ensuite, sélectionnez un rôle IAM dans le menu déroulant avec les autorisations indiquées dans la Conditions préalables requises pour l'optimisation des tables section.

    Vous pouvez également choisir l'option Créer un nouveau rôle IAM pour créer un rôle personnalisé doté des autorisations requises pour exécuter le compactage.

    Suivez les étapes ci-dessous pour mettre à jour un rôle IAM existant :

    1. Pour mettre à jour la stratégie d'autorisation pour le rôle IAM, dans la console IAM, accédez au rôle IAM utilisé pour exécuter le compactage.

    2. Dans la section Ajouter des autorisations, choisissez Créer une politique. Dans la fenêtre du navigateur nouvellement ouverte, créez une nouvelle stratégie à utiliser avec votre rôle.

    3. Sur la page Créer une politique, choisissez l'JSONonglet. Copiez le code JSON affiché dans les conditions préalables dans le champ de l'éditeur de politiques.

  6. Si vous avez des configurations de politique de sécurité dans lesquelles l'optimiseur de table Iceberg doit accéder aux compartiments Amazon S3 à partir d'un Virtual Private Cloud (VPC) spécifique, créez AWS Glue une connexion réseau ou utilisez une connexion réseau existante.

    Si aucune connexion AWS Glue VPC n'est déjà configurée, créez-en une nouvelle en suivant les étapes de la section Création de connexions pour les connecteurs à l'aide de la AWS Glue console ou du /SDK. AWS CLI

  7. Choisissez Activer l'optimisation.

Après avoir activé le compactage, l'onglet Optimisation des tables affiche les détails de compactage suivants (après environ 15 à 20 minutes) :

L’heure de début

Heure à laquelle le processus de compactage a commencé dans le catalogue de données. La valeur est un horodatage selon le fuseau UTC.

L’heure de fin

Heure à laquelle le processus de compactage s'est terminé dans le catalogue de données. La valeur est un horodatage selon le fuseau UTC.

Statut

État du cycle de compactage. Les valeurs sont la réussite ou l'échec.

Fichiers compactés

Nombre total de fichiers compactés.

Octets compactés

Nombre total d'octets compactés.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.