Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Vous pouvez utiliser AWS Glue la console ou l' AWS API pour activer le compactage de vos tables Apache Iceberg dans le catalogue de AWS Glue données. AWS CLI Pour les nouvelles tables, vous pouvez choisir Apache Iceberg comme format de table et activer le compactage lors de la création de la table. Le compactage est désactivé par défaut pour les nouvelles tables.
Pour activer le compactage
-
Ouvrez la AWS Glue console https://console.aws.amazon.com/glue/
et connectez-vous en tant qu'administrateur du lac de données, créateur de table ou utilisateur ayant obtenu les lakeformation:GetDataAccess
autorisationsglue:UpdateTable
et sur la table. -
Dans le panneau de navigation, sous Catalogue de données, choisissez Tables.
Sur la page Tables, choisissez une table au format de table ouverte pour laquelle vous souhaitez activer le compactage, puis dans le menu Actions, choisissez Optimisation, puis sélectionnez Activer.
Vous pouvez également activer le compactage en sélectionnant l'onglet Optimisation des tables sur la page des détails des tables. Choisissez l'onglet Optimisation des tables dans la partie inférieure de la page, puis sélectionnez Activer le compactage.
L'option Activer l'optimisation est également disponible lorsque vous créez une nouvelle table Iceberg dans le catalogue de données.
-
Sur la page Activer l'optimisation, sélectionnez Compaction sous Options d'optimisation.
-
Ensuite, sélectionnez un rôle IAM dans le menu déroulant avec les autorisations indiquées dans la Conditions préalables requises pour l'optimisation des tables section.
Vous pouvez également choisir l'option Créer un nouveau rôle IAM pour créer un rôle personnalisé doté des autorisations requises pour exécuter le compactage.
Suivez les étapes ci-dessous pour mettre à jour un rôle IAM existant :
-
Pour mettre à jour la stratégie d'autorisation pour le rôle IAM, dans la console IAM, accédez au rôle IAM utilisé pour exécuter le compactage.
-
Dans la section Ajouter des autorisations, choisissez Créer une politique. Dans la fenêtre du navigateur nouvellement ouverte, créez une nouvelle stratégie à utiliser avec votre rôle.
-
Sur la page Créer une politique, choisissez l'
JSON
onglet. Copiez le code JSON affiché dans les conditions préalables dans le champ de l'éditeur de politiques.
-
-
Si vous avez des configurations de politique de sécurité dans lesquelles l'optimiseur de table Iceberg doit accéder aux compartiments Amazon S3 à partir d'un Virtual Private Cloud (VPC) spécifique, créez AWS Glue une connexion réseau ou utilisez une connexion réseau existante.
Si aucune connexion AWS Glue VPC n'est déjà configurée, créez-en une nouvelle en suivant les étapes de la section Création de connexions pour les connecteurs à l'aide de la AWS Glue console ou du /SDK. AWS CLI
-
Choisissez Activer l'optimisation.
Après avoir activé le compactage, l'onglet Optimisation des tables affiche les détails de compactage suivants (après environ 15 à 20 minutes) :
- L’heure de début
-
Heure à laquelle le processus de compactage a commencé dans le catalogue de données. La valeur est un horodatage selon le fuseau UTC.
- L’heure de fin
-
Heure à laquelle le processus de compactage s'est terminé dans le catalogue de données. La valeur est un horodatage selon le fuseau UTC.
- Statut
-
État du cycle de compactage. Les valeurs sont la réussite ou l'échec.
- Fichiers compactés
Nombre total de fichiers compactés.
- Octets compactés
-
Nombre total d'octets compactés.