API de catalogues - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

API de catalogues

L'API Catalogs décrit comment créer, supprimer, localiser, mettre à jour et répertorier les catalogues. APIs

Types de données

Structure du catalogue

L'objet de catalogue représente un regroupement logique de bases de données dans le catalogue de AWS Glue données ou dans une source fédérée. Vous pouvez désormais créer un catalogue fédéré Redshift ou un catalogue contenant des liens de ressources vers des bases de données Redshift d'un autre compte ou d'une autre région.

Champs
  • CatalogId – Chaîne d'ID de catalogue, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    L'ID du catalogue. Pour autoriser l'accès au catalogue par défaut, ce champ ne doit pas être fourni.

  • NameObligatoire : chaîne UTF-8, d'au moins 1 ou plus de 64 octets, correspondant au. Custom string pattern #25

    Le nom du catalogue. Il ne peut pas être identique à l'identifiant du compte.

  • ResourceArn – Chaîne UTF-8.

    Le nom de ressource Amazon (ARN) attribué à la ressource du catalogue.

  • Description – Chaîne de description, d'une longueur maximale de 2 048 octets, correspondant au URI address multi-line string pattern.

    Chaîne de description, d'une longueur maximale de 2 048 octets, correspondant au modèle de chaîne multiligne de l'adresse URI. Description du catalogue.

  • Parameters – Tableau de mappage de paires valeur-clé.

    Chaque clé est une chaîne de clé, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 512 000 octets.

    Tableau cartographique de paires clé-valeur qui définissent les paramètres et les propriétés du catalogue.

  • CreateTime – Horodatage.

    Heure à laquelle le catalogue a été créé.

  • UpdateTime – Horodatage.

    Heure à laquelle le catalogue a été mis à jour pour la dernière fois.

  • TargetRedshiftCatalog – Un objet TargetRedshiftCatalog.

    TargetRedshiftCatalogObjet qui décrit un catalogue cible pour la liaison de ressources de base de données.

  • FederatedCatalog – Un objet FederatedCatalog.

    Un FederatedCatalog objet qui pointe vers une entité en dehors du catalogue de AWS Glue données.

  • CatalogProperties – Un objet CatalogPropertiesOutput.

    CatalogPropertiesObjet qui spécifie les propriétés d'accès au lac de données et d'autres propriétés personnalisées.

  • CreateTableDefaultPermissions – Un tableau d'objets PrincipalPermissions.

    Tableau d’objets PrincipalPermissions. Crée un ensemble d'autorisations par défaut sur la ou les tables pour les principaux. Utilisé par AWS Lake Formation. Non utilisé dans le cours normal des AWS Glue opérations.

  • CreateDatabaseDefaultPermissions – Un tableau d'objets PrincipalPermissions.

    Tableau d’objets PrincipalPermissions. Crée un ensemble d'autorisations par défaut sur la ou les bases de données pour les principaux. Utilisé par AWS Lake Formation. Non utilisé dans le cours normal des AWS Glue opérations.

CatalogInput structure

Structure qui décrit les propriétés du catalogue.

Champs
  • Description – Chaîne de description, d'une longueur maximale de 2 048 octets, correspondant au URI address multi-line string pattern.

    Chaîne de description, d'une longueur maximale de 2 048 octets, correspondant au modèle de chaîne multiligne de l'adresse URI. Description du catalogue.

  • FederatedCatalog – Un objet FederatedCatalog.

    Un objet FederatedCatalog. FederatedCatalogStructure qui fait référence à une entité extérieure au catalogue de AWS Glue données, par exemple une base de données Redshift.

  • Parameters – Tableau de mappage de paires valeur-clé.

    Chaque clé est une chaîne de clé, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 512 000 octets.

    Tableau cartographique de paires clé-valeur qui définissent les paramètres et les propriétés du catalogue.

  • TargetRedshiftCatalog – Un objet TargetRedshiftCatalog.

    TargetRedshiftCatalogObjet qui décrit un catalogue cible pour la liaison de ressources.

  • CatalogProperties – Un objet CatalogProperties.

    CatalogPropertiesObjet qui spécifie les propriétés d'accès au lac de données et d'autres propriétés personnalisées.

  • CreateTableDefaultPermissions – Un tableau d'objets PrincipalPermissions.

    Tableau d’objets PrincipalPermissions. Crée un ensemble d'autorisations par défaut sur la ou les tables pour les principaux. Utilisé par AWS Lake Formation. Il doit généralement être défini explicitement sous forme de liste vide.

  • CreateDatabaseDefaultPermissions – Un tableau d'objets PrincipalPermissions.

    Tableau d’objets PrincipalPermissions. Crée un ensemble d'autorisations par défaut sur la ou les bases de données pour les principaux. Utilisé par AWS Lake Formation. Il doit généralement être défini explicitement sous forme de liste vide.

TargetRedshiftCatalog structure

Structure qui décrit un catalogue cible pour la liaison de ressources.

Champs
  • CatalogArnObligatoire : chaîne UTF-8.

    Le nom de ressource Amazon (ARN) de la ressource du catalogue.

CatalogProperties structure

Structure qui spécifie les propriétés d'accès au lac de données et d'autres propriétés personnalisées.

Champs
  • DataLakeAccessProperties – Un objet DataLakeAccessProperties.

    DataLakeAccessPropertiesObjet qui spécifie les propriétés permettant de configurer l'accès au lac de données pour la ressource de votre catalogue dans le catalogue de AWS Glue données.

  • CustomProperties – Tableau de mappage de paires valeur-clé.

    Chaque clé est une chaîne de clé, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 512 000 octets.

    Propriétés clé-valeur supplémentaires pour le catalogue, telles que l'optimisation des statistiques des colonnes.

CatalogPropertiesOutput structure

Attributs de propriété qui incluent les propriétés de configuration de la ressource du catalogue.

Champs
  • DataLakeAccessProperties – Un objet DataLakeAccessPropertiesOutput.

    DataLakeAccessPropertiesObjet doté de propriétés d'entrée permettant de configurer l'accès au lac de données pour les ressources de votre catalogue dans le catalogue de AWS Glue données.

  • CustomProperties – Tableau de mappage de paires valeur-clé.

    Chaque clé est une chaîne de clé, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 512 000 octets.

    Propriétés clé-valeur supplémentaires pour le catalogue, telles que l'optimisation des statistiques des colonnes.

DataLakeAccessProperties structure

Entrez des propriétés pour configurer l'accès au lac de données pour la ressource de votre catalogue dans le catalogue de AWS Glue données.

Champs
  • DataLakeAccess – Booléen.

    Active ou désactive l'accès aux lacs de données pour les applications Apache Spark qui accèdent aux bases de données Amazon Redshift dans le catalogue de données à partir d'un moteur autre que Redshift, tel qu'Amazon Athena, Amazon EMR ou ETL. AWS Glue

  • DataTransferRole – Chaîne UTF-8, correspondant au Custom string pattern #51.

    Rôle qui sera assumé par le transfert AWS Glue de données vers/depuis le compartiment intermédiaire lors d'une requête.

  • KmsKey – Chaîne UTF-8.

    Une clé de chiffrement qui sera utilisée pour le bucket intermédiaire qui sera créé avec le catalogue.

  • CatalogType – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Spécifie un type de catalogue fédéré pour la ressource de catalogue native. Le type actuellement pris en charge estaws:redshift.

DataLakeAccessPropertiesOutput structure

Les propriétés de sortie de la configuration d'accès au lac de données pour votre ressource de catalogue dans le catalogue de AWS Glue données.

Champs
  • DataLakeAccess – Booléen.

    Active ou désactive l'accès au lac de données pour les applications Apache Spark qui accèdent aux bases de données Amazon Redshift dans le catalogue de données.

  • DataTransferRole – Chaîne UTF-8, correspondant au Custom string pattern #51.

    Rôle qui sera assumé par le transfert AWS Glue de données vers/depuis le compartiment intermédiaire lors d'une requête.

  • KmsKey – Chaîne UTF-8.

    Une clé de chiffrement qui sera utilisée pour le bucket intermédiaire qui sera créé avec le catalogue.

  • ManagedWorkgroupName – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Le nom de calcul Redshift Serverless géré créé pour votre ressource de catalogue.

  • ManagedWorkgroupStatus – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    État du calcul Redshift Serverless géré.

  • RedshiftDatabaseName – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de la ressource de base de données Redshift par défaut dans le calcul géré.

  • StatusMessage – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Message qui fournit des informations plus détaillées sur l'état du groupe de travail géré.

  • CatalogType – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Spécifie un type de catalogue fédéré pour la ressource de catalogue native. Le type actuellement pris en charge estaws:redshift.

FederatedCatalog structure

Catalogue qui pointe vers une entité extérieure au catalogue AWS Glue de données.

Champs
  • Identifier – Chaîne UTF-8, d'une longueur comprise entre 1 et 512 octets, correspondant au Single-line string pattern.

    Identifiant unique pour le catalogue fédéré.

  • ConnectionName – Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    Nom de la connexion à une source de données externe, par exemple un catalogue fédéré par Redshift.

Opérations

CreateCatalog action (Python : create_catalog)

Crée un nouveau catalogue dans le catalogue AWS Glue de données.

Demande
  • NameObligatoire : chaîne UTF-8, d'au moins 1 ou plus de 64 octets, correspondant au. Custom string pattern #25

    Nom du catalogue à créer.

  • CatalogInputObligatoire : un objet CatalogInput.

    CatalogInputObjet qui définit les métadonnées du catalogue.

  • Tags – Tableau de mappage de paires clé-valeur, avec 50 paires au maximum.

    Chaque clé est une chaîne UTF-8, d'une longueur comprise entre 1 et 128 octets.

    Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 256 octets.

    Un tableau cartographique de paires clé-valeur, pas plus de 50 paires. Chaque clé est une chaîne UTF-8, d'une longueur comprise entre 1 et 128 octets. Chaque valeur est une chaîne UTF-8, d'une longueur maximale de 256 octets. Les tags que vous attribuez au catalogue.

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • InvalidInputException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • EntityNotFoundException

  • FederatedResourceAlreadyExistsException

  • FederationSourceException

UpdateCatalog action (Python : update_catalog)

Met à jour les propriétés d'un catalogue existant dans le catalogue de AWS Glue données.

Demande
  • CatalogIdObligatoire : Chaîne d'ID de catalogue, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    L'ID du catalogue.

  • CatalogInputObligatoire : un objet CatalogInput.

    CatalogInputObjet spécifiant les nouvelles propriétés d'un catalogue existant.

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • FederationSourceException

DeleteCatalog action (Python : supprimer_catalogue)

Supprime le catalogue spécifié du catalogue de AWS Glue données.

Une fois cette opération terminée, vous n'avez plus accès aux bases de données, aux tables (ni à toutes les versions de tables et partitions susceptibles d'appartenir aux tables) ni aux fonctions définies par l'utilisateur dans le catalogue supprimé. AWS Glue supprime ces ressources « orphelines » de manière asynchrone en temps opportun, à la discrétion du service.

Pour garantir la suppression immédiate de toutes les ressources associées avant d'appeler l'DeleteCatalogopération, utilisez DeleteTableVersion DeletePartition (ou BatchDeleteTableVersionBatchDeletePartition), DeleteTable (ouBatchDeleteTable), (ou) DeleteUserDefinedFunction et DeleteDatabase supprimez toutes les ressources appartenant au catalogue.

Demande
  • CatalogIdObligatoire : Chaîne d'ID de catalogue, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    L'ID du catalogue.

Réponse
  • Paramètres d'absence de réponse.

Erreurs
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • AccessDeniedException

  • FederationSourceException

GetCatalog action (Python : get_catalog)

Nom du catalogue à récupérer. Tout doit être en minuscules.

Demande
  • CatalogIdObligatoire : Chaîne d'ID de catalogue, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    ID du catalogue parent dans lequel réside le catalogue. Si aucun numéro n'est fourni, le numéro de AWS compte est utilisé par défaut.

Réponse
  • Catalog – Un objet Catalogue.

    Un objet Catalog. Définition du catalogue spécifié dans le catalogue de AWS Glue données.

Erreurs
  • InvalidInputException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • AccessDeniedException

  • EntityNotFoundException

  • FederationSourceException

  • FederationSourceRetryableException

GetCatalogs action (Python : get_catalogs)

Récupère tous les catalogues définis dans un catalogue dans le catalogue de AWS Glue données. Pour un cas d'utilisation d'un catalogue fédéré par Redshift, cette opération renvoie la liste des catalogues mappés aux bases de données Redshift dans le catalogue d'espaces de noms Redshift.

Demande
  • ParentCatalogId – Chaîne d'ID de catalogue, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.

    ID du catalogue parent dans lequel réside le catalogue. Si aucun numéro n'est fourni, le numéro de AWS compte est utilisé par défaut.

  • NextToken – Chaîne UTF-8.

    Jeton de continuation, s'il s'agit d'un appel de continuation.

  • MaxResults – Nombre (entier), compris entre 1 et 1 000.

    Le nombre maximum de catalogues à renvoyer en une seule réponse.

  • Recursive – Booléen.

    Lorsque cette valeur est définie sur true, parcourt le compte et renvoie toutes les ressources du catalogue (y compris les ressources de haut niveau et les ressources secondaires)

Réponse
  • CatalogListObligatoire : Un tableau d'objets Catalogue.

    Tableau d’objets Catalog. Liste des Catalog objets du catalogue parent spécifié.

  • NextToken – Chaîne UTF-8.

    Jeton de continuation pour la pagination de la liste des jetons renvoyés, renvoyé si le segment actuel de la liste n'est pas le dernier.

Erreurs
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • AccessDeniedException

  • EntityNotFoundException

  • FederationSourceException

  • FederationSourceRetryableException