Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Configuración requerida cuando el rastreador y la ubicación de Amazon S3 registrada residen en cuentas diferentes (rastreo entre cuentas)

Modo de enfoque
Configuración requerida cuando el rastreador y la ubicación de Amazon S3 registrada residen en cuentas diferentes (rastreo entre cuentas) - AWS Glue

Para permitir que el rastreador acceda a un almacén de datos de una cuenta diferente con credenciales de Lake Formation, primero debe registrar la ubicación de los datos de Amazon S3 en Lake Formation. Después, debe conceder permisos de ubicación de datos a la cuenta del rastreador siguiendo estos pasos.

Puede completar los siguientes pasos mediante la AWS Management Console o la AWS CLI.

AWS Management Console
  1. En la cuenta en la que esté registrada la ubicación de Amazon S3 (cuenta B):

    1. Registre una ruta de Amazon S3 en Lake Formation. Para obtener más información, consulte Registro de una ubicación de Amazon S3.

    2. Conceda permisos de Ubicación de datos a la cuenta (cuenta A) en la que se vaya a ejecutar el rastreador. Para obtener más información, consulte Concesión de permisos de ubicación de datos.

    3. Cree una base de datos vacía en Lake Formation con la ubicación subyacente como ubicación de Amazon S3 de destino. Para obtener más información, consulte Creación de una base de datos.

    4. Conceda a la cuenta A (la cuenta en la que se vaya a ejecutar el rastreador) acceso a la base de datos que ha creado en el paso anterior. Para obtener más información, consulte Concesión de permisos de base de datos.

  2. En la cuenta donde se ha creado y se va a ejecutar el rastreador (cuenta A):

    1. Mediante la consola de AWS RAM, acepte la base de datos que se haya compartido desde la cuenta externa (cuenta B). Para obtener más información, consulte Aceptación de una invitación para compartir un recurso de AWS Resource Access Manager.

    2. Cree un rol de IAM para el rastreador. Agregue la política lakeformation:GetDataAccess al rol.

    3. En la consola de Lake Formation (https://console.aws.amazon.com/lakeformation/), conceda permisos de Ubicación de datos sobre la ubicación de Amazon S3 de destino al rol de IAM utilizado para la ejecución del rastreador, de modo que el rastreador pueda leer los datos del destino en Lake Formation. Para obtener más información, consulte Concesión de permisos de ubicación de datos.

    4. Cree un enlace de recurso en la base de datos compartida. Para obtener más información, consulte Creación de un enlace de recurso.

    5. Otorgue al rol del rastreador permisos de acceso (Create) en la base de datos compartida y (Describe) en el enlace de recurso. El enlace de recurso se especifica en la salida del rastreador.

    6. En la consola de AWS Glue (https://console.aws.amazon.com/glue/), al configurar el rastreador, seleccione la opción Use Lake Formation credentials for crawling Amazon S3 data source (Utilizar credenciales de Lake Formation para rastrear un origen de datos de Amazon S3).

      Para el rastreo entre cuentas, especifique el ID de la Cuenta de AWS donde esté registrada la ubicación de Amazon S3 de destino en Lake Formation. Para el rastreo en cuenta, el campo accountId es opcional.

      IAM role selection and Lake Formation configuration options for Rastreador de AWS Glue security settings.
AWS CLI
aws glue --profile demo create-crawler --debug --cli-input-json '{ "Name": "prod-test-crawler", "Role": "arn:aws:iam::111122223333:role/service-role/AWSGlueServiceRole-prod-test-run-role", "DatabaseName": "prod-run-db", "Description": "", "Targets": { "S3Targets":[ { "Path": "s3://crawl-testbucket" } ] }, "SchemaChangePolicy": { "UpdateBehavior": "LOG", "DeleteBehavior": "LOG" }, "RecrawlPolicy": { "RecrawlBehavior": "CRAWL_EVERYTHING" }, "LineageConfiguration": { "CrawlerLineageSettings": "DISABLE" }, "LakeFormationConfiguration": { "UseLakeFormationCredentials": true, "AccountId": "111111111111" }, "Configuration": { "Version": 1.0, "CrawlerOutput": { "Partitions": { "AddOrUpdateBehavior": "InheritFromTable" }, "Tables": {"AddOrUpdateBehavior": "MergeNewColumns" } }, "Grouping": { "TableGroupingPolicy": "CombineCompatibleSchemas" } }, "CrawlerSecurityConfiguration": "", "Tags": { "KeyName": "" } }'
  1. En la cuenta en la que esté registrada la ubicación de Amazon S3 (cuenta B):

    1. Registre una ruta de Amazon S3 en Lake Formation. Para obtener más información, consulte Registro de una ubicación de Amazon S3.

    2. Conceda permisos de Ubicación de datos a la cuenta (cuenta A) en la que se vaya a ejecutar el rastreador. Para obtener más información, consulte Concesión de permisos de ubicación de datos.

    3. Cree una base de datos vacía en Lake Formation con la ubicación subyacente como ubicación de Amazon S3 de destino. Para obtener más información, consulte Creación de una base de datos.

    4. Conceda a la cuenta A (la cuenta en la que se vaya a ejecutar el rastreador) acceso a la base de datos que ha creado en el paso anterior. Para obtener más información, consulte Concesión de permisos de base de datos.

  2. En la cuenta donde se ha creado y se va a ejecutar el rastreador (cuenta A):

    1. Mediante la consola de AWS RAM, acepte la base de datos que se haya compartido desde la cuenta externa (cuenta B). Para obtener más información, consulte Aceptación de una invitación para compartir un recurso de AWS Resource Access Manager.

    2. Cree un rol de IAM para el rastreador. Agregue la política lakeformation:GetDataAccess al rol.

    3. En la consola de Lake Formation (https://console.aws.amazon.com/lakeformation/), conceda permisos de Ubicación de datos sobre la ubicación de Amazon S3 de destino al rol de IAM utilizado para la ejecución del rastreador, de modo que el rastreador pueda leer los datos del destino en Lake Formation. Para obtener más información, consulte Concesión de permisos de ubicación de datos.

    4. Cree un enlace de recurso en la base de datos compartida. Para obtener más información, consulte Creación de un enlace de recurso.

    5. Otorgue al rol del rastreador permisos de acceso (Create) en la base de datos compartida y (Describe) en el enlace de recurso. El enlace de recurso se especifica en la salida del rastreador.

    6. En la consola de AWS Glue (https://console.aws.amazon.com/glue/), al configurar el rastreador, seleccione la opción Use Lake Formation credentials for crawling Amazon S3 data source (Utilizar credenciales de Lake Formation para rastrear un origen de datos de Amazon S3).

      Para el rastreo entre cuentas, especifique el ID de la Cuenta de AWS donde esté registrada la ubicación de Amazon S3 de destino en Lake Formation. Para el rastreo en cuenta, el campo accountId es opcional.

      IAM role selection and Lake Formation configuration options for Rastreador de AWS Glue security settings.
nota
  • Un rastreador que utilice credenciales de Lake Formation solo puede rastrear destinos de Amazon S3 y el Catálogo de datos.

  • En el caso de destinos que utilicen el suministro de credenciales de Lake Formation, las ubicaciones de Amazon S3 subyacentes deben pertenecer al mismo bucket. Por ejemplo, los clientes pueden utilizar varios destinos (s3://bucket1/carpeta1, s3://bucket1/carpeta2) siempre que todas las ubicaciones de destino estén en el mismo bucket (bucket1). No se permite especificar buckets diferentes (s3://bucket1/carpeta1, s3://bucket2/carpeta2).

  • Actualmente, para los rastreadores de destinos del Catálogo de datos, solo se permite un único destino de catálogo con una sola tabla de catálogo.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.