AWS CloudTrail을 사용하여 AWS Lake Formation API 호출 로깅
AWS Lake Formation은 사용자, 역할 또는 Lake Formation의 AWS 서비스가 수행한 작업에 대한 레코드를 제공하는 서비스인 AWS CloudTrail과 통합됩니다. CloudTrail은 모든 Lake Formation API 호출을 이벤트로 캡처합니다. 캡처된 호출에는 Lake Formation 콘솔의 호출, AWS Command Line Interface, Lake Formation API 작업에 대한 코드 호출이 포함됩니다. 추적을 생성하면 Lake Formation 이벤트를 포함한 CloudTrail 이벤트를 지속적으로 Amazon S3 버킷에 배포할 수 있습니다. 추적을 구성하지 않은 경우에도 CloudTrail 콘솔의 이벤트 기록에서 최신 이벤트를 볼 수 있습니다. CloudTrail에서 수집한 정보를 사용하여 Lake Formation에 수행된 요청, 요청이 수행된 IP 주소, 요청을 수행한 사람, 요청이 수행된 시간 및 추가 세부 정보를 확인할 수 있습니다.
CloudTrail에 대한 자세한 내용은 AWS CloudTrail 사용 설명서를 참조하십시오.
CloudTrail의 Lake Formation 정보
새 AWS 계정을 만들면 CloudTrail이 기본적으로 활성화됩니다. Lake Formation에서 활동이 수행되면 해당 활동은 이벤트 기록에서 다른 AWS 서비스 이벤트와 함께 CloudTrail 이벤트에 기록됩니다. 이벤트는 모든 소스로부터의 단일 요청을 나타내며 요청 작업, 작업 날짜와 시간, 요청 파라미터에 관한 정보가 들어 있습니다. 또한, 모든 이벤트 및 로그 항목에는 요청을 생성한 사용자에 대한 정보가 들어 있습니다. 보안 인증 정보를 이용하면 다음을 쉽게 판단할 수 있습니다.
-
요청을 루트로 했는지 아니면(AWS Identity and Access ManagementIAM) 사용자 보안 인증으로 했는지.
-
역할 또는 페더레이션 사용자에 대한 임시 보안 보안 인증을 사용하여 요청이 생성되었는지 여부.
-
다른 AWS 서비스에서 요청했는지.
자세한 내용은 CloudTrail userIdentity 요소를 참조하십시오.
AWS 계정에 대한 최신 이벤트를 확인, 검색 및 다운로드할 수 있습니다. 자세한 내용은 CloudTrail 이벤트 기록을 사용하여 이벤트 보기를 참조하십시오.
Lake Formation에 대한 이벤트를 포함하여 AWS 계정의 이벤트의 지속적인 레코드의 경우, 추적을 생성합니다. CloudTrail은 추적을 사용하여 Amazon S3 버킷으로 로그 파일을 전송할 수 있습니다. 콘솔에서 추적을 생성하면 기본적으로 모든 AWS 리전에 추적이 적용됩니다. 추적은 AWS 파티션에 있는 모든 리전의 이벤트를 로깅하고 지정된 S3 버킷으로 로그 파일을 전송합니다. 또는 CloudTrail 로그에서 수집된 이벤트 데이터를 추가 분석 및 처리하도록 Amazon Athena 등의 다른 AWS 서비스를 구성할 수 있습니다. CloudTrail은 Amazon CloudWatch Logs와 CloudWatch Events에도 로그 파일을 전송할 수 있습니다.
자세한 내용은 다음 자료를 참조하십시오.
Lake Formation 이벤트 이해하기
모든 Lake Formation API 작업은 CloudTrail에 의해 기록되며 AWS Lake Formation 개발자 안내서에 문서화되어 있습니다. 예를 들어 PutDataLakeSettings
, GrantPermissions
및 RevokePermissions
작업을 직접적으로 호출하면 CloudTrail 로그 파일에 항목이 생성됩니다.
다음 예제는 GrantPermissions
작업에 대한 CloudTrail 이벤트를 표시합니다. 이 항목에는 권한을 부여한 사용자(datalake_admin
), 권한이 부여된 보안 주체(datalake_user1
), 부여된 권한(CREATE_TABLE
)이 포함됩니다. 또한 이 항목에는 대상 데이터베이스가 resource
인수에 지정되지 않아 권한 부여가 실패했음을 알 수 있습니다.
{ "eventVersion": "1.08", "userIdentity": { "type": "IAMUser", "principalId": "AIDAZKE67KM3P775X74U2", "arn": "arn:aws:iam::111122223333:user/datalake_admin", "accountId": "111122223333", "accessKeyId": "...", "userName": "datalake_admin" }, "eventTime": "2021-02-06T00:43:21Z", "eventSource": "lakeformation.amazonaws.com", "eventName": "GrantPermissions", "awsRegion": "us-east-1", "sourceIPAddress": "72.21.198.65", "userAgent": "aws-cli/1.19.0 Python/3.6.12 Linux/4.9.230-0.1.ac.223.84.332.metal1.x86_64 botocore/1.20.0", "errorCode": "InvalidInputException", "errorMessage": "Resource must have one of the have either the catalog, table or database field populated.", "requestParameters": { "principal": { "dataLakePrincipalIdentifier": "arn:aws:iam::111122223333:user/datalake_user1" }, "resource": {}, "permissions": [ "CREATE_TABLE" ] }, "responseElements": null, "requestID": "b85e863f-e75d-4fc0-9ff0-97f943f706e7", "eventID": "8d2ccef0-55f3-42d3-9ede-3a6faedaa5c1", "readOnly": false, "eventType": "AwsApiCall", "managementEvent": true, "eventCategory": "Management", "recipientAccountId": "111122223333" }
다음 예제는 GetDataAccess
작업에 대한 CloudTrail 로그 항목을 표시합니다. 보안 주체는 이 API를 직접 호출하지 않습니다. 그보다는 Lake Formation에 등록된 데이터 레이크 위치의 데이터에 액세스하기 위해 보안 주체 또는 통합 AWS 서비스가 임시 보안 인증 정보를 요청할 때마다 GetDataAccess
가 기록됩니다.
{ "eventVersion": "1.05", "userIdentity": { "type": "AWSAccount", "principalId": "AROAQGFTBBBGOBWV2EMZA:GlueJobRunnerSession", "accountId": "111122223333" }, "eventSource": "lakeformation.amazonaws.com", "eventName": "GetDataAccess", ... ... "additionalEventData": { "requesterService": "GLUE_JOB", "lakeFormationPrincipal": "arn:aws:iam::111122223333:role/ETL-Glue-Role", "lakeFormationRoleSessionName": "AWSLF-00-GL-111122223333-G13T0Rmng2" }, ... }