DB 클러스터 내보내기 고려 사항
다음 섹션을 바탕으로 DB 클러스터 데이터를 Amazon S3로 내보낼 때의 제한, 파일 명명 규칙, 데이터 변환 및 스토리지에 대해 알아보세요.
제한 사항
DB 클러스터 데이터를 Amazon S3로 내보내는 데는 다음과 같은 제한 사항이 적용됩니다.
-
동일한 DB 클러스터에 대해 여러 내보내기 작업을 동시에 실행할 수 없습니다. 이는 전체 및 부분 내보내기에 모두 적용됩니다.
-
AWS 계정당 최대 5개의 DB 스냅샷 내보내기 작업을 동시에 수행할 수 있습니다.
-
Aurora Serverless v1 DB 클러스터는 S3로의 내보내기를 지원하지 않습니다.
-
Aurora MySQL 및 Aurora PostgreSQL은 프로비저닝된 엔진 모드에서만 S3로의 내보내기를 지원합니다.
-
S3로 내보내는 경우 콜론(:)이 포함된 S3 접두사를 지원하지 않습니다.
-
내보내는 동안 S3 파일 경로의 다음 문자는 밑줄(_)로 변환됩니다.
\ ` " (space)
-
데이터베이스, 스키마 또는 테이블의 이름에 다음 문자가 아닌 문자가 있으면 부분 내보내기가 지원되지 않습니다. 그러나 전체 DB 클러스터를 내보낼 수는 있습니다.
-
라틴 문자(A–Z)
-
숫자(0–9)
-
달러 기호($)
-
밑줄(_)
-
-
공백( )과 특정 문자는 데이터베이스 테이블 열 이름에서 지원되지 않습니다. 열 이름에 다음 문자가 포함되어 있는 테이블은 내보내기를 수행하는 동안 건너뛰기가 됩니다.
, ; { } ( ) \n \t = (space)
-
이름에 슬래시(/)가 포함되어 있는 테이블은 내보내기를 수행하는 동안 생략됩니다.
-
Aurora PostgreSQL 임시 테이블과 로깅되지 않는 테이블은 내보내기 중에 건너뛰게 됩니다.
-
데이터에 500MB에 근접하거나 이보다 큰 객체(예: BLOB 또는 CLOB)가 포함되어 있으면 내보내기가 실패합니다.
-
테이블에 2GB에 가깝거나 그보다 큰 행이 있으면 내보내기 중 테이블을 건너뜁니다.
-
부분 내보내기의 경우
ExportOnly
목록의 최대 크기는 200KB입니다. -
각 내보내기 작업에 고유한 이름을 사용하는 것이 좋습니다. 고유한 작업 이름을 사용하지 않으면 다음 오류 메시지가 표시될 수 있습니다.
ExportTaskAlreadyExistsFault: StartExportTask 작업을 호출하는 동안 오류(ExportTaskAlreadyExists)가 발생했습니다. ID가
xxxxx
인 내보내기 작업이 이미 존재합니다. -
일부 테이블은 건너뛸 수 있으므로 내보낸 후 데이터의 행 및 테이블 수를 확인하는 것이 좋습니다.
파일 명명 규칙
특정 테이블에 대해 내보낸 데이터는
형식으로 저장됩니다. 여기서 기본 접두사는 다음과 같습니다.base_prefix
/files
export_identifier
/database_name
/schema_name
.table_name
/
예:
export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/
출력 파일은 다음과 같은 명명 규칙을 사용합니다. 여기서 partition_index
는 영숫자입니다.
partition_index
/part-00000-random_uuid
.format-based_extension
예:
1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet
파일 명명 규칙은 변경될 수 있습니다. 따라서 대상 테이블을 읽을 때 테이블의 기본 접두사 내에 있는 모든 내용을 읽는 것이 좋습니다.
데이터 변환 및 저장 형식
DB 클러스터를 Amazon S3 버킷으로 내보낼 때 Amazon Aurora는 데이터를 Parquet 형식으로 변환하고 내보내며 저장합니다. 자세한 내용은 Amazon S3 버킷으로 내보내기를 할 때 데이터 변환 단원을 참조하십시오.