AWS Glue Studio은(는) 시각적 작업을 파라미터화할 수 있습니다. 프로덕션 및 개발 환경에서는 카탈로그 테이블 이름이 다를 수 있으므로 작업이 실행될 때 실행할 데이터베이스 및 테이블의 런타임 파라미터를 정의하고 선택할 수 있습니다.
작업 파라미터화를 사용하면 소스 및 대상을 파라미터화하고, AWS Glue 데이터 카탈로그 노드를 사용할 때 해당 파라미터를 작업에 저장할 수 있습니다. 소스 및 대상을 파라미터로 지정하면 특히 여러 환경에서 동일한 작업을 사용할 때 작업을 재사용할 수 있습니다. 소스 및 대상을 관리하는 데 드는 시간과 노력을 절약함으로써, 이는 배포 환경 전반에서 코드를 승격할 때 유용합니다. 또한 지정한 사용자 지정 파라미터는 AWS Glue 작업의 특정 실행에 대한 기본 인수를 재정의합니다.
소스 및 대상 파라미터 추가
AWS Glue 데이터 카탈로그 노드를 소스 또는 대상으로 사용하는지 관계없이 Job details(작업 세부 정보) 탭의 Advanced properties(고급 속성) 섹션에서 런타임 파라미터를 정의할 수 있습니다.
-
소스 노드 또는 대상 노드로 AWS Glue 데이터 카탈로그를 선택합니다.
-
[작업 세부 정보(Job details)] 탭을 선택합니다.
-
Advanced properties(고급 속성)을 선택합니다.
-
작업 파라미터 섹션에서 키 값을 입력합니다. 예를 들어,
--db.source
은(는) 데이터베이스 원본에 대한 파라미터가 될 것입니다. 키 이름 뒤에 'dash dash'가 오면 아무 이름이나 입력할 수 있습니다. -
값을 입력합니다. 예를 들어,
databasename
은(는) 파라미터화되는 데이터베이스의 값이 될 것입니다. -
파라미터를 더 추가하고자 하는 경우 Add new parameter(새 파라미터 추가)를 선택합니다. 최대 50개의 파리미터를 추가할 수 있습니다. 키 값 쌍이 정의되면 AWS Glue 데이터 카탈로그 노드에서 파라미터를 사용할 수 있습니다.
런타임 파라미터 선택
참고
데이터베이스 및 테이블에 대한 런타임 파라미터를 선택하는 프로세스는 AWS Glue 데이터 카탈로그 노드가 소스 또는 대상인지와 상관없이 동일합니다.
-
소스 노드 또는 대상 노드로 AWS Glue 데이터 카탈로그를 선택합니다.
-
Database(데이터베이스)의 Data source properties - Data Catalog(데이터 소스 속성 - 데이터 카탈로그) 탭에서 Use runtime parameters(런타임 파라미터 사용)을 선택합니다.
-
드롭다운 메뉴에서 파라미터를 선택합니다. 예를 들어, 소스 데이터베이스에 대해 정의한 파라미터를 선택하면 Apply(적용)을 선택하면 데이터베이스가 자동으로 데이터베이스 드롭다운 메뉴에 채워집니다.
-
테이블(Table) 섹션에서 이미 소스 테이블로 정의한 파라미터를 선택합니다. Apply(적용)을 선택하면 테이블이 사용할 테이블로 자동으로 채워집니다.
-
작업을 저장하고 실행하면 AWS Glue Studio이(가) 작업 실행 중에 선택한 파라미터를 참조합니다.