기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 흐름 단계 편집
Amazon SageMaker Canvas에서는 데이터 흐름의 개별 단계를 편집하여 새 데이터 흐름을 생성할 필요 없이 데이터 세트를 변환할 수 있습니다. 다음 페이지에서는 조인 및 연결 단계와 데이터 소스 단계를 편집하는 방법을 다룹니다.
조인 및 연결 단계 편집
데이터 흐름 내에서 조인 및 연결 단계를 유연하게 편집할 수 있습니다. 데이터 처리 워크플로를 필요에 따라 조정하여 전체 데이터 흐름을 다시 수행할 필요 없이 데이터를 올바르게 결합하고 변환할 수 있습니다.
데이터 흐름에서 조인 또는 연결 단계를 편집하려면 다음을 수행합니다.
-
데이터 흐름을 엽니다.
-
편집하려는 조인 또는 연결 노드 옆에 있는 더하기 아이콘(+)을 선택합니다.
-
컨텍스트 메뉴에서 편집을 선택합니다.
-
조인 또는 연결의 세부 정보를 편집할 수 있는 사이드 패널이 열립니다. 조인 유형과 같은 단계 필드를 수정합니다. 데이터 노드를 교체하고 조인하거나 연결할 다른 노드를 선택하려면 노드 옆의 삭제 아이콘을 선택한 다음 데이터 흐름 보기에서 변환에 포함할 새 노드를 선택합니다.
참고
편집 프로세스 중에 노드를 교체할 때는 조인 또는 연결 작업 전에 발생하는 단계만 선택할 수 있습니다. 왼쪽 또는 오른쪽 노드를 교체할 수 있지만 한 번에 하나의 노드만 교체할 수 있습니다. 또한 교체할 노드로 소스 노드를 선택할 수 없습니다.
-
결합 작업의 결과를 보려면 미리 보기를 선택합니다.
-
업데이트를 선택하여 변경 사항을 저장합니다.
이제 데이터 흐름이 업데이트됩니다.
데이터 소스 단계 편집 또는 교체
원본 데이터에 적용된 변환 및 데이터 흐름 단계를 삭제하지 않고 데이터 소스 또는 데이터세트를 변경해야 할 수 있습니다. Data Wrangler 내에서 데이터 흐름 단계를 유지하면서 데이터 소스 구성을 편집하거나 교체할 수 있습니다. 데이터 소스를 편집할 때 샘플링 크기 또는 방법 및 고급 설정과 같은 가져오기 설정을 변경할 수 있습니다. 동일한 스키마를 사용하여 파일을 더 추가하거나 Amazon Athena와 같은 쿼리 기반 데이터 소스의 경우 쿼리를 편집할 수도 있습니다. 데이터 소스를 교체할 때 새 데이터의 스키마가 원본 데이터와 일치하는 한 다른 데이터세트를 선택하거나 다른 데이터 소스에서 데이터를 모두 가져올 수도 있습니다.
데이터 소스 구성을 편집하려면 다음을 수행하세요.
-
Canvas 애플리케이션에서 Data Wrangler 페이지로 이동합니다.
-
데이터 흐름을 선택하여 확인합니다.
-
데이터 흐름 단계를 보여주는 데이터 흐름 탭에서 편집하려는 소스 노드를 찾습니다.
-
소스 노드 옆에 있는 줄임표 아이콘을 선택합니다.
-
컨텍스트 메뉴에서 편집을 선택합니다.
-
Amazon S3 데이터 소스 및 로컬 업로드의 경우 원본 데이터와 스키마가 동일한 파일을 더 선택하거나 업로드할 수 있습니다. Amazon Athena와 같은 쿼리 기반 데이터 소스의 경우 시각적 쿼리 빌더에서 다른 테이블을 제거 및 선택하거나 SQL 쿼리를 직접 편집할 수 있습니다. 완료했으면 다음을 선택합니다.
-
가져오기 설정의 경우 원하는 대로 변경합니다.
-
마쳤으면 변경 사항 저장을 선택합니다.
이제 데이터 소스가 업데이트됩니다.
데이터 소스를 교체하려면 다음을 수행합니다.
-
Canvas 애플리케이션에서 Data Wrangler 페이지로 이동합니다.
-
데이터 흐름을 선택하여 확인합니다.
-
데이터 흐름 단계를 보여주는 데이터 흐름 탭에서 편집하려는 소스 노드를 찾습니다.
-
소스 노드 옆에 있는 줄임표 아이콘을 선택합니다.
-
컨텍스트 메뉴에서 교체를 선택합니다.
-
데이터 흐름 경험 만들기를 살펴보고 다른 데이터 소스와 데이터를 선택합니다.
-
데이터를 선택하고 소스 노드를 업데이트할 준비가 되면 저장을 선택합니다.
이제 데이터 흐름에 소스 노드가 업데이트되었을 것입니다.