데이터 흐름 단계 편집 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 흐름 단계 편집

Amazon SageMaker Canvas에서는 데이터 흐름의 개별 단계를 편집하여 새 데이터 흐름을 생성할 필요 없이 데이터 세트를 변환할 수 있습니다. 다음 페이지에서는 조인 및 연결 단계와 데이터 소스 단계를 편집하는 방법을 다룹니다.

조인 및 연결 단계 편집

데이터 흐름 내에서 조인 및 연결 단계를 유연하게 편집할 수 있습니다. 데이터 처리 워크플로를 필요에 따라 조정하여 전체 데이터 흐름을 다시 수행할 필요 없이 데이터를 올바르게 결합하고 변환할 수 있습니다.

데이터 흐름에서 조인 또는 연결 단계를 편집하려면 다음을 수행합니다.

  1. 데이터 흐름을 엽니다.

  2. 편집하려는 조인 또는 연결 노드 옆에 있는 더하기 아이콘(+)을 선택합니다.

  3. 컨텍스트 메뉴에서 편집을 선택합니다.

  4. 조인 또는 연결의 세부 정보를 편집할 수 있는 사이드 패널이 열립니다. 조인 유형과 같은 단계 필드를 수정합니다. 데이터 노드를 교체하고 조인하거나 연결할 다른 노드를 선택하려면 노드 옆의 삭제 아이콘을 선택한 다음 데이터 흐름 보기에서 변환에 포함할 새 노드를 선택합니다.

    참고

    편집 프로세스 중에 노드를 교체할 때는 조인 또는 연결 작업 전에 발생하는 단계만 선택할 수 있습니다. 왼쪽 또는 오른쪽 노드를 교체할 수 있지만 한 번에 하나의 노드만 교체할 수 있습니다. 또한 교체할 노드로 소스 노드를 선택할 수 없습니다.

  5. 결합 작업의 결과를 보려면 미리 보기를 선택합니다.

  6. 업데이트를 선택하여 변경 사항을 저장합니다.

이제 데이터 흐름이 업데이트됩니다.

데이터 소스 단계 편집 또는 교체

원본 데이터에 적용된 변환 및 데이터 흐름 단계를 삭제하지 않고 데이터 소스 또는 데이터세트를 변경해야 할 수 있습니다. Data Wrangler 내에서 데이터 흐름 단계를 유지하면서 데이터 소스 구성을 편집하거나 교체할 수 있습니다. 데이터 소스를 편집할 때 샘플링 크기 또는 방법 및 고급 설정과 같은 가져오기 설정을 변경할 수 있습니다. 동일한 스키마를 사용하여 파일을 더 추가하거나 Amazon Athena와 같은 쿼리 기반 데이터 소스의 경우 쿼리를 편집할 수도 있습니다. 데이터 소스를 교체할 때 새 데이터의 스키마가 원본 데이터와 일치하는 한 다른 데이터세트를 선택하거나 다른 데이터 소스에서 데이터를 모두 가져올 수도 있습니다.

데이터 소스 구성을 편집하려면 다음을 수행하세요.

  1. Canvas 애플리케이션에서 Data Wrangler 페이지로 이동합니다.

  2. 데이터 흐름을 선택하여 확인합니다.

  3. 데이터 흐름 단계를 보여주는 데이터 흐름 탭에서 편집하려는 소스 노드를 찾습니다.

  4. 소스 노드 옆에 있는 줄임표 아이콘을 선택합니다.

  5. 컨텍스트 메뉴에서 편집을 선택합니다.

  6. Amazon S3 데이터 소스 및 로컬 업로드의 경우 원본 데이터와 스키마가 동일한 파일을 더 선택하거나 업로드할 수 있습니다. Amazon Athena와 같은 쿼리 기반 데이터 소스의 경우 시각적 쿼리 빌더에서 다른 테이블을 제거 및 선택하거나 SQL 쿼리를 직접 편집할 수 있습니다. 완료했으면 다음을 선택합니다.

  7. 가져오기 설정의 경우 원하는 대로 변경합니다.

  8. 마쳤으면 변경 사항 저장을 선택합니다.

이제 데이터 소스가 업데이트됩니다.

데이터 소스를 교체하려면 다음을 수행합니다.

  1. Canvas 애플리케이션에서 Data Wrangler 페이지로 이동합니다.

  2. 데이터 흐름을 선택하여 확인합니다.

  3. 데이터 흐름 단계를 보여주는 데이터 흐름 탭에서 편집하려는 소스 노드를 찾습니다.

  4. 소스 노드 옆에 있는 줄임표 아이콘을 선택합니다.

  5. 컨텍스트 메뉴에서 교체를 선택합니다.

  6. 데이터 흐름 경험 만들기를 살펴보고 다른 데이터 소스와 데이터를 선택합니다.

  7. 데이터를 선택하고 소스 노드를 업데이트할 준비가 되면 저장을 선택합니다.

이제 데이터 흐름에 소스 노드가 업데이트되었을 것입니다.