데이터 흐름 UI 작동 방식 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 흐름 UI 작동 방식

데이터 흐름을 탐색하는 데 도움이 되도록 Data Wrangler의 상단 탐색 창에는 다음과 같은 탭이 있습니다.

  • 데이터 흐름 - 이 탭에서는 변환을 추가 또는 제거하고 데이터를 내보낼 수 있는 데이터 흐름 단계를 시각적으로 볼 수 있습니다.

  • 데이터 - 이 탭에서는 변환 결과를 확인할 수 있도록 데이터를 미리 볼 수 있습니다. 데이터 흐름 단계의 순서 목록을 보고 단계를 편집하거나 재정렬할 수도 있습니다.

    참고

    이 탭에서는 Amazon S3 데이터 소스에 대한 데이터 시각화(예: 열당 값 배포)만 미리 볼 수 있습니다. Amazon Athena 와 같은 다른 데이터 소스에 대한 시각화는 지원되지 않습니다.

  • 분석 - 이 탭에서는 생성한 각 분석에 대해 별도의 하위 탭을 볼 수 있습니다. 예를 들어 히스토그램과 데이터 품질 및 인사이트(DQI) 보고서를 생성하는 경우 Canvas는 각각에 대한 탭을 생성합니다.

데이터 세트를 가져오면 원본 데이터 세트가 데이터 흐름에 표시되고 소스 라는 이름이 지정됩니다. SageMaker 캔버스는 데이터 세트의 각 열 유형을 자동으로 추론하고 데이터 유형 이라는 새 데이터프레임을 생성합니다. 이 프레임을 선택하여 유추된 데이터 유형을 업데이트할 수 있습니다.

데이터 흐름에서 사용하는 데이터 세트, 변환 및 분석은 단계로 표시됩니다. 변환 단계를 추가할 때마다 새 데이터 프레임이 생성됩니다. 여러 변환 단계(조인 또는 연결 제외)가 동일한 데이터 세트에 추가되면 해당 단계가 누적됩니다.

데이터 결합 옵션에서 인 및 연결은 새 조인 또는 연결 데이터 세트가 포함된 독립 실행형 단계를 생성합니다.