무작위 샘플 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

무작위 샘플

SageMaker Canvas는 무작위 샘플링 방법을 사용하여 데이터 세트를 샘플링합니다. 무작위 샘플 방법을 사용하면 각 행이 샘플로 선택될 확률이 동일하다는 것을 의미합니다. 미리 보기에서 열을 선택하여 평균, 최빈값 등 무작위 샘플에 대한 요약 통계를 얻을 수 있습니다.

기본적으로 SageMaker Canvas는 20,000개 이상의 행이 있는 데이터 세트에 대해 데이터 세트의 20,000개 행의 무작위 샘플 크기를 사용합니다. 행 수가 20,000개보다 작은 데이터 세트의 경우 기본 샘플 크기는 데이터 세트의 행 수입니다. SageMaker Canvas 애플리케이션의 빌드 탭에서 무작위 샘플을 선택하여 샘플 크기를 늘리거나 줄일 수 있습니다. 슬라이더를 사용하여 원하는 샘플 크기를 선택한 다음 업데이트를 선택하여 샘플 크기를 변경할 수 있습니다. 데이터 세트에 대해 선택할 수 있는 최대 샘플 크기는 40,000개 행이고, 최소 샘플 크기는 500개 행입니다. 큰 샘플 크기를 선택하면 데이터 세트 미리 보기 및 요약 통계를 다시 로드하는 데 몇 분 정도 걸릴 수 있습니다.

빌드 페이지에는 데이터 세트의 100개 행에 대한 미리 보기가 표시됩니다. 샘플 크기가 데이터 세트와 같은 경우 미리 보기에는 데이터 세트의 처음 100개 행이 사용됩니다. 그렇지 않으면 미리보기에는 무작위 샘플의 처음 100개 행이 사용됩니다.