데이터 유효성 검사 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 유효성 검사

모델을 빌드하기 전에 SageMaker Canvas는 데이터 세트에 빌드 실패를 일으킬 수 있는 문제가 있는지 확인합니다. SageMaker Canvas가 문제를 발견하면 모델을 빌드하기 전에 빌드 페이지에서 경고를 보냅니다.

데이터 검증을 선택하여 데이터 세트의 문제 목록을 볼 수 있습니다. 그런 다음 SageMaker Canvas Data Wrangler 데이터 준비 기능 또는 자체 도구를 사용하여 빌드를 시작하기 전에 데이터 세트를 수정할 수 있습니다. 데이터 세트 관련 문제를 해결하지 않으면 빌드가 실패합니다.

문제를 해결하기 위해 데이터 세트를 변경하는 경우 빌드를 시도하기 전에 데이터 세트를 다시 검증할 수 있습니다. 빌드하기 전에 데이터 세트를 다시 검증하는 것이 좋습니다.

다음 표에는 SageMaker Canvas가 데이터 세트에서 확인하는 문제와 해결 방법이 나와 있습니다.

문제 해결 방법

데이터에 대한 잘못된 모델 유형

다른 모델 유형을 시도하거나 다른 데이터 세트를 사용하세요.

타겟 열에 값이 누락됨

누락된 값을 바꾸거나, 누락된 값이 있는 행을 삭제하거나, 다른 데이터 세트를 사용하세요.

대상 열에 고유 레이블이 너무 많음

대상 열에 올바른 열을 사용했는지 또는 다른 데이터 세트를 사용하세요.

대상 열에 숫자가 아닌 값이 너무 많음

다른 대상 열을 선택하거나, 다른 모델 유형을 선택하거나, 다른 데이터 세트를 사용하세요.

하나 이상의 열 이름에 이중 밑줄이 있음

이중 밑줄을 제거하도록 열 이름을 바꾸고 다시 시도하세요.

데이터 세트에 완전한 행이 없음

누락된 값을 바꾸거나 다른 데이터 세트를 사용하세요.

데이터의 행 수에 비해 고유 레이블이 너무 많음

올바른 대상 열을 사용하고 있는지 확인하거나, 데이터 세트의 행 수를 늘리거나, 유사한 레이블을 통합하거나, 다른 데이터 세트를 사용하세요.