기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 유효성 검사
모델을 빌드하기 전에 SageMaker Canvas는 데이터 세트에 빌드 실패를 일으킬 수 있는 문제가 있는지 확인합니다. SageMaker Canvas가 문제를 발견하면 모델을 빌드하기 전에 빌드 페이지에서 경고를 보냅니다.
데이터 검증을 선택하여 데이터 세트의 문제 목록을 볼 수 있습니다. 그런 다음 SageMaker Canvas Data Wrangler 데이터 준비 기능 또는 자체 도구를 사용하여 빌드를 시작하기 전에 데이터 세트를 수정할 수 있습니다. 데이터 세트 관련 문제를 해결하지 않으면 빌드가 실패합니다.
문제를 해결하기 위해 데이터 세트를 변경하는 경우 빌드를 시도하기 전에 데이터 세트를 다시 검증할 수 있습니다. 빌드하기 전에 데이터 세트를 다시 검증하는 것이 좋습니다.
다음 표에는 SageMaker Canvas가 데이터 세트에서 확인하는 문제와 해결 방법이 나와 있습니다.
문제 | 해결 방법 |
---|---|
데이터에 대한 잘못된 모델 유형 |
다른 모델 유형을 시도하거나 다른 데이터 세트를 사용하세요. |
타겟 열에 값이 누락됨 |
누락된 값을 바꾸거나, 누락된 값이 있는 행을 삭제하거나, 다른 데이터 세트를 사용하세요. |
대상 열에 고유 레이블이 너무 많음 |
대상 열에 올바른 열을 사용했는지 또는 다른 데이터 세트를 사용하세요. |
대상 열에 숫자가 아닌 값이 너무 많음 |
다른 대상 열을 선택하거나, 다른 모델 유형을 선택하거나, 다른 데이터 세트를 사용하세요. |
하나 이상의 열 이름에 이중 밑줄이 있음 |
이중 밑줄을 제거하도록 열 이름을 바꾸고 다시 시도하세요. |
데이터 세트에 완전한 행이 없음 |
누락된 값을 바꾸거나 다른 데이터 세트를 사용하세요. |
데이터의 행 수에 비해 고유 레이블이 너무 많음 |
올바른 대상 열을 사용하고 있는지 확인하거나, 데이터 세트의 행 수를 늘리거나, 유사한 레이블을 통합하거나, 다른 데이터 세트를 사용하세요. |