기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 형식 호환성 안내서
이 가이드에서는 SageMaker Clarify 처리 작업과 호환되는 데이터 형식 유형을 설명합니다. 지원되는 데이터 형식 유형에는 파일 확장명, 데이터 구조, 그리고 테이블 형식, 이미지, 시계열 데이터세트와 관련한 구체적인 요구 사항 또는 제한 사항이 포함됩니다. 이 안내서에서는 데이터세트가 이러한 요구 사항을 준수하는지 확인하는 방법도 보여줍니다.
높은 수준에서 SageMaker Clarify 처리 작업은 입력-프로세스-출력 모델을 따라 편향 지표와 특성 속성을 계산합니다. 세부 정보는 다음 예시를 참조하세요.
SageMaker Clarify 처리 작업에 대한 입력은 다음으로 구성됩니다.
-
분석할 데이터세트
-
해당 분석 구성 분석을 구성하는 방법에 대한 자세한 내용은 분석 구성 파일 섹션을 참조하세요.
처리 단계에서 SageMaker Clarify는 편향 지표와 특성 속성을 계산합니다. SageMaker Clarify 처리 작업은 백엔드에서 다음 단계를 완료합니다.
-
SageMaker Clarify 처리 작업은 분석 구성을 구문 분석하고 데이터 세트를 로드합니다.
-
작업이 훈련 후 편향 지표와 특징 속성을 계산할 수 있으려면 해당 모델이 수행한 예측이 필요합니다. SageMaker Clarify 처리 작업은 데이터를 직렬화하여 SageMaker AI 실시간 추론 엔드포인트에 배포된 모델에 요청으로 전송합니다. 그런 다음 SageMaker Clarify 처리 작업은 응답에서 예측을 추출합니다.
-
SageMaker Clarify 처리 작업은 편향 및 설명 가능성 분석을 수행한 다음 결과를 출력합니다.
자세한 정보는 처리 작업 SageMaker 명확화 방법을 참조하십시오.
데이터 형식을 지정하는 데 사용하는 매개변수는 처리 흐름 상에서 데이터가 사용되는 위치에 따라 다음과 같이 달라지게 됩니다.
-
입력 데이터 세트의 경우
dataset_type
파라미터를 사용하여 형식 또는 MIME 유형을 지정합니다. -
엔드포인트에 대한 요청인 경우,
content_type
매개변수를 사용하여 해당 형식을 지정합니다. -
엔드포인트에서의 응답인 경우,
accept_type
매개변수를 사용하여 해당 형식을 지정합니다.
입력 데이터세트, 요청, 그리고 엔드포인트와 주고 받는 응답의 형식은 반드시 동일하지 않아도 됩니다. 예를 들어 다음 조건을 고려하여 CSV 요청 페이로드 및 JSON 라인 응답 페이로드와 함께 Parquet 데이터 세트를 사용할 수 있습니다.
-
분석이 올바르게 구성되어 있음
-
모델이 해당 요청 및 응답 형식을 지원함
참고
content_type
또는 accept_type
가 제공되지 않은 경우 SageMaker Clarify 컨테이너는 content_type
및를 추론합니다accept_type
.