기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 형식 호환성 안내서
이 가이드에서는 Clarify 처리 작업과 SageMaker 호환되는 데이터 형식 유형에 대해 설명합니다. 지원되는 데이터 형식 유형에는 파일 확장명, 데이터 구조, 표 형식, 이미지, 시계열 데이터셋에 대한 특정 요구 사항 또는 제한 사항이 포함됩니다. 이 안내서에서는 데이터 세트가 이러한 요구 사항을 준수하는지 확인하는 방법도 보여줍니다.
상위 수준에서 Clarify 프로세싱 작업은 입력-프로세스-출력 모델을 따라 편향 지표와 특징 속성을 계산합니다. SageMaker 세부 정보는 다음 예시를 참조하세요.
Clarify 처리 작업에 대한 입력은 다음과 같이 SageMaker 구성됩니다.
-
분석할 데이터 세트
-
해당 분석 구성 분석 구성 방법에 대한 자세한 내용은 을 참조하십시오분석 구성.
처리 단계에서 SageMaker Clarify는 편향 지표와 기능 속성을 계산합니다. SageMaker Clarify 프로세싱 작업은 백엔드에서 다음 단계를 완료합니다.
-
SageMaker Clarify 프로세싱 작업은 분석 구성을 파싱하고 데이터세트를 로드합니다.
-
작업이 훈련 후 편향 지표와 특징 속성을 계산할 수 있으려면 해당 모델이 수행한 예측이 필요합니다. SageMaker Clarify 프로세싱 작업은 데이터를 직렬화하여 실시간 추론 엔드포인트에 배포된 모델에 요청으로 전송합니다. SageMaker 그런 다음 Clarify SageMaker 프로세싱 작업은 응답에서 예측을 추출합니다.
-
SageMaker Clarify 처리 작업은 편향 및 설명 가능성 분석을 수행한 다음 결과를 출력합니다.
자세한 정보는 처리 작업의 SageMaker 명확화 작동 방식을 참조하십시오.
데이터 형식을 지정하는 데 사용하는 매개변수는 처리 흐름 상에서 데이터가 사용되는 위치에 따라 다음과 같이 달라지게 됩니다.
-
입력 데이터셋의 경우
dataset_type
파라미터를 사용하여 형식 또는 유형을 지정합니다. MIME -
엔드포인트에 대한 요청인 경우,
content_type
매개변수를 사용하여 해당 형식을 지정합니다. -
엔드포인트에서의 응답인 경우,
accept_type
매개변수를 사용하여 해당 형식을 지정합니다.
입력 데이터 세트, 요청, 그리고 엔드포인트와 주고 받는 응답의 형식은 반드시 동일하지 않아도 됩니다. 예를 들어 다음 조건에 CSV 따라 요청 페이로드 및 JSON Lines 응답 페이로드와 함께 Parquet 데이터세트를 사용할 수 있습니다.
-
분석이 올바르게 구성되어 있음
-
모델이 해당 요청 및 응답 형식을 지원함
참고
content_type
제공되거나 accept_type
제공되지 않은 경우, Clarify 컨테이너는 및 을 SageMaker 유추합니다. content_type
accept_type