데이터 형식 호환성 안내서 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 형식 호환성 안내서

이 가이드에서는 Clarify 처리 작업과 SageMaker 호환되는 데이터 형식 유형에 대해 설명합니다. 지원되는 데이터 형식 유형에는 파일 확장명, 데이터 구조, 표 형식, 이미지, 시계열 데이터셋에 대한 특정 요구 사항 또는 제한 사항이 포함됩니다. 이 안내서에서는 데이터 세트가 이러한 요구 사항을 준수하는지 확인하는 방법도 보여줍니다.

상위 수준에서 Clarify 프로세싱 작업은 입력-프로세스-출력 모델을 따라 편향 지표와 특징 속성을 계산합니다. SageMaker 세부 정보는 다음 예시를 참조하세요.

Clarify 처리 작업에 대한 입력은 다음과 같이 SageMaker 구성됩니다.

  • 분석할 데이터 세트

  • 해당 분석 구성 분석 구성 방법에 대한 자세한 내용은 을 참조하십시오분석 구성.

처리 단계에서 SageMaker Clarify는 편향 지표와 기능 속성을 계산합니다. SageMaker Clarify 프로세싱 작업은 백엔드에서 다음 단계를 완료합니다.

  • SageMaker Clarify 프로세싱 작업은 분석 구성을 파싱하고 데이터세트를 로드합니다.

  • 작업이 훈련 후 편향 지표와 특징 속성을 계산할 수 있으려면 해당 모델이 수행한 예측이 필요합니다. SageMaker Clarify 프로세싱 작업은 데이터를 직렬화하여 실시간 추론 엔드포인트에 배포된 모델에 요청으로 전송합니다. SageMaker 그런 다음 Clarify SageMaker 프로세싱 작업은 응답에서 예측을 추출합니다.

  • SageMaker Clarify 처리 작업은 편향 및 설명 가능성 분석을 수행한 다음 결과를 출력합니다.

자세한 정보는 처리 작업의 SageMaker 명확화 작동 방식을 참조하십시오.

데이터 형식을 지정하는 데 사용하는 매개변수는 처리 흐름 상에서 데이터가 사용되는 위치에 따라 다음과 같이 달라지게 됩니다.

  • 입력 데이터셋의 경우 dataset_type 파라미터를 사용하여 형식 또는 유형을 지정합니다. MIME

  • 엔드포인트에 대한 요청인 경우, content_type매개변수를 사용하여 해당 형식을 지정합니다.

  • 엔드포인트에서의 응답인 경우, accept_type매개변수를 사용하여 해당 형식을 지정합니다.

입력 데이터 세트, 요청, 그리고 엔드포인트와 주고 받는 응답의 형식은 반드시 동일하지 않아도 됩니다. 예를 들어 다음 조건에 CSV 따라 요청 페이로드 및 JSON Lines 응답 페이로드와 함께 Parquet 데이터세트를 사용할 수 있습니다.

  • 분석이 올바르게 구성되어 있음

  • 모델이 해당 요청 및 응답 형식을 지원함

참고

content_type제공되거나 accept_type 제공되지 않은 경우, Clarify 컨테이너는 및 을 SageMaker 유추합니다. content_type accept_type