Object Detection 요청 및 응답 형식 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Object Detection 요청 및 응답 형식

다음 페이지에서는 Amazon SageMaker AI 객체 감지 - MXNet 모델의 추론 요청 및 응답 형식을 설명합니다.

요청 형식

모델의 엔드포인트를 사용하여 교육된 모델을 쿼리합니다. 엔드포인트는 image/jpegimage/png 콘텐츠 유형의 .jpg 및 .png 이미지 형식을 사용합니다.

응답 형식

응답은 JSON 형식으로 인코딩된 이미지 내 모든 객체에 대한 신뢰도 점수 및 경계 상자 좌표가 포함된 클래스 인덱스입니다. 다음은 응답 .json 파일의 예입니다.

{"prediction":[ [4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244], [0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475], [4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169], [8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597], [3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453] ]}

이 .json 파일의 각 행에는 감지된 객체를 나타내는 배열이 포함되어 있습니다. 이러한 객체 배열은 각각 6개 숫자 목록으로 구성되어 있습니다. 첫 번째 숫자는 예측된 클래스 레이블이고, 두 번째 숫자는 감지를 위해 연결된 신뢰도 점수입니다. 마지막 숫자 4개는 경계 상자 좌표 [xmin, ymin, xmax, ymax]를 나타냅니다. 이러한 출력 경계 상자 모서리 인덱스는 전체 이미지 크기로 정규화됩니다. 이 인코딩은 입력 .json 형식에서 사용하는 인코딩과 다릅니다. 예를 들어, 감지 결과의 첫 번째 항목에서 0.3088374733924866은 전체 이미지 너비의 비율로 표시된 경계 상자의 왼쪽 좌표(왼쪽 위 모서리의 x 좌표), 0.07030484080314636은 전체 이미지 높이의 비율로 표시된 경계 상자의 상단 좌표(왼쪽 위 모서리의 y 좌표), 0.7110607028007507은 전체 이미지 너비의 비율로 표시된 경계 상자의 오른쪽 좌표(오른쪽 아래 모서리의 x 좌표) 그리고 0.9345266819000244는 전체 이미지 높이의 비율로 표시된 경계 상자의 하단 좌표(오른쪽 아래 모서리의 y 좌표)입니다.

신뢰할 수 없는 감지 결과를 피하기 위해 신뢰도 점수가 낮은 감지 결과는 제외하려고 할 수 있습니다. 객체 감지 샘플 노트북에서는 임곗값을 사용하여 신뢰도가 낮은 탐지를 제거하고 원본 이미지에 경계 상자를 표시하는 스크립트의 예제를 제공합니다.

배치 변환을 위해 응답은 JSON 형식입니다. 이 형식은 위에서 설명한 JSON 형식과 동일합니다. 각 이미지의 감지 결과는 JSON 파일로 표시됩니다. 예시:

{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}

훈련 및 추론에 대한 자세한 정보는 Object Detection 샘플 노트북 섹션을 참조하세요.

OUTPUT: JSON 응답 형식

accept: application/json;annotation=1

{ "image_size": [ { "width": 500, "height": 400, "depth": 3 } ], "annotations": [ { "class_id": 0, "score": 0.943, "left": 111, "top": 134, "width": 61, "height": 128 }, { "class_id": 0, "score": 0.0013, "left": 161, "top": 250, "width": 79, "height": 143 }, { "class_id": 1, "score": 0.0133, "left": 101, "top": 185, "width": 42, "height": 130 } ] }