기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
주석 통합 함수 생성
자체 주석 통합 함수를 사용하여 레이블이 지정된 객체의 최종 레이블을 결정하도록 선택할 수 있습니다. 함수를 생성하는 데는 여러 가지 방법이 있으며 통합할 주석의 특성에 따라 접근 방식이 달라집니다. 대게, 통합 기능은 작업자의 주석을 살펴보고, 주석 간의 유사성을 측정하고, 확률론적 판단에 따라 가장 가능성이 높은 라벨을 결정합니다.
다른 알고리즘을 사용하여 주석 통합 함수를 생성하려면 작업 출력을 지시하는 Amazon S3 버킷의
폴더에서 작업자 응답을 찾을 수 있습니다.[project-name]
/annotations/worker-response
유사성 평가
레이블 간 유사성을 평가하기 위해 다음 전략 중 하나를 사용하거나 데이터 레이블 지정 요구 사항을 충족하는 전략을 사용할 수 있습니다.
-
멀티클래스 분류 등과 같은 상호 배타적인 이산적 범주로 구성된 레이블 공간의 경우 유사성 평가는 간단할 수 있습니다. 이산적 레이블이 일치할 수도 있고 그렇지 않을 수도 있습니다.
-
경계 상자 주석 등과 같이 이산 값이 없는 레이블 공간의 경우에는 보다 광범위한 유사성 척도를 찾습니다. 경계 상자의 경우 이러한 척도는 자카드 지수(Jaccard index)입니다. 이 지수는 상자 두 개의 교집합과 상자의 합집합 비를 측정해 유사성을 평가합니다. 예를 들어 세 개의 주석이 있는 경우 어느 주석이 동일한 객체를 표현하고 통합되어야 하는지 결정하는 함수가 있을 수 있습니다.
가능성이 가장 큰 레이블 평가
이전 섹션에서 자세하게 설명한 전략 중 하나를 염두에 두고, 통합된 레이블이 어떤 모습일지 약간의 확률론적 판단을 합니다. 상호 배타적인 이산적 범주의 경우 이는 간단할 수 있습니다. 이렇게 하기 위한 가장 일반적인 방법 중 하나는 주석 간 다수결 투표의 결과를 사용하는 것입니다. 이 방법은 주석에 동등하게 가중치를 부여합니다.
일부 접근 방법은 여러 주석자의 정확도를 추정하고 정확성의 확률에 비례하여 주석을 가중하려고 시도합니다. 한 가지 예가 멀티클래스 주석에 대한 기본 Ground Truth 통합 기능에 사용되는 기댓값 최대화(Expectation Maximization) 방법입니다.
주석 통합 함수 생성에 대한 자세한 정보는 를 사용하여 사용자 지정 레이블 지정 워크플로에서 데이터 처리 AWS Lambda 섹션을 참조하세요.