기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
텍스트 감지
Amazon Rekognition은 이미지와 비디오에서 얼굴을 감지할 수 있습니다. 그런 다음 감지된 텍스트를 기계 판독 가능한 텍스트로 변환할 수 있습니다. 이미지에서 기계가 읽을 수 있는 텍스트 감지 기능을 사용하여 다음과 같은 솔루션을 구현할 수 있습니다.
-
시각적 검색. 예를 들어 동일한 텍스트를 포함하는 이미지를 검색하고 표시합니다.
-
콘텐츠 분석 정보. 예를 들어, 추출된 비디오 프레임에서 인식되는 텍스트에서 발생하는 주제에 대한 분석 정보를 제공합니다. 애플리케이션은 뉴스, 스포츠 경기 점수, 운동 선수 번호 및 캡션과 같은 관련 콘텐츠에서 인식된 텍스트를 검색할 수 있습니다.
-
탐색. 예를 들어 레스토랑, 상점 또는 거리 표지의 이름을 인식하는 시각 장애인을 위한 음성 지원 모바일 앱을 개발합니다.
-
공공 안전과 운송 지원. 예를 들어 교통 카메라 이미지에서 자동차 번호판 번호를 감지합니다.
-
필터링. 예를 들어, 이미지에서 개인 식별 정보(PII)를 필터링합니다.
예를 들어 비디오에서 텍스트를 감지하는 다음과 같은 솔루션을 구현할 수 있습니다.
-
비디오에서 뉴스 화면에 게스트 이름과 같은 특정 텍스트 키워드가 있는 클립 검색
-
실수로 작성된 텍스트, 비속어 또는 스팸을 탐지하여 조직 표준을 준수하도록 콘텐츠 조절
-
콘텐츠 국제화를 위해 텍스트를 다른 언어로 된 텍스트로 대체하는 등 추가 처리를 위해 비디오 타임라인에서 모든 텍스트 오버레이 찾기
-
다른 그래픽을 적절하게 정렬할 수 있도록 텍스트 위치 찾기
JPEG 또는 PNG 형식의 이미지에서 텍스트를 감지하려면 작업을 사용합니다. DetectText 비디오에서 텍스트를 비동기적으로 감지하려면 및 연산을 사용합니다. StartTextDetectionGetTextDetection 이미지 및 비디오 텍스트 감지 작업은 고도의 스타일이 적용된 글꼴을 포함한 대부분의 글꼴을 지원합니다. 텍스트를 감지한 후 Amazon Rekognition은 감지된 단어와 텍스트 줄의 표현을 만들고, 그 사이의 관계를 보여 주며, 비디오의 이미지 또는 프레임에서 텍스트가 있는 위치를 알려줍니다.
DetectText
및 GetTextDetection
작업은 단어와 줄을 감지합니다. 단어는 공백으로 구분되지 않는 하나 이상의 스크립트 문자입니다. DetectText
는 이미지에서 최대 100개의 단어를 감지할 수 있습니다. GetTextDetection
또한 비디오 프레임당 최대 100개의 단어를 감지할 수 있습니다.
단어는 공백으로 구분되지 않은 하나 이상의 문자입니다. Amazon Rekognition은 영어, 아랍어, 러시아어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 스페인어로 된 단어를 감지하도록 설계되었습니다.
줄은 동등하게 간격을 둔 단어로 구성된 문자열입니다. 한 줄이 반드시 완전한 문장은 아닙니다(마침표가 줄의 끝을 나타내지 않습니다). 예를 들어, Amazon Rekognition은 운전 면허증 번호를 한 줄로 감지합니다. 줄은 그 뒤에 정렬된 텍스트가 없거나 단어 조합의 길이에 비해 단어 사이에 큰 간격이 있을 때 끝납니다. 단어 사이의 간격에 따라 Amazon Rekognition은 같은 방향으로 정렬된 텍스트에서 줄 여러 개를 감지할 수 있습니다. 문장이 여러 줄에 걸쳐 있는 경우 작업에서 여러 줄을 반환합니다.
다음 이미지를 봐 주세요.
파란색 상자는 DetectText
작업이 반환하는 텍스트의 위치와 감지된 텍스트에 대한 정보를 나타냅니다. 이 예시에서 Amazon Rekognition은 "IT’S", "MONDAY", "but", "keep", "Smiling"을 단어로 감지합니다. Amazon Rekognition은 "IT’S", "MONDAY", "but keep", "Smiling"을 줄로 감지합니다. 텍스트가 감지되려면 텍스트가 가로 축의 +/- 90도 방향 내에 있어야 합니다.
예시는 이미지에서 텍스트 감지단원을 참조하세요.