텍스트 감지 - Amazon Rekognition

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

텍스트 감지

Amazon Rekognition은 이미지와 비디오에서 얼굴을 감지할 수 있습니다. 그런 다음 감지된 텍스트를 기계 판독 가능한 텍스트로 변환할 수 있습니다. 이미지에서 기계가 읽을 수 있는 텍스트 감지 기능을 사용하여 다음과 같은 솔루션을 구현할 수 있습니다.

  • 시각적 검색. 예를 들어 동일한 텍스트를 포함하는 이미지를 검색하고 표시합니다.

  • 콘텐츠 분석 정보. 예를 들어, 추출된 비디오 프레임에서 인식되는 텍스트에서 발생하는 주제에 대한 분석 정보를 제공합니다. 애플리케이션은 뉴스, 스포츠 경기 점수, 운동 선수 번호 및 캡션과 같은 관련 콘텐츠에서 인식된 텍스트를 검색할 수 있습니다.

  • 탐색. 예를 들어 레스토랑, 상점 또는 거리 표지의 이름을 인식하는 시각 장애인을 위한 음성 지원 모바일 앱을 개발합니다.

  • 공공 안전과 운송 지원. 예를 들어 교통 카메라 이미지에서 자동차 번호판 번호를 감지합니다.

  • 필터링. 예를 들어, 이미지에서 개인 식별 정보(PII)를 필터링합니다.

예를 들어 비디오에서 텍스트를 감지하는 다음과 같은 솔루션을 구현할 수 있습니다.

  • 비디오에서 뉴스 화면에 게스트 이름과 같은 특정 텍스트 키워드가 있는 클립 검색

  • 실수로 작성된 텍스트, 비속어 또는 스팸을 탐지하여 조직 표준을 준수하도록 콘텐츠 조절

  • 콘텐츠 국제화를 위해 텍스트를 다른 언어로 된 텍스트로 대체하는 등 추가 처리를 위해 비디오 타임라인에서 모든 텍스트 오버레이 찾기

  • 다른 그래픽을 적절하게 정렬할 수 있도록 텍스트 위치 찾기

JPEG 또는 PNG 형식의 이미지에서 텍스트를 감지하려면 작업을 사용합니다. DetectText 비디오에서 텍스트를 비동기적으로 감지하려면 및 연산을 사용합니다. StartTextDetectionGetTextDetection 이미지 및 비디오 텍스트 감지 작업은 고도의 스타일이 적용된 글꼴을 포함한 대부분의 글꼴을 지원합니다. 텍스트를 감지한 후 Amazon Rekognition은 감지된 단어와 텍스트 줄의 표현을 만들고, 그 사이의 관계를 보여 주며, 비디오의 이미지 또는 프레임에서 텍스트가 있는 위치를 알려줍니다.

DetectTextGetTextDetection 작업은 단어와 줄을 감지합니다. 단어는 공백으로 구분되지 않는 하나 이상의 스크립트 문자입니다. DetectText는 이미지에서 최대 100개의 단어를 감지할 수 있습니다. GetTextDetection 또한 비디오 프레임당 최대 100개의 단어를 감지할 수 있습니다.

단어는 공백으로 구분되지 않은 하나 이상의 문자입니다. Amazon Rekognition은 영어, 아랍어, 러시아어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 스페인어로 된 단어를 감지하도록 설계되었습니다.

은 동등하게 간격을 둔 단어로 구성된 문자열입니다. 한 줄이 반드시 완전한 문장은 아닙니다(마침표가 줄의 끝을 나타내지 않습니다). 예를 들어, Amazon Rekognition은 운전 면허증 번호를 한 줄로 감지합니다. 줄은 그 뒤에 정렬된 텍스트가 없거나 단어 조합의 길이에 비해 단어 사이에 큰 간격이 있을 때 끝납니다. 단어 사이의 간격에 따라 Amazon Rekognition은 같은 방향으로 정렬된 텍스트에서 줄 여러 개를 감지할 수 있습니다. 문장이 여러 줄에 걸쳐 있는 경우 작업에서 여러 줄을 반환합니다.

다음 이미지를 봐 주세요.

웃는 얼굴과 테두리 상자와 추출된 텍스트가 있는 “오늘은 월요일이지만 계속 웃으세요”라는 글자가 적힌 커피 머그.

파란색 상자는 DetectText 작업이 반환하는 텍스트의 위치와 감지된 텍스트에 대한 정보를 나타냅니다. 이 예시에서 Amazon Rekognition은 "IT’S", "MONDAY", "but", "keep", "Smiling"을 단어로 감지합니다. Amazon Rekognition은 "IT’S", "MONDAY", "but keep", "Smiling"을 줄로 감지합니다. 텍스트가 감지되려면 텍스트가 가로 축의 +/- 90도 방향 내에 있어야 합니다.

예시는 이미지에서 텍스트 감지단원을 참조하세요.