비동기 작업을 사용한 문서 처리 - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

비동기 작업을 사용한 문서 처리

Amazon Textract Textract는 PDF 또는 TIFF 형식의 다중 페이지 문서의 텍스트를 감지하고 분석할 수 있습니다. 여기에는 송장 및 영수증이 포함됩니다. 다중 페이지 문서 처리는 비동기식 작업입니다. 문서의 비동기 처리는 대용량 다중 페이지 문서를 처리하는 데 유용합니다. 예를 들어 1,000페이지가 넘는 PDF 파일을 처리하는 데 시간이 걸립니다. PDF 파일을 비동기적으로 처리하면 응용 프로그램이 프로세스가 완료될 때까지 기다리는 동안 다른 작업을 완료할 수 있습니다.

이 단원에서는 Amazon Textract Textract를 사용하여 여러 페이지 또는 단일 페이지 문서의 텍스트를 비동기적으로 감지하고 분석하는 방법에 대해 설명합니다. 다중 페이지 문서는 PDF 또는 TIFF 형식이어야 합니다. 비동기 작업으로 처리된 단일 페이지 문서는 JPEG, PNG, TIFF 또는 PDF 형식일 수 있습니다.

Amazon Textract 비동기식 작업은 다음과 같은 용도로 사용할 수 있습니다.

  • 텍스트 감지 — 여러 페이지로 된 문서에서 줄과 단어를 감지할 수 있습니다. 비동기 작업은 다음과 같습니다.StartDocumentTextDetectionGetDocumentTextDetection. 자세한 정보는 텍스트 감지을 참조하십시오.

  • 텍스트 분석 — 여러 페이지로 된 문서에서 검색된 텍스트 간의 관계를 식별할 수 있습니다. 비동기 작업은 다음과 같습니다.StartDocumentAnalysisGetDocumentAnalysis. 자세한 정보는 문서 분석을 참조하십시오.

  • 비용 분석 — 여러 페이지 송장 및 영수증에 대한 데이터 관계를 식별할 수 있습니다. Amazon Textract Textract는 여러 페이지로 된 문서의 각 송장 또는 영수증 페이지를 개별 영수증 또는 송장으로 취급합니다. 여러 페이지 문서의 한 페이지에서 다른 페이지로의 컨텍스트를 유지하지 않습니다. 비동기 작업은 다음과 같습니다.StartExpenseAnalysisGetExpenseAnalysis. 자세한 정보는 송장 및 수금 분석을 참조하십시오.