기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 소스 커넥터 생성
에 대한 데이터 소스 커넥터를 만들 수 있습니다. Amazon Kendra 문서에 연결하고 문서를 인덱싱할 수 있습니다. Amazon Kendra Microsoft SharePoint, Google Drive 및 기타 여러 공급자에 연결할 수 있습니다. 데이터 소스 커넥터를 만들면 다음을 제공합니다. Amazon Kendra 소스 리포지토리에 연결하는 데 필요한 구성 정보. 인덱스에 직접 문서를 추가하는 것과 달리, 데이터 소스를 정기적으로 스캔하여 인덱스를 업데이트할 수 있습니다.
예를 들어, 세금 문서 저장소가 저장되어 있다고 가정해 보겠습니다. Amazon S3 버킷. 수시로, 기존 문서가 변경되고 새 문서가 리포지토리에 추가됩니다. 리포지토리를 추가하는 경우 Amazon Kendra 데이터 원본의 경우 데이터 원본과 인덱스 간에 주기적인 동기화를 설정하여 색인을 최신 상태로 유지할 수 있습니다.
콘솔이나 를 사용하여 색인을 수동으로 업데이트하도록 선택할 수 있습니다. StartDataSourceSyncJobAPI 그렇지 않으면, 인덱스를 업데이트하고 데이터 소스와 동기화하도록 일정을 설정합니다.
인덱스에는 데이터 소스가 둘 이상 있을 수 있습니다. 각 데이터 소스에는 고유한 업데이트 일정이 있을 수 있습니다. 예를 들어 작업 문서의 인덱스를 매일 또는 매시간 업데이트하고 아카이브가 변경될 때마다 보관된 문서를 수동으로 업데이트할 수 있습니다.
문서 통합 프로세스 중에 문서 메타데이터나 속성 및 콘텐츠를 변경하려면 을 참조하십시오. Amazon Kendra 사용자 지정 문서 보강.
참고
각 문서 ID는 색인별로 고유해야 합니다. 고유한 IDs 데이터로 문서를 인덱싱하는 데이터 소스를 만든 다음 를 사용하여 동일한 문서를 BatchPutDocument
API 인덱싱할 수 없으며, 그 반대의 경우도 마찬가지입니다. 데이터 소스를 삭제한 다음 를 사용하여 동일한 문서를 BatchPutDocument
API 인덱싱할 수 있으며 그 반대의 경우도 마찬가지입니다. BatchPutDocument
및 BatchDeleteDocument
APIs 를 함께 사용하여 Amazon Kendra 동일한 문서 세트에 대한 데이터 소스 커넥터를 사용하면 데이터가 일치하지 않을 수 있습니다. 대신 다음을 사용하는 것이 좋습니다. Amazon Kendra 사용자 지정 데이터 소스 커넥터.
참고
색인에 추가된 파일은 UTF -8로 인코딩된 바이트 스트림에 있어야 합니다. 문서에 대한 자세한 내용은 Amazon Kendra문서를 참조하십시오.
업데이트 일정 설정
콘솔에서 정기적으로 업데이트하거나, 데이터 소스를 만들거나 업데이트할 때 Schedule
파라미터를 사용하여 데이터 소스를 구성합니다. 파라미터의 내용은 cron
형식 일정 문자열이나 필요에 따라 인덱스가 업데이트됨을 나타내는 빈 문자열을 포함하는 문자열입니다. cron 표현식의 형식에 대해서는 규칙의 스케줄 표현식을 참조하십시오. Amazon CloudWatch Events 사용 설명서. Amazon Kendra cron 표현식만 지원합니다. rate 표현식은 지원하지 않습니다.
언어 설정
지원되는 언어로 데이터 소스의 모든 문서를 인덱싱할 수 있습니다. CreateDataSource호출할 때 데이터 소스에 있는 모든 문서의 언어 코드를 지정합니다. 메타데이터 필드에 지정된 언어 코드가 없는 문서의 경우, 데이터 소스 수준에서 모든 문서에 지정된 언어 코드를 사용하여 문서가 인덱싱됩니다. 언어를 지정하지 않는 경우 Amazon Kendra 기본적으로 데이터 원본의 문서를 영어로 인덱싱합니다. 코드를 포함하여 지원되는 언어에 대한 자세한 내용은 영어 이외의 언어로 문서 추가를 참조하세요.
콘솔을 사용하여 지원되는 언어로 데이터 소스의 모든 문서를 인덱싱하세요. 데이터 소스로 이동하여 데이터 소스를 편집하거나, 데이터 소스 추가를 통해 새 데이터 소스를 추가합니다. 데이터 소스 세부 정보 지정 페이지의 언어 드롭다운에서 언어를 선택합니다. 업데이트를 선택하거나 구성 정보를 계속 입력하여 데이터 소스에 연결합니다.